提示词并非作品本身:如何描述AI的贡献
本文探讨在生成式AI时代,我们需要更精确的语言来描述人类的贡献。作者指出“AI生成”这一标签过于模糊,无法区分不同程度的参与,如构思、指导、修改、验证和认可。文章提出建立日常的“贡献语法”,以便在对话中清晰表达实际参与程度。
在生成式AI时代,我们需要更好的词汇来描述贡献。办公室里、群聊中、评论区里,总有这样一个场景:有人分享了一篇文字、一个设计、一段代码,另一个人半开玩笑半带敌意地问:“这是AI写的吗?”这个问题听起来是在问作者身份,但实际上是在问贡献:你是原创、指导、修改、验证,还是仅仅是放手?这五个截然不同的答案,而二元选择——“是”与“否”——缺乏必要的表达力。
关于作者身份和所有权的宏大新理论只会产生混乱、难懂的学术论文和纸上谈兵。一个更实用的项目更小、更社交:我们需要日常语言——可以称之为“贡献语法”——来描述一件作品代表了怎样的参与。当前语言的失败首先是表达上的失败,而非道德上的:早在有人撒谎之前,诚实的人就会无意中误导他人,或保持沉默,因为他们缺乏描述自己贡献的词汇。法律、出版和学术界已经在忙着构建自己的词汇,但我们其他人只需要能够回答那个人在眯着眼睛看文档并想知道它是如何被制作出来时真正想问的问题。
“AI生成的”是个糟糕的标签。它既涵盖了那些输入“给我写2000字关于供应链韧性”然后不读就直接粘贴到LinkedIn上的人,也涵盖了那些详细描述架构、让模型起草代码、然后检查每个函数、拒绝两种方法、发现竞争条件并重写错误处理的开发者。它涵盖了一位花三个小时与模型对话、争论、纠正、放弃的作家,其最终文本中没有一个句子来自初稿。它也涵盖了生成五十张图像、挑选一张并用照片合成的艺术家。这个标签缺乏解释力,无法阐明实际发生的事情,因为它既涵盖“帮我思考”也涵盖“替我做思考”。
这些过程截然不同:投入的努力不同,认真程度不同,所有权不同,智力贡献也不同——根本上说,行动的自主性也不同。一个将它们等同对待的标签毫无用处,更糟糕的是,它通常带有道德指控:“AI生成的”现在成了一个指责,因此人们要么隐藏自己的过程,要么过度坦白,而这都不能告诉我们关于作品的有用信息。
这并不是假设。研究科学作者身份的研究人员已经开始称之为“透明度悖论”。一位用模型润色了几个句子的作者面临着与用提示生成整个章节的作者相同的披露污名,因此作者要么避免使用有用的工具,要么保持沉默。证据表明,不披露主要源于不确定性,而非完全欺骗。在今天的词汇中,即使是诚实的披露也既是揭示也是遮蔽。
打字从来不是好指标。我们之所以陷入困境,部分原因在于我们默默地将逐字逐句的生产视为贡献的黄金标准:真正的作者是手指打出句子的人。但这个标准在AI之前就从未连贯过。编辑可以彻底改变手稿,使得出版的书可以说是合作成果,但封面上只有一个名字。旧大师们会让学徒完成繁琐的细节。没人指望政治家真的自己写回忆录。
所以我们早就知道贡献有多种形式:构思一个想法、指导其执行、选择选项、完善、验证、批准。但我们从未迫切需要日常语言来区分它们,因为每种形式都涉及努力——而努力可以代表一切。没有努力的生成打破了这种代理关系。现在要描述的是自主性:不是谁的手指创作了句子,而是谁决定了句子应该是什么。
稀缺的贡献是判断力。AI生成图像中的六指手之所以尴尬,不是因为它是由机器制作的——我们都知道是机器制作的。尴尬是因为没人费心去检查。失败不是生成失败,而是判断力和品味的失败,而判断力和品味正是人类应该提供的贡献。
如果机器可以按需生成流畅的文本、合理的代码和精美的图像,那么流畅、合理和精美就不再是人类努力的证据。“ChatGPT写的”这个问题真正在摸索的是:这代表了你的多少判断、专业知识和品味?这是你真正想要的意思吗?批准AI起草代码的开发者(希望如此)在声称:我读了这些,我理解,我会在它凌晨三点出问题时负责。这就是为什么“AI写的”和“AI写的但我验证过”永远不应该是同一个句子。后者包含了全部稀缺资源。
作品可能存在于迭代中。针对AI辅助写作者有一个常见的诘难,Clayton Ramsey的“我宁愿看提示”是其当前形式。论点在于LLM的输出没有添加任何提示中已经包含的东西,所以只需发送提示。想出提示本身就是工作,之后的一切都是赘余:在ChatGPT窗口中按回车没有贡献。对于他描述的懒惰案例——一个提示,一次粘贴——确实如此。他的反对意见很好地针对了“我做了这个”,如果它意味着“我请求了这个,这就是我得到的”。但它从未触及整个LLM增强生成类别,其中的贡献在于“我雕刻了这”。
提示可以只是一个起点。当随后付出努力时,努力存在于后续的序列:反对、纠正、拒绝、完善、接受。一个与模型进行了十轮交锋的人留下了一系列决策,每个决策都对某些文本版本说了不,对其他说了是。把第一个提示发送给你几乎不会告诉你关于最终产物的一切,就像发送给你作者的第一份大纲几乎不会告诉你关于已发表文章的一切。迭代不是围绕真正工作的开销,它往往是真正的工作,我们还没有一种有用的方式来描述这种工作。
认可并非无关紧要。还有一种容易忽视的贡献:仅仅签署同意。如果有人以自己名义发表文本并说“这代表我的观点”,但大部分句子由模型生成,那么称之为橡皮图章很诱人。但这并非无关紧要。并非每个人都有表达自己思想的词汇,当别人找到它们时,认出它们本身就是一种表达行为。此外,认可是有实际后果的:认可者以自己的信誉做赌注,对错误承担责任,并断言内容与他们的意图相符。人们准确认可机器起草的陈述的世界,与人们分享无人为之负责的文本的世界有本质区别。
认可显然不是作者身份本身:签名不会追溯性地产出作品。它也是最薄的贡献主张——你可以签署任何东西,无论你读没读,与“我检查了每一行”不同,它描述了过程,只有立场。仅凭它,从陌生人那里,它几乎不告诉我们任何事情。
但人们会撒谎。对以上一切显而易见的反对意见是:这些更细致的陈述都无法验证。“我检查了每一行”输入起来和伪造起来一样便宜。这是事实,但无关紧要。一项主张并不需要可验证才有用。“我浏览了”是不可验证但不可或缺的;“我读了合同”和“我快完成了”也是如此。我们当然会继续像以往那样通过声誉和后果来警醒谎言,即使现在我们失去了一个强大的努力信号。我们无法警醒的是诚实的人没有合适词汇——那些说“我写了这个”却感到像个骗子,或者“AI写了这个”却低估了一周工作的人。缺失词汇的问题优先,而且只有词汇能解决它。
走向贡献语法。日常问题现在感觉是可处理的,而在需要更精细描述的地方,语法已经出现。学术出版正在涌现四级披露框架和名为GAIDeT、AID的分类法。开源项目已经开始要求拉取请求声明代码是完全AI生成但人工审查、大部分AI生成、还是大部分人工编写,提交消息增加了“Assisted-By:”尾部。所有这些正式、机构化、有点笨拙——但都证明,在人们必须定期描述贡献的地方,他们为它构建了词汇。缺少的是会话层:用于Slack回复而非合规表格的词汇。
这些词汇很便宜。我们可以开始简单说出我们做了什么:我指导了这个。我与模型一起起草并重写了它。我检查了每一行。我从多次尝试中挑选了这个。我认可这个;我没写它。
这不是理论。只是区分——在作者身份、努力、判断和认可之间——我们可以在日常对话中使用彼此。二元制“人类制作” vs “AI生成”是这种语法的初稿,在压力下快速产出。而初稿应该被修改。
(文章末尾附有作者自己的贡献声明,说明文本的创作过程。)