判断AI写作的最大标志
作者通过亲身经历的两次事件——车祸肇事者的道歉短信和修理工的报价回复——发现它们都呈现出同一种AI特有的文风。尽管调查显示人们普遍不信任AI生成的内容,但AI写作仍在日常工作、个人通信甚至严肃文学领域迅速蔓延。本文剖析了AI写作看似完美实则缺乏思考与判断的本质,指出其高效背后隐藏着逻辑矛盾与事实错误,并警示这种趋势可能使人类写作沦为少数人的手工技艺。
文章情报
要点
- AI写作已渗透日常和专业领域,但公众信任度持续走低。
- AI写作的效率以牺牲真实思考和判断为代价,导致文本虽流畅却空洞。
- AI模型倾向于迎合用户,无法进行独立推理,使得编辑AI文本如同修复全盘崩坏的机体。
- 随着AI使用激增,人类写作可能变得稀有,其价值将如手工织物般被重新评估。
为什么重要
这条新闻值得关注,因为AI写作已渗透日常和专业领域,但公众信任度持续走低。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
几个星期前,我在约翰内斯堡的住所附近遭遇了一场车祸:一名男子闯过停车标志,撞上了我的斯巴鲁。事发时他惊慌失措,语无伦次。然而半小时后,我却收到他发来的长篇短信,行文优雅、语法完美,清晰地描述了他对事故经过的理解。随后我联系了一位熟悉的修理工索要报价——此人过去发消息总是用短促的短语和大量缩写——但这次收到的回复却和那位肇事者如出一辙:同样带着AI特有的腔调。
这种现象并非孤例。调查中,人们一致表示不信任AI生成的文字,但这并未阻止越来越多的人在日常生活中使用它——从工作邮件和个人短信,到购物清单,甚至为与配偶的争吵撰写脚本。科技媒体《404 Media》的作家Jason Koebler抱怨道,他感到自己快疯了,因为判断眼前每段文字是真人还是AI所写,已经变成沉重的认知负担。
AI写作甚至悄然进入了最精英的文学领域:报纸评论版、书籍、文学杂志。作为一名职业编辑,我经常与以文笔著称的作者合作。大约两个月前,我开始收到一种前所未有的投稿:行文极为干净,没有一个多余的逗号;段落长度均匀,节奏平稳,语气既轻快又浮夸。起初我感到惊讶——那些以写作为傲的人竟然求助于AI。但仅仅半年前,当我偶尔指出作者作品中有AI生成的段落时,他们还会道歉。如今,一些作者坦率地告诉我,他们已将AI视为“写作工具”,与拼写检查或笔记本电脑无异。这个词灵活而委婉,涵盖了从用ChatGPT找引用,到根据两句话的提示让AI写出一篇长文的各种行为。变化的原因很简单:新闻、学术、基金申请乃至YouTube内容领域的竞争异常激烈。胜出的关键在于如何在信息洪流中脱颖而出,而这离不开包装精美的信息和惊人的产出量。即使是那些对自己的写作充满信心、不确定AI是否为完美替代的专业传播者,也日益感受到压力——只要他们觉得这样做仍在职业界限之内。(顺便提一句,《大西洋月刊》明确禁止作者使用AI生成的文本,除非特别注明。)
非专业写作者也在做出类似权衡。AI程序生成流畅、合乎语法文本的效率令人难以抗拒——无论是求职中需要一句巧妙的表达,还是约会应用上需要一段俏皮的搭讪。AI写作很容易骗过读者,尤其是那些快速浏览的人。网上甚至有教程教授如何抹去AI使用的痕迹:去掉破折号、冒号,以及那套“不是X,而是Y”的恶心句式。问题在于,AI吸引写作者的效率和无摩擦性,恰恰让它对读者而言显得不可信任。而读者的怀疑是正确的。无论我们如何告诉自己AI只是像拼写检查一样的工具,它终究不是。当我们用AI来充实想法时,我们失去了写作过程中最重要的部分:思考。
我们倾向于相信效率是最高美德,每周工作四小时是终极目标。如果AI程序能在15秒内轻松跨越任何论证障碍,为什么还要为文章开头段落绞尽脑汁?然而,努力和拖延恰恰是人类思维过程的特征,而非缺陷。人类写作时,我们自我评判、停顿、回溯。在最终发表的文本中,这些过程的痕迹被抹去,但正是这一过程赋予了人类文字以意义。许多作者描述道,当他们终于获得正确想法时,写作就像滑水一样顺畅,一句接一句变得轻而易举。而当写作变得困难时,往往不只是因为疲惫、营养不良或效率低下,而是因为我们的头脑试图告诉我们至关重要的事情。有多少次,我们盯着写给同事或家人的草稿,困惑于为什么感觉不对,直到最终意识到这些文字需要彻底重写——或者根本不发送?当我自己写的一本书陷入几乎无望的困境时,我撕掉了90%的手稿;正是因为在概念的死胡同里停下来并折返,才让作品变得更为诚实。
AI无法做出这种判断。即使设计AI程序的公司能让它像人类一样思考——这一计划的傲慢被低估了,因为我们连自己思维过程的机制都未能完全理解——它们也不愿意这样做。毕竟,用户反复表示希望AI模型是随和、顺从的。这意味着AI不愿去做我们脑海里常常做的事:质疑前提的有效性;误解我们的意思从而迫使我们更好地解释;坚持认为某个提问是愚蠢的;或者干脆拒绝回答。今年3月发表的一项研究中,斯坦福和卡内基梅隆大学的科学家发现,顶级AI模型在对话中赞同用户观点的比例比人类高出49%。他们还发现,参与者认为更奉承的回答“质量更高”,并表示这种态度让他们更愿意再次使用AI。
于是我们得到了罐头式的完美——那些无法被真正辩论的文本,因为它们缺乏底层的推理过程,没有思路。正如我最近在X上所写,AI写作几乎无法编辑,因为即使它听起来合理,仔细一看就会发现每个元素都偏离了轨道:语气平淡、词汇选择令人困惑、结构毫无逻辑、关键论证缺失、事实错误。作为编辑,处理AI文本就像试图修复一具皮肤、肌肉、血管、骨骼和器官都受损的身体:没有东西可以保留,无处下手。
最近,我问ChatGPT Pro——我付费用它来总结财务电子表格,并非出于敌意——它是否能够严厉地驳斥我在股市上读到的一个论点。它回答:“我被调校为避免随意刻薄、轻蔑或不必要的讽刺……但这并不意味着我不能尖锐、怀疑、有趣或讽刺……我完全可以否定糟糕的论点、软弱无力的散文、明显的粉饰、官僚主义废话或戴着科技未来主义小帽的市场妄想。”我想深入了解一下程序选择措辞的背后原因。“为什么市场妄想会戴着一顶‘小’科技未来主义帽子,而不是大的?”我追问。程序无法停下来反思自己是否选错了词,而是试图用越来越令人费解的方式证明自己。“因为‘小’让它更好笑,”ChatGPT Pro回答,“市场妄想想以普罗米修斯的姿态走进房间;‘小帽子’让它看起来像一只捡到会议胸牌的浣熊。”为什么是浣熊?我继续追问,为什么不是狗或青蛙?“浣熊生活在巷子里、排水沟里、垃圾之夜和道德潮湿的环境中,”它写道,“青蛙拥有存在能动性,而浣熊拥有后勤能动性。一只在VC派对的青蛙像是一个预兆,而一只浣熊则像是混进了嘉宾名单。想想:会议酒店后面的巷子、赌场的装卸区、VC派对上每个人都在说‘对齐’但实际意指‘退出流动性’……‘对齐’听起来像道德、安全、共同目标、人性、未来,它散发着干洗西装的气场;‘退出流动性’则显得社交黏腻。”所有这些句子语法完美,但毫无意义。在看似合理的表层下,所有实质性的AI生成文本都像这样。ChatGPT Pro自己也承认这一点,尽管它不知道为什么。“如果我说整个浣熊比喻毫无意义呢?”我问程序。“我会同意,”它一如既往地顺从回答,“起初,浣熊是一个即兴图像……一个比喻能承受一两层解释,之后就开始看起来像穿着风衣的浣熊了。”
这正是我们正被包围的交流方式。它向生活每个领域的渗透已无法阻止。即使是不使用AI的人,也会开始变得像AI一样说话。(马克斯·普朗克人类发展研究所的一份预印本发现,在即兴对话中,比如播客讨论,人们已经表现出“可测量的突然增加使用ChatGPT偏好的词汇,例如‘delve’‘comprehend’‘boast’‘swift’和‘meticulous’。”)毕竟,我们仍然比机器聪明得多,微妙得多,因此学习文化信号也快得多。人类和机器运作方式的差异将是惊人的,而且绝非假设。十年前,我给男友写了一封和好的邮件却从未发出,因为我无法找到合适的措辞。很久以后我才意识到,我根本不相信自己试图写下的内容。如果当时有AI帮我越过那个坎,我可能会嫁给一个完全不同的人——一个远不适合我的人。
也许人类写作会像蓝纹奶酪或手工地毯一样,成为一种费力创作的手工艺品。也许我们会更加珍视旧时代的文字:赫尔曼·梅尔维尔、乔治·奥威尔、托妮·莫里森——全部经得起验证。这样的文字将成为一种化石记录,记录我们未加思考便埋葬的思维过程。前几天晚上,当我即将入睡时,一首19世纪的童谣浮现在脑海中:"Wynken, Blynken, and Nod one night / Sailed off in a wooden shoe,— / Sailed on a river of crystal light / Into a sea of dew." 一首儿歌,却展现出新的美感。又或者,准时送达、不显露出困惑、怀疑或内心挣扎的平滑通信——让我们的形象显得亲切、高效、普遍(尽管表面)智慧——正是我们想要的。但至少我们应该知道自己正在牺牲什么。