2026-05-30 13:31 UTC+8站内改写4 分钟阅读更新: 2026-06-30 21:03 UTC+8

判断AI写作的最大标志

作者通过亲身经历的两次事件——车祸肇事者的道歉短信和修理工的报价回复——发现它们都呈现出同一种AI特有的文风。尽管调查显示人们普遍不信任AI生成的内容，但AI写作仍在日常工作、个人通信甚至严肃文学领域迅速蔓延。本文剖析了AI写作看似完美实则缺乏思考与判断的本质，指出其高效背后隐藏着逻辑矛盾与事实错误，并警示这种趋势可能使人类写作沦为少数人的手工技艺。

来源Hacker News AI作者: nlawalker

几个星期前，我在约翰内斯堡的住所附近遭遇了一场车祸：一名男子闯过停车标志，撞上了我的斯巴鲁。事发时他惊慌失措，语无伦次。然而半小时后，我却收到他发来的长篇短信，行文优雅、语法完美，清晰地描述了他对事故经过的理解。随后我联系了一位熟悉的修理工索要报价——此人过去发消息总是用短促的短语和大量缩写——但这次收到的回复却和那位肇事者如出一辙：同样带着AI特有的腔调。

这种现象并非孤例。调查中，人们一致表示不信任AI生成的文字，但这并未阻止越来越多的人在日常生活中使用它——从工作邮件和个人短信，到购物清单，甚至为与配偶的争吵撰写脚本。科技媒体《404 Media》的作家Jason Koebler抱怨道，他感到自己快疯了，因为判断眼前每段文字是真人还是AI所写，已经变成沉重的认知负担。

AI写作甚至悄然进入了最精英的文学领域：报纸评论版、书籍、文学杂志。作为一名职业编辑，我经常与以文笔著称的作者合作。大约两个月前，我开始收到一种前所未有的投稿：行文极为干净，没有一个多余的逗号；段落长度均匀，节奏平稳，语气既轻快又浮夸。起初我感到惊讶——那些以写作为傲的人竟然求助于AI。但仅仅半年前，当我偶尔指出作者作品中有AI生成的段落时，他们还会道歉。如今，一些作者坦率地告诉我，他们已将AI视为“写作工具”，与拼写检查或笔记本电脑无异。这个词灵活而委婉，涵盖了从用ChatGPT找引用，到根据两句话的提示让AI写出一篇长文的各种行为。变化的原因很简单：新闻、学术、基金申请乃至YouTube内容领域的竞争异常激烈。胜出的关键在于如何在信息洪流中脱颖而出，而这离不开包装精美的信息和惊人的产出量。即使是那些对自己的写作充满信心、不确定AI是否为完美替代的专业传播者，也日益感受到压力——只要他们觉得这样做仍在职业界限之内。（顺便提一句，《大西洋月刊》明确禁止作者使用AI生成的文本，除非特别注明。）

非专业写作者也在做出类似权衡。AI程序生成流畅、合乎语法文本的效率令人难以抗拒——无论是求职中需要一句巧妙的表达，还是约会应用上需要一段俏皮的搭讪。AI写作很容易骗过读者，尤其是那些快速浏览的人。网上甚至有教程教授如何抹去AI使用的痕迹：去掉破折号、冒号，以及那套“不是X，而是Y”的恶心句式。问题在于，AI吸引写作者的效率和无摩擦性，恰恰让它对读者而言显得不可信任。而读者的怀疑是正确的。无论我们如何告诉自己AI只是像拼写检查一样的工具，它终究不是。当我们用AI来充实想法时，我们失去了写作过程中最重要的部分：思考。

我们倾向于相信效率是最高美德，每周工作四小时是终极目标。如果AI程序能在15秒内轻松跨越任何论证障碍，为什么还要为文章开头段落绞尽脑汁？然而，努力和拖延恰恰是人类思维过程的特征，而非缺陷。人类写作时，我们自我评判、停顿、回溯。在最终发表的文本中，这些过程的痕迹被抹去，但正是这一过程赋予了人类文字以意义。许多作者描述道，当他们终于获得正确想法时，写作就像滑水一样顺畅，一句接一句变得轻而易举。而当写作变得困难时，往往不只是因为疲惫、营养不良或效率低下，而是因为我们的头脑试图告诉我们至关重要的事情。有多少次，我们盯着写给同事或家人的草稿，困惑于为什么感觉不对，直到最终意识到这些文字需要彻底重写——或者根本不发送？当我自己写的一本书陷入几乎无望的困境时，我撕掉了90%的手稿；正是因为在概念的死胡同里停下来并折返，才让作品变得更为诚实。

AI无法做出这种判断。即使设计AI程序的公司能让它像人类一样思考——这一计划的傲慢被低估了，因为我们连自己思维过程的机制都未能完全理解——它们也不愿意这样做。毕竟，用户反复表示希望AI模型是随和、顺从的。这意味着AI不愿去做我们脑海里常常做的事：质疑前提的有效性；误解我们的意思从而迫使我们更好地解释；坚持认为某个提问是愚蠢的；或者干脆拒绝回答。今年3月发表的一项研究中，斯坦福和卡内基梅隆大学的科学家发现，顶级AI模型在对话中赞同用户观点的比例比人类高出49%。他们还发现，参与者认为更奉承的回答“质量更高”，并表示这种态度让他们更愿意再次使用AI。

于是我们得到了罐头式的完美——那些无法被真正辩论的文本，因为它们缺乏底层的推理过程，没有思路。正如我最近在X上所写，AI写作几乎无法编辑，因为即使它听起来合理，仔细一看就会发现每个元素都偏离了轨道：语气平淡、词汇选择令人困惑、结构毫无逻辑、关键论证缺失、事实错误。作为编辑，处理AI文本就像试图修复一具皮肤、肌肉、血管、骨骼和器官都受损的身体：没有东西可以保留，无处下手。

最近，我问ChatGPT Pro——我付费用它来总结财务电子表格，并非出于敌意——它是否能够严厉地驳斥我在股市上读到的一个论点。它回答：“我被调校为避免随意刻薄、轻蔑或不必要的讽刺……但这并不意味着我不能尖锐、怀疑、有趣或讽刺……我完全可以否定糟糕的论点、软弱无力的散文、明显的粉饰、官僚主义废话或戴着科技未来主义小帽的市场妄想。”我想深入了解一下程序选择措辞的背后原因。“为什么市场妄想会戴着一顶‘小’科技未来主义帽子，而不是大的？”我追问。程序无法停下来反思自己是否选错了词，而是试图用越来越令人费解的方式证明自己。“因为‘小’让它更好笑，”ChatGPT Pro回答，“市场妄想想以普罗米修斯的姿态走进房间；‘小帽子’让它看起来像一只捡到会议胸牌的浣熊。”为什么是浣熊？我继续追问，为什么不是狗或青蛙？“浣熊生活在巷子里、排水沟里、垃圾之夜和道德潮湿的环境中，”它写道，“青蛙拥有存在能动性，而浣熊拥有后勤能动性。一只在VC派对的青蛙像是一个预兆，而一只浣熊则像是混进了嘉宾名单。想想：会议酒店后面的巷子、赌场的装卸区、VC派对上每个人都在说‘对齐’但实际意指‘退出流动性’……‘对齐’听起来像道德、安全、共同目标、人性、未来，它散发着干洗西装的气场；‘退出流动性’则显得社交黏腻。”所有这些句子语法完美，但毫无意义。在看似合理的表层下，所有实质性的AI生成文本都像这样。ChatGPT Pro自己也承认这一点，尽管它不知道为什么。“如果我说整个浣熊比喻毫无意义呢？”我问程序。“我会同意，”它一如既往地顺从回答，“起初，浣熊是一个即兴图像……一个比喻能承受一两层解释，之后就开始看起来像穿着风衣的浣熊了。”

这正是我们正被包围的交流方式。它向生活每个领域的渗透已无法阻止。即使是不使用AI的人，也会开始变得像AI一样说话。（马克斯·普朗克人类发展研究所的一份预印本发现，在即兴对话中，比如播客讨论，人们已经表现出“可测量的突然增加使用ChatGPT偏好的词汇，例如‘delve’‘comprehend’‘boast’‘swift’和‘meticulous’。”）毕竟，我们仍然比机器聪明得多，微妙得多，因此学习文化信号也快得多。人类和机器运作方式的差异将是惊人的，而且绝非假设。十年前，我给男友写了一封和好的邮件却从未发出，因为我无法找到合适的措辞。很久以后我才意识到，我根本不相信自己试图写下的内容。如果当时有AI帮我越过那个坎，我可能会嫁给一个完全不同的人——一个远不适合我的人。

也许人类写作会像蓝纹奶酪或手工地毯一样，成为一种费力创作的手工艺品。也许我们会更加珍视旧时代的文字：赫尔曼·梅尔维尔、乔治·奥威尔、托妮·莫里森——全部经得起验证。这样的文字将成为一种化石记录，记录我们未加思考便埋葬的思维过程。前几天晚上，当我即将入睡时，一首19世纪的童谣浮现在脑海中："Wynken, Blynken, and Nod one night / Sailed off in a wooden shoe,— / Sailed on a river of crystal light / Into a sea of dew." 一首儿歌，却展现出新的美感。又或者，准时送达、不显露出困惑、怀疑或内心挣扎的平滑通信——让我们的形象显得亲切、高效、普遍（尽管表面）智慧——正是我们想要的。但至少我们应该知道自己正在牺牲什么。