2026-06-02 21:36 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

AI能写出我们想读的文章吗？

本文探讨了AI写作的现状与局限性。作者通过实验发现，尽管AI能模仿著名作家的风格，但其生成的文本往往缺乏生动的情节和人物行动，难以真正打动读者。文章还提到了文学杂志Granta因疑似AI作品获奖引发的争议。

来源Hacker News AI作者: streptomycin

当思考九岁的女儿是否还会经历传统写作过程时，我不禁怀疑：读者总会渴望人类创作的文学，但对于邮件、广告文案、法律摘要、学生论文等其他内容，随着技术改进，人们越来越难以区分人写和机器写的文字。届时，教育者以“不及格”威胁学生的激励手段将失效，因为根本无法检测作弊。

为了测试AI写作的实际水平，我基于Claude制作了一个简单游戏：展示约两百词的文本，让玩家判断是人类还是AI所写。样本来自古登堡计划，我让AI模仿乔治·艾略特、詹姆斯·乔伊斯、海明威、柯南·道尔等作家的风格。初期测试中，AI作品有明显的提示点：格式问题、过度依赖别扭的明喻隐喻、人物频繁做小动作（如用手指滑过桌边、调整衣领）。最可靠的标志是，AI场景中的人物除了做小动作外几乎无所事事。

例如，Claude模仿亨利·菲尔丁生成的段落中，苏菲亚几乎不说话，父亲无法理解她的表情，她自己也不完全明白；琼斯站在窗边等待宣判；韦斯顿先生自说自话后，苏菲亚转身望着毫无必要的炉火。整个场景充满无行动与不确定性。参与者很快认定这是AI所写。

我随后与Claude对话，要求它去掉这些提示点。它调整了规则，例如避免明喻、减少“ nowhere”和“something”等模糊词，但最初仍然生成类似的静态场景。我让它创建另一个代理检查错误，第三个代理提出模仿建议。最终，AI作品有了改善，但仍有局限。

我发布了测试链接，五天内收到超过三万个回复。玩家准确识别真假的比例约为52%，几乎等同于随机猜测。但约10%的玩家表现优异，可能熟悉原文或对AI特征敏锐。通过调整，我成功骗过了超过一半的玩家。最成功的一篇假作模仿了布莱姆·斯托克，仅17%的玩家识别出是AI。

然而，这篇假作仍然描写缺席与静止：叙述者试图用活动逃避思考却无事可做，伯爵不见踪影，走廊只有风声。尽管AI能产生足以愚弄大多数人的模仿品，但无法让角色真正行动起来。增加规则和反馈也无法解决，一旦要求更积极的动作，AI又回到生硬易识别的状态。

我不敢断言这是最关键的标志，因为听起来太文学气或俗套。我只谦卑地提出：小说艺术很大程度上依赖于读者接受那些描述性、氛围性的段落，而AI似乎偏爱这类但无法赋予生命。文学批评家詹姆斯·伍德认为，作者的选择无论大小都会浮出水面。AI也做出选择，但不是基于个人回忆，因此难以创造生动的场景。