AI能写出我们想读的文章吗?
本文探讨了AI写作的现状与局限性。作者通过实验发现,尽管AI能模仿著名作家的风格,但其生成的文本往往缺乏生动的情节和人物行动,难以真正打动读者。文章还提到了文学杂志Granta因疑似AI作品获奖引发的争议。
当思考九岁的女儿是否还会经历传统写作过程时,我不禁怀疑:读者总会渴望人类创作的文学,但对于邮件、广告文案、法律摘要、学生论文等其他内容,随着技术改进,人们越来越难以区分人写和机器写的文字。届时,教育者以“不及格”威胁学生的激励手段将失效,因为根本无法检测作弊。
为了测试AI写作的实际水平,我基于Claude制作了一个简单游戏:展示约两百词的文本,让玩家判断是人类还是AI所写。样本来自古登堡计划,我让AI模仿乔治·艾略特、詹姆斯·乔伊斯、海明威、柯南·道尔等作家的风格。初期测试中,AI作品有明显的提示点:格式问题、过度依赖别扭的明喻隐喻、人物频繁做小动作(如用手指滑过桌边、调整衣领)。最可靠的标志是,AI场景中的人物除了做小动作外几乎无所事事。
例如,Claude模仿亨利·菲尔丁生成的段落中,苏菲亚几乎不说话,父亲无法理解她的表情,她自己也不完全明白;琼斯站在窗边等待宣判;韦斯顿先生自说自话后,苏菲亚转身望着毫无必要的炉火。整个场景充满无行动与不确定性。参与者很快认定这是AI所写。
我随后与Claude对话,要求它去掉这些提示点。它调整了规则,例如避免明喻、减少“ nowhere”和“something”等模糊词,但最初仍然生成类似的静态场景。我让它创建另一个代理检查错误,第三个代理提出模仿建议。最终,AI作品有了改善,但仍有局限。
我发布了测试链接,五天内收到超过三万个回复。玩家准确识别真假的比例约为52%,几乎等同于随机猜测。但约10%的玩家表现优异,可能熟悉原文或对AI特征敏锐。通过调整,我成功骗过了超过一半的玩家。最成功的一篇假作模仿了布莱姆·斯托克,仅17%的玩家识别出是AI。
然而,这篇假作仍然描写缺席与静止:叙述者试图用活动逃避思考却无事可做,伯爵不见踪影,走廊只有风声。尽管AI能产生足以愚弄大多数人的模仿品,但无法让角色真正行动起来。增加规则和反馈也无法解决,一旦要求更积极的动作,AI又回到生硬易识别的状态。
我不敢断言这是最关键的标志,因为听起来太文学气或俗套。我只谦卑地提出:小说艺术很大程度上依赖于读者接受那些描述性、氛围性的段落,而AI似乎偏爱这类但无法赋予生命。文学批评家詹姆斯·伍德认为,作者的选择无论大小都会浮出水面。AI也做出选择,但不是基于个人回忆,因此难以创造生动的场景。