AI能寫出我們想讀的文章嗎?
本文探討了AI寫作的現狀與侷限性。作者通過實驗發現,儘管AI能模仿著名作家的風格,但其生成的文本往往缺乏生動的情節和人物行動,難以真正打動讀者。文章還提到了文學雜誌Granta因疑似AI作品獲獎引發的爭議。
當思考九歲的女兒是否還會經歷傳統寫作過程時,我不禁懷疑:讀者總會渴望人類創作的文學,但對於郵件、廣告文案、法律摘要、學生論文等其他內容,隨着技術改進,人們越來越難以區分人寫和機器寫的文字。屆時,教育者以“不及格”威脅學生的激勵手段將失效,因為根本無法檢測作弊。
為了測試AI寫作的實際水平,我基於Claude製作了一個簡單遊戲:展示約兩百詞的文本,讓玩家判斷是人類還是AI所寫。樣本來自古登堡計劃,我讓AI模仿喬治·艾略特、詹姆斯·喬伊斯、海明威、柯南·道爾等作家的風格。初期測試中,AI作品有明顯的提示點:格式問題、過度依賴彆扭的明喻隱喻、人物頻繁做小動作(如用手指滑過桌邊、調整衣領)。最可靠的標誌是,AI場景中的人物除了做小動作外幾乎無所事事。
例如,Claude模仿亨利·菲爾丁生成的段落中,蘇菲亞幾乎不説話,父親無法理解她的表情,她自己也不完全明白;瓊斯站在窗邊等待宣判;韋斯頓先生自説自話後,蘇菲亞轉身望着毫無必要的爐火。整個場景充滿無行動與不確定性。參與者很快認定這是AI所寫。
我隨後與Claude對話,要求它去掉這些提示點。它調整了規則,例如避免明喻、減少“ nowhere”和“something”等模糊詞,但最初仍然生成類似的靜態場景。我讓它創建另一個代理檢查錯誤,第三個代理提出模仿建議。最終,AI作品有了改善,但仍有侷限。
我發佈了測試鏈接,五天內收到超過三萬個回覆。玩家準確識別真假的比例約為52%,幾乎等同於隨機猜測。但約10%的玩家表現優異,可能熟悉原文或對AI特徵敏鋭。通過調整,我成功騙過了超過一半的玩家。最成功的一篇假作模仿了布萊姆·斯托克,僅17%的玩家識別出是AI。
然而,這篇假作仍然描寫缺席與靜止:敍述者試圖用活動逃避思考卻無事可做,伯爵不見蹤影,走廊只有風聲。儘管AI能產生足以愚弄大多數人的模仿品,但無法讓角色真正行動起來。增加規則和反饋也無法解決,一旦要求更積極的動作,AI又回到生硬易識別的狀態。
我不敢斷言這是最關鍵的標誌,因為聽起來太文學氣或俗套。我只謙卑地提出:小説藝術很大程度上依賴於讀者接受那些描述性、氛圍性的段落,而AI似乎偏愛這類但無法賦予生命。文學批評家詹姆斯·伍德認為,作者的選擇無論大小都會浮出水面。AI也做出選擇,但不是基於個人回憶,因此難以創造生動的場景。