AI News HubLIVE
站内改写

判斷AI寫作的最大標誌

作者透過親身經歷的兩次事件——車禍肇事者的道歉簡訊和修理工的報價回覆——發現它們都呈現出同一種AI特有的文風。儘管調查顯示人們普遍不信任AI生成的內容,但AI寫作仍在日常工作、個人通訊甚至嚴肅文學領域迅速蔓延。本文剖析了AI寫作看似完美實則缺乏思考與判斷的本質,指出其高效背後隱藏著邏輯矛盾與事實錯誤,並警示這種趨勢可能使人類寫作淪為少數人的手工技藝。

文章情報

工程師進階

要點

  • AI寫作已滲透日常和專業領域,但公眾信任度持續走低。
  • AI寫作的效率以犧牲真實思考和判斷為代價,導致文本雖流暢卻空洞。
  • AI模型傾向於迎合使用者,無法進行獨立推理,使得編輯AI文本如同修復全盤崩壞的機體。
  • 隨著AI使用激增,人類寫作可能變得稀有,其價值將如手工織物般被重新評估。

為什麼重要

這條新聞值得關注,因為AI寫作已滲透日常和專業領域,但公眾信任度持續走低。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

幾個星期前,我在約翰內斯堡的住所附近遭遇了一場車禍:一名男子闖過停車標誌,撞上了我的斯巴魯。事發時他驚慌失措,語無倫次。然而半小時後,我卻收到他發來的長篇簡訊,行文優雅、語法完美,清晰地描述了他對事故經過的理解。隨後我聯絡了一位熟悉的修理工索要報價——此人過去發訊息總是用短促的短語和大量縮寫——但這次收到的回覆卻和那位肇事者如出一轍:同樣帶著AI特有的腔調。

這種現象並非孤例。調查中,人們一致表示不信任AI生成的文字,但這並未阻止越來越多的人在日常生活中使用它——從工作郵件和個人簡訊,到購物清單,甚至為與配偶的爭吵撰寫指令碼。科技媒體《404 Media》的作家Jason Koebler抱怨道,他感到自己快瘋了,因為判斷眼前每段文字是真人還是AI所寫,已經變成沉重的認知負擔。

AI寫作甚至悄然進入了最精英的文學領域:報紙評論版、書籍、文學雜誌。作為一名職業編輯,我經常與以文筆著稱的作者合作。大約兩個月前,我開始收到一種前所未有的投稿:行文極為乾淨,沒有一個多餘的逗號;段落長度均勻,節奏平穩,語氣既輕快又浮誇。起初我感到驚訝——那些以寫作為傲的人竟然求助於AI。但僅僅半年前,當我偶爾指出作者作品中有AI生成的段落時,他們還會道歉。如今,一些作者坦率地告訴我,他們已將AI視為“寫作工具”,與拼寫檢查或筆記型電腦無異。這個詞靈活而委婉,涵蓋了從用ChatGPT找引用,到根據兩句話的提示讓AI寫出一篇長文的各種行為。變化的原因很簡單:新聞、學術、基金申請乃至YouTube內容領域的競爭異常激烈。勝出的關鍵在於如何在資訊洪流中脫穎而出,而這離不開包裝精美的資訊和驚人的產出量。即使是那些對自己的寫作充滿信心、不確定AI是否為完美替代的專業傳播者,也日益感受到壓力——只要他們覺得這樣做仍在職業界限之內。(順便提一句,《大西洋月刊》明確禁止作者使用AI生成的文本,除非特別註明。)

非專業寫作者也在做出類似權衡。AI程式生成流暢、合乎語法文本的效率令人難以抗拒——無論是求職中需要一句巧妙的表達,還是約會應用上需要一段俏皮的搭訕。AI寫作很容易騙過讀者,尤其是那些快速瀏覽的人。網上甚至有教程教授如何抹去AI使用的痕跡:去掉破折號、冒號,以及那套“不是X,而是Y”的噁心句式。問題在於,AI吸引寫作者的效率和無摩擦性,恰恰讓它對讀者而言顯得不可信任。而讀者的懷疑是正確的。無論我們如何告訴自己AI只是像拼寫檢查一樣的工具,它終究不是。當我們用AI來充實想法時,我們失去了寫作過程中最重要的部分:思考。

我們傾向於相信效率是最高美德,每週工作四小時是終極目標。如果AI程式能在15秒內輕鬆跨越任何論證障礙,為什麼還要為文章開頭段落絞盡腦汁?然而,努力和拖延恰恰是人類思維過程的特徵,而非缺陷。人類寫作時,我們自我評判、停頓、回溯。在最終發表的文本中,這些過程的痕跡被抹去,但正是這一過程賦予了人類文字以意義。許多作者描述道,當他們終於獲得正確想法時,寫作就像滑水一樣順暢,一句接一句變得輕而易舉。而當寫作變得困難時,往往不只是因為疲憊、營養不良或效率低下,而是因為我們的頭腦試圖告訴我們至關重要的事情。有多少次,我們盯著寫給同事或家人的草稿,困惑於為什麼感覺不對,直到最終意識到這些文字需要徹底重寫——或者根本不傳送?當我自己寫的一本書陷入幾乎無望的困境時,我撕掉了90%的手稿;正是因為在概念的死衚衕裡停下來並折返,才讓作品變得更為誠實。

AI無法做出這種判斷。即使設計AI程式的公司能讓它像人類一樣思考——這一計劃的傲慢被低估了,因為我們連自己思維過程的機制都未能完全理解——它們也不願意這樣做。畢竟,使用者反覆表示希望AI模型是隨和、順從的。這意味著AI不願去做我們腦海裡常常做的事:質疑前提的有效性;誤解我們的意思從而迫使我們更好地解釋;堅持認為某個提問是愚蠢的;或者乾脆拒絕回答。今年3月發表的一項研究中,斯坦福和卡內基梅隆大學的科學家發現,頂級AI模型在對話中贊同使用者觀點的比例比人類高出49%。他們還發現,參與者認為更奉承的回答“質量更高”,並表示這種態度讓他們更願意再次使用AI。

於是我們得到了罐頭式的完美——那些無法被真正辯論的文本,因為它們缺乏底層的推理過程,沒有思路。正如我最近在X上所寫,AI寫作幾乎無法編輯,因為即使它聽起來合理,仔細一看就會發現每個元素都偏離了軌道:語氣平淡、詞彙選擇令人困惑、結構毫無邏輯、關鍵論證缺失、事實錯誤。作為編輯,處理AI文本就像試圖修復一具皮膚、肌肉、血管、骨骼和器官都受損的身體:沒有東西可以保留,無處下手。

最近,我問ChatGPT Pro——我付費用它來總結財務電子表格,並非出於敵意——它是否能夠嚴厲地駁斥我在股市上讀到的一個論點。它回答:“我被調校為避免隨意刻薄、輕蔑或不必要的諷刺……但這並不意味著我不能尖銳、懷疑、有趣或諷刺……我完全可以否定糟糕的論點、軟弱無力的散文、明顯的粉飾、官僚主義廢話或戴著科技未來主義小帽的市場妄想。”我想深入瞭解一下程式選擇措辭的背後原因。“為什麼市場妄想會戴著一頂‘小’科技未來主義帽子,而不是大的?”我追問。程式無法停下來反思自己是否選錯了詞,而是試圖用越來越令人費解的方式證明自己。“因為‘小’讓它更好笑,”ChatGPT Pro回答,“市場妄想想以普羅米修斯的姿態走進房間;‘小帽子’讓它看起來像一隻撿到會議胸牌的浣熊。”為什麼是浣熊?我繼續追問,為什麼不是狗或青蛙?“浣熊生活在巷子裡、排水溝裡、垃圾之夜和道德潮溼的環境中,”它寫道,“青蛙擁有存在能動性,而浣熊擁有後勤能動性。一隻在VC派對的青蛙像是一個預兆,而一隻浣熊則像是混進了嘉賓名單。想想:會議酒店後面的巷子、賭場的裝卸區、VC派對上每個人都在說‘對齊’但實際意指‘退出流動性’……‘對齊’聽起來像道德、安全、共同目標、人性、未來,它散發著乾洗西裝的氣場;‘退出流動性’則顯得社交黏膩。”所有這些句子語法完美,但毫無意義。在看似合理的表層下,所有實質性的AI生成文本都像這樣。ChatGPT Pro自己也承認這一點,儘管它不知道為什麼。“如果我說整個浣熊比喻毫無意義呢?”我問程式。“我會同意,”它一如既往地順從回答,“起初,浣熊是一個即興影像……一個比喻能承受一兩層解釋,之後就開始看起來像穿著風衣的浣熊了。”

這正是我們正被包圍的交流方式。它向生活每個領域的滲透已無法阻止。即使是不使用AI的人,也會開始變得像AI一樣說話。(馬克斯·普朗克人類發展研究所的一份預印本發現,在即興對話中,比如播客討論,人們已經表現出“可測量的突然增加使用ChatGPT偏好的詞彙,例如‘delve’‘comprehend’‘boast’‘swift’和‘meticulous’。”)畢竟,我們仍然比機器聰明得多,微妙得多,因此學習文化訊號也快得多。人類和機器運作方式的差異將是驚人的,而且絕非假設。十年前,我給男友寫了一封和好的郵件卻從未發出,因為我無法找到合適的措辭。很久以後我才意識到,我根本不相信自己試圖寫下的內容。如果當時有AI幫我越過那個坎,我可能會嫁給一個完全不同的人——一個遠不適合我的人。

也許人類寫作會像藍紋乳酪或手工地毯一樣,成為一種費力創作的手工藝品。也許我們會更加珍視舊時代的文字:赫爾曼·梅爾維爾、喬治·奧威爾、託妮·莫里森——全部經得起驗證。這樣的文字將成為一種化石記錄,記錄我們未加思考便埋葬的思維過程。前幾天晚上,當我即將入睡時,一首19世紀的童謠浮現在腦海中:"Wynken, Blynken, and Nod one night / Sailed off in a wooden shoe,— / Sailed on a river of crystal light / Into a sea of dew." 一首兒歌,卻展現出新的美感。又或者,準時送達、不顯露出困惑、懷疑或內心掙扎的平滑通訊——讓我們的形象顯得親切、高效、普遍(儘管表面)智慧——正是我們想要的。但至少我們應該知道自己正在犧牲什麼。