2026-05-31 11:14 UTC+8站內改寫3 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

美國面臨著一個“萬能句”問題

AI檢測工具Pangram因其高準確性而成為標準，但錯誤率仍可能導致虛假指控，引發寒蟬效應。隨著AI寫作的普及，依賴檢測工具可能帶來新的問題。

來源Hacker News AI作者: paulpauper

近期，美國出現了一連串引人注目的指控：有人被指使用AI生成文字冒充自己創作。這些指控的起點幾乎都是同一個工具——Pangram。今年3月，一家大型出版社在預定發行日前幾天撤下一部恐怖小說，部分原因就是Pangram識別出文本由AI生成。此外，人們利用Pangram指出《紐約時報》等主流報紙的文章、多個獲獎短篇小說，甚至教皇利奧十四世關於AI危險的通諭中都有AI生成的痕跡。越來越多大學和科學協會也開始用它審查學生作業和研究論文。隨著對AI寫作的恐慌加劇，Pangram站在了風口浪尖。

幾年前，即時可靠地判斷文本是否由AI編寫似乎還遙不可及。2023年，檢測工具ZeroGPT竟將美國憲法判定為AI生成；同年，OpenAI因“準確率低”放棄了自家AI檢測器。而當時ChatGPT的寫作質量遠不如現在。但最近檢測工具進步顯著，Pangram尤其脫穎而出，成為黃金標準：貼上文本，它就能評估哪些部分是“AI生成”、“AI輔助”或“人工編寫”。

然而，一個基本可靠的AI檢測器可能比完全不可靠的更危險。Pangram正在積累毀滅聲譽和職業生涯的力量，但它確實會犯錯，程度可能超出當前認知。這樣一來，AI指控很可能迅速演變成一場獵巫行動。

Pangram聲稱其演算法準確率極高，錯誤地將文本識別為AI輸出的機率僅萬分之一。CEO Max Spero表示：“說某物是AI生成，責任重大，我們只會在極其確信時才會這樣做。”幾項獨立分析也證實了它的優異表現。芝加哥大學的一篇論文發現，在大約3000個500-1000字的樣本中，Pangram幾乎沒有誤報。

但Pangram保證文本由人類書寫的能力則較弱。Spero指出，假陰性率（錯誤地將AI文本標記為人工）接近七十分之一。

問題部分在於Pangram與主要AI實驗室的軍備競賽，這些實驗室致力於讓ChatGPT和Claude的寫作聽起來儘可能自然和人性化。同時，Pangram還要應對AI“人性化”工具——專門用於偽裝AI文本的程式。Reddit使用者熱烈推薦一種名為Walter Writes AI的工具。我親自測試：讓ChatGPT和Claude寫簡短文章，再貼上進該工具。它做一些無關痛癢的改寫，替換笨拙的過渡，引入語法怪異。例如，ChatGPT的“這些數字已經大到無法忽視”變成了“這些使用資料的龐大規模已經不容忽視”。當我將Walter Writes AI的輸出貼上進Pangram時，它無一例外地將二次加工的AI文章判定為人工編寫。

換言之，Pangram只能提供有限洞見。紐約市一所公立高中的老師告訴我，他把自己學生的論文透過Pangram檢測，結果顯示“100%人工”，但他不相信。他了解學生的能力，尤其是那些有AI作弊前科的，有充分理由懷疑Pangram。但反過來，僅憑間接證據指控學生未經允許使用AI，風險極高：學生要麼不及格，要麼被證明清白後心生怨恨。“風險太高，”老師說，“但我們評估AI生成內容的方法還很不成型。”

更復雜的是Pangram等工具設計的不透明性。模型透過海量人工與AI示例訓練而成——比如雜誌上的人工書評，以及ChatGPT生成的相同書評——直到能區分二者。這類似於用數百萬張貓狗圖片訓練影像識別演算法。Pangram無法指出具體證據或模式來支援其判斷。Spero承認演算法內部機制“幾乎不可解釋”，儘管他希望讓“AI輔助”標籤更細緻，但“仍不確定如何實現”。在對過度依賴AI聊天機器人的擔憂中，我們可能又陷入對另一個黑箱演算法的依賴。

Spero表示，Pangram“絕不應是最終裁決者”，而應是更深入調查的起點，公司會調查每個報告的錯誤。他還指出，煙霧探測器、TSA掃描器等我們依賴的檢測技術都有基準錯誤率。從某種程度來說，最大的問題不在於技術本身，而在於它們試圖檢測的物件。

隨著AI寫作指控不斷升級，人們對Pangram的依賴只會增加。它已連線到Canvas教育平臺，教師可用來掃描學生作業。美國有超過1000萬高中生和2000萬大學生，每人每年提交數十份書面作業。在此規模下，即使萬分之一錯誤率，Pangram也會產生大量誤判。

更糟的是，Pangram能否保持甚至提升當前能力也不確定。隨著聊天機器人和AI人性化器調整，AI檢測“會在我們無法預測的時間以無法預測的方式起伏”，NYU神經科學家Tim Requarth說。即使學校、出版商、科研機構更依賴AI檢測，任何第三方評估都滯後數月，在加速發展的AI世界中近乎過時。基於AI檢測可靠性制定規則，如同在退潮時建沙堡。

這一切似乎正釀成災難。AI檢測的模糊性為發起或否認指控留下了空間。本月，科技記者Taylor Lorenz在X上被指控用AI為《名利場》寫稿，她堅決否認。Spero調查後發現Pangram出錯。“感謝編輯歷史記錄，”Lorenz說。這次經歷加劇了她對這類指控的擔憂：“我非常偏執。”

“AI生成”和“AI輔助”容易被有意或無意混淆。《華爾街日報》編輯James Taranto最近稱Pangram為“誹謗機器”，聲稱它錯誤標記了該報三篇專欄為AI生成；其中兩位作者承認使用AI修改部分工作，Taranto認為將其描述為“AI生成”是不準確且不公平的。最初用Pangram分析教皇通諭的人指出，只有部分段落看起來像AI生成或輔助，或許不是教皇本人而是高階梵蒂岡官員使用了AI。這並未阻止諸如“教皇用AI撰寫關於AI危險的通諭？”之類的標題。

這一切讓人想起另一場關於作家不當行為的道德憤怒：2023-24年的剽竊戰爭，當時保守派活動人士動員指控知名學者和大學領導剽竊，最終導致哈佛大學前校長Claudine Gay辭職。許多指控是虛假的，很可能基於剽竊檢測演算法，正如我同事Ian Bogost當時判斷的那樣，這些演算法相當無用。即將到來的AI檢測戰爭可能更具爭議。

明確地說，Pangram並非無用。但問題正在於此：它的結論太容易被曲解和爭議，尤其是在沒人真正認同哪些AI使用合乎倫理的情況下。就像聊天機器人一樣，AI檢測工具已經足夠有效以供廣泛使用，但還不足以完全信任。這樣看來，Pangram和其他檢測器正是它們所搜尋的AI產品的映象。