2026-05-31 11:14 UTC+8站内改写3 分钟阅读更新: 2026-06-30 21:03 UTC+8

美国面临着一个“万能句”问题

AI检测工具Pangram因其高准确性而成为标准，但错误率仍可能导致虚假指控，引发寒蝉效应。随着AI写作的普及，依赖检测工具可能带来新的问题。

来源Hacker News AI作者: paulpauper

近期，美国出现了一连串引人注目的指控：有人被指使用AI生成文字冒充自己创作。这些指控的起点几乎都是同一个工具——Pangram。今年3月，一家大型出版社在预定发行日前几天撤下一部恐怖小说，部分原因就是Pangram识别出文本由AI生成。此外，人们利用Pangram指出《纽约时报》等主流报纸的文章、多个获奖短篇小说，甚至教皇利奥十四世关于AI危险的通谕中都有AI生成的痕迹。越来越多大学和科学协会也开始用它审查学生作业和研究论文。随着对AI写作的恐慌加剧，Pangram站在了风口浪尖。

几年前，即时可靠地判断文本是否由AI编写似乎还遥不可及。2023年，检测工具ZeroGPT竟将美国宪法判定为AI生成；同年，OpenAI因“准确率低”放弃了自家AI检测器。而当时ChatGPT的写作质量远不如现在。但最近检测工具进步显著，Pangram尤其脱颖而出，成为黄金标准：粘贴文本，它就能评估哪些部分是“AI生成”、“AI辅助”或“人工编写”。

然而，一个基本可靠的AI检测器可能比完全不可靠的更危险。Pangram正在积累毁灭声誉和职业生涯的力量，但它确实会犯错，程度可能超出当前认知。这样一来，AI指控很可能迅速演变成一场猎巫行动。

Pangram声称其算法准确率极高，错误地将文本识别为AI输出的概率仅万分之一。CEO Max Spero表示：“说某物是AI生成，责任重大，我们只会在极其确信时才会这样做。”几项独立分析也证实了它的优异表现。芝加哥大学的一篇论文发现，在大约3000个500-1000字的样本中，Pangram几乎没有误报。

但Pangram保证文本由人类书写的能力则较弱。Spero指出，假阴性率（错误地将AI文本标记为人工）接近七十分之一。

问题部分在于Pangram与主要AI实验室的军备竞赛，这些实验室致力于让ChatGPT和Claude的写作听起来尽可能自然和人性化。同时，Pangram还要应对AI“人性化”工具——专门用于伪装AI文本的程序。Reddit用户热烈推荐一种名为Walter Writes AI的工具。我亲自测试：让ChatGPT和Claude写简短文章，再粘贴进该工具。它做一些无关痛痒的改写，替换笨拙的过渡，引入语法怪异。例如，ChatGPT的“这些数字已经大到无法忽视”变成了“这些使用数据的庞大规模已经不容忽视”。当我将Walter Writes AI的输出粘贴进Pangram时，它无一例外地将二次加工的AI文章判定为人工编写。

换言之，Pangram只能提供有限洞见。纽约市一所公立高中的老师告诉我，他把自己学生的论文通过Pangram检测，结果显示“100%人工”，但他不相信。他了解学生的能力，尤其是那些有AI作弊前科的，有充分理由怀疑Pangram。但反过来，仅凭间接证据指控学生未经允许使用AI，风险极高：学生要么不及格，要么被证明清白后心生怨恨。“风险太高，”老师说，“但我们评估AI生成内容的方法还很不成型。”

更复杂的是Pangram等工具设计的不透明性。模型通过海量人工与AI示例训练而成——比如杂志上的人工书评，以及ChatGPT生成的相同书评——直到能区分二者。这类似于用数百万张猫狗图片训练图像识别算法。Pangram无法指出具体证据或模式来支持其判断。Spero承认算法内部机制“几乎不可解释”，尽管他希望让“AI辅助”标签更细致，但“仍不确定如何实现”。在对过度依赖AI聊天机器人的担忧中，我们可能又陷入对另一个黑箱算法的依赖。

Spero表示，Pangram“绝不应是最终裁决者”，而应是更深入调查的起点，公司会调查每个报告的错误。他还指出，烟雾探测器、TSA扫描仪等我们依赖的检测技术都有基准错误率。从某种程度来说，最大的问题不在于技术本身，而在于它们试图检测的对象。

随着AI写作指控不断升级，人们对Pangram的依赖只会增加。它已连接到Canvas教育平台，教师可用来扫描学生作业。美国有超过1000万高中生和2000万大学生，每人每年提交数十份书面作业。在此规模下，即使万分之一错误率，Pangram也会产生大量误判。

更糟的是，Pangram能否保持甚至提升当前能力也不确定。随着聊天机器人和AI人性化器调整，AI检测“会在我们无法预测的时间以无法预测的方式起伏”，NYU神经科学家Tim Requarth说。即使学校、出版商、科研机构更依赖AI检测，任何第三方评估都滞后数月，在加速发展的AI世界中近乎过时。基于AI检测可靠性制定规则，如同在退潮时建沙堡。

这一切似乎正酿成灾难。AI检测的模糊性为发起或否认指控留下了空间。本月，科技记者Taylor Lorenz在X上被指控用AI为《名利场》写稿，她坚决否认。Spero调查后发现Pangram出错。“感谢编辑历史记录，”Lorenz说。这次经历加剧了她对这类指控的担忧：“我非常偏执。”

“AI生成”和“AI辅助”容易被有意或无意混淆。《华尔街日报》编辑James Taranto最近称Pangram为“诽谤机器”，声称它错误标记了该报三篇专栏为AI生成；其中两位作者承认使用AI修改部分工作，Taranto认为将其描述为“AI生成”是不准确且不公平的。最初用Pangram分析教皇通谕的人指出，只有部分段落看起来像AI生成或辅助，或许不是教皇本人而是高级梵蒂冈官员使用了AI。这并未阻止诸如“教皇用AI撰写关于AI危险的通谕？”之类的标题。

这一切让人想起另一场关于作家不当行为的道德愤怒：2023-24年的剽窃战争，当时保守派活动人士动员指控知名学者和大学领导剽窃，最终导致哈佛大学前校长Claudine Gay辞职。许多指控是虚假的，很可能基于剽窃检测算法，正如我同事Ian Bogost当时判断的那样，这些算法相当无用。即将到来的AI检测战争可能更具争议。

明确地说，Pangram并非无用。但问题正在于此：它的结论太容易被曲解和争议，尤其是在没人真正认同哪些AI使用合乎伦理的情况下。就像聊天机器人一样，AI检测工具已经足够有效以供广泛使用，但还不足以完全信任。这样看来，Pangram和其他检测器正是它们所搜寻的AI产品的镜像。