2026-07-04 18:39 UTC+8站内改写2 分钟阅读更新: 2026-07-04 19:40 UTC+8

科学家谴责会议使用隐藏提示捕捉AI同行评审

神经信息处理系统大会（NeurIPS）组织者在论文中嵌入隐藏提示，以检测同行评审员是否使用生成式AI。此举引发争议，有人支持但也有人批评破坏信任。

来源Hacker News AI作者: jruohonen

一场关于人工智能在同行评审中使用的争议正在科学界发酵。第40届神经信息处理系统大会（NeurIPS）的组织者被曝在提交给评审员的论文中嵌入了隐藏提示，这些提示旨在捕捉那些使用生成式AI来评审论文的研究人员。

该会议计划于2026年12月在澳大利亚悉尼举行，其政策明确禁止评审员将论文上传至AI聊天机器人，因为这违反了保密原则。然而，评审员仍可将AI用于背景研究。为了执行这一政策，组织者在论文中插入了对大型语言模型（LLM）的隐形指令，这些指令会引导LLM在评审报告中使用如“这项工作解决了核心挑战”或“论文的声称”等特定短语。

这一做法在社交媒体上引发了强烈反响。莱布尼茨汉诺威大学的计算机科学家Sören Auer在LinkedIn上写道：“设计一个预设恶意的陷阱会腐蚀整个系统所依赖的关系。你不能通过把评审员视为嫌疑犯来建立健康的评审文化。”Auer提到，他最初在评审第一篇论文时发现了这些隐藏提示，以为是由作者插入的，因此拒绝了该论文。直到在第二篇论文中再次发现并看到Reddit上的讨论，他才意识到这是组织者的行为。他认为这种做法可能导致更多论文被误拒。

然而，也有人看到了其价值。卡内基梅隆大学的计算机科学家Nihar Shah表示，类似的提示注入努力已在即将召开的第43届国际机器学习大会（ICML 2026）上捕捉到了数百名违规使用LLM的评审员。Shah领导的团队在所有提交的论文中注入了隐藏提示，最终发现了数百名不当使用AI的评审员，导致近500篇论文因违反LLM评审政策被退稿，约占今年总投稿量的2%。Shah称研究者们对此表示“压倒性的支持”，认为这是对评审员复制粘贴AI生成评论的有力反击。

萨里大学的AI研究员Sara Atito则在所有评审的NeurIPS论文中都发现了相同的提示，甚至在她自己的论文版本中也存在。她称这是一种“糟糕的机制”，虽然可能过滤掉一些问题论文，但无法解决同行评审的更大问题。

NeurIPS组织委员会在一份声明中表示，无法详细讨论注入提示的内容，以免削弱干预措施的有效性。他们已直接联系注意到隐藏提示的评审员，告知其不要因此惩罚个别论文。

这一事件凸显了学术出版中AI使用的伦理困境。随着AI工具的普及，如何在维护评审诚信和信任之间取得平衡，将成为未来学术会议需要持续探讨的议题。