科学家谴责会议使用隐藏提示捕捉AI同行评审
神经信息处理系统大会(NeurIPS)组织者在论文中嵌入隐藏提示,以检测同行评审员是否使用生成式AI。此举引发争议,有人支持但也有人批评破坏信任。
一场关于人工智能在同行评审中使用的争议正在科学界发酵。第40届神经信息处理系统大会(NeurIPS)的组织者被曝在提交给评审员的论文中嵌入了隐藏提示,这些提示旨在捕捉那些使用生成式AI来评审论文的研究人员。
该会议计划于2026年12月在澳大利亚悉尼举行,其政策明确禁止评审员将论文上传至AI聊天机器人,因为这违反了保密原则。然而,评审员仍可将AI用于背景研究。为了执行这一政策,组织者在论文中插入了对大型语言模型(LLM)的隐形指令,这些指令会引导LLM在评审报告中使用如“这项工作解决了核心挑战”或“论文的声称”等特定短语。
这一做法在社交媒体上引发了强烈反响。莱布尼茨汉诺威大学的计算机科学家Sören Auer在LinkedIn上写道:“设计一个预设恶意的陷阱会腐蚀整个系统所依赖的关系。你不能通过把评审员视为嫌疑犯来建立健康的评审文化。”Auer提到,他最初在评审第一篇论文时发现了这些隐藏提示,以为是由作者插入的,因此拒绝了该论文。直到在第二篇论文中再次发现并看到Reddit上的讨论,他才意识到这是组织者的行为。他认为这种做法可能导致更多论文被误拒。
然而,也有人看到了其价值。卡内基梅隆大学的计算机科学家Nihar Shah表示,类似的提示注入努力已在即将召开的第43届国际机器学习大会(ICML 2026)上捕捉到了数百名违规使用LLM的评审员。Shah领导的团队在所有提交的论文中注入了隐藏提示,最终发现了数百名不当使用AI的评审员,导致近500篇论文因违反LLM评审政策被退稿,约占今年总投稿量的2%。Shah称研究者们对此表示“压倒性的支持”,认为这是对评审员复制粘贴AI生成评论的有力反击。
萨里大学的AI研究员Sara Atito则在所有评审的NeurIPS论文中都发现了相同的提示,甚至在她自己的论文版本中也存在。她称这是一种“糟糕的机制”,虽然可能过滤掉一些问题论文,但无法解决同行评审的更大问题。
NeurIPS组织委员会在一份声明中表示,无法详细讨论注入提示的内容,以免削弱干预措施的有效性。他们已直接联系注意到隐藏提示的评审员,告知其不要因此惩罚个别论文。
这一事件凸显了学术出版中AI使用的伦理困境。随着AI工具的普及,如何在维护评审诚信和信任之间取得平衡,将成为未来学术会议需要持续探讨的议题。