AI News HubLIVE
站內改寫2 分鐘閱讀

科學家譴責會議使用隱藏提示捕捉AI同行評審

神經資訊處理系統大會(NeurIPS)組織者在論文中嵌入隱藏提示,以檢測同行評審員是否使用生成式AI。此舉引發爭議,有人支援但也有人批評破壞信任。

來源Hacker News AI作者: jruohonen

一場關於人工智慧在同行評審中使用的爭議正在科學界發酵。第40屆神經資訊處理系統大會(NeurIPS)的組織者被曝在提交給評審員的論文中嵌入了隱藏提示,這些提示旨在捕捉那些使用生成式AI來評審論文的研究人員。

該會議計劃於2026年12月在澳大利亞悉尼舉行,其政策明確禁止評審員將論文上傳至AI聊天機器人,因為這違反了保密原則。然而,評審員仍可將AI用於背景研究。為了執行這一政策,組織者在論文中插入了對大型語言模型(LLM)的隱形指令,這些指令會引導LLM在評審報告中使用如“這項工作解決了核心挑戰”或“論文的聲稱”等特定短語。

這一做法在社交媒體上引發了強烈反響。萊布尼茨漢諾威大學的電腦科學家Sören Auer在LinkedIn上寫道:“設計一個預設惡意的陷阱會腐蝕整個系統所依賴的關係。你不能透過把評審員視為嫌疑犯來建立健康的評審文化。”Auer提到,他最初在評審第一篇論文時發現了這些隱藏提示,以為是由作者插入的,因此拒絕了該論文。直到在第二篇論文中再次發現並看到Reddit上的討論,他才意識到這是組織者的行為。他認為這種做法可能導致更多論文被誤拒。

然而,也有人看到了其價值。卡內基梅隆大學的電腦科學家Nihar Shah表示,類似的提示注入努力已在即將召開的第43屆國際機器學習大會(ICML 2026)上捕捉到了數百名違規使用LLM的評審員。Shah領導的團隊在所有提交的論文中注入了隱藏提示,最終發現了數百名不當使用AI的評審員,導致近500篇論文因違反LLM評審政策被退稿,約佔今年總投稿量的2%。Shah稱研究者們對此表示“壓倒性的支援”,認為這是對評審員複製貼上AI生成評論的有力反擊。

薩里大學的AI研究員Sara Atito則在所有評審的NeurIPS論文中都發現了相同的提示,甚至在她自己的論文版本中也存在。她稱這是一種“糟糕的機制”,雖然可能過濾掉一些問題論文,但無法解決同行評審的更大問題。

NeurIPS組織委員會在一份宣告中表示,無法詳細討論注入提示的內容,以免削弱干預措施的有效性。他們已直接聯絡注意到隱藏提示的評審員,告知其不要因此懲罰個別論文。

這一事件凸顯了學術出版中AI使用的倫理困境。隨著AI工具的普及,如何在維護評審誠信和信任之間取得平衡,將成為未來學術會議需要持續探討的議題。