AI News HubLIVE
サイト内リライト2 分で読了

科学者ら、AIピアレビューを捕捉するための隠しプロンプト活用に反発

NeurIPS会議の主催者が論文に隠しプロンプトを埋め込み、生成AIを使用した査読者を特定しようとする試みに批判が集まっている。

ソースHacker News AI著者: jruohonen

科学界で、AIを利用したピアレビューの是非をめぐる議論が加熱している。第40回神経情報処理システム会議(NeurIPS)の主催者が、査読者に送付する論文に隠しプロンプトを埋め込み、生成AIを使ってレビューを作成する研究者を特定しようとしていることが明らかになった。

2026年12月にオーストラリア・シドニーで開催予定のNeurIPSは、査読者が論文をAIチャットボットにアップロードすることを禁止している。これは機密保持違反にあたるためだ。しかし、背景調査のためのAI利用は認められている。このポリシーを徹底するため、主催者は論文内に大規模言語モデル(LLM)向けの隠し指示を挿入。この指示はLLMに対し、「This work addresses the central challenge」や「The claims of the paper」といった特定のフレーズをレビュー報告書で使用するよう促す。

この取り組みに対し、ソーシャルメディア上で多くの研究者が懸念を表明している。ライプニッツ・ハノーバー大学のコンピュータ科学者Sören Auer氏はLinkedInで「悪意を前提とした罠を仕掛けることは、システム全体が依存する関係を損なう。査読者を容疑者扱いすることで健全なレビュー文化は築けない」と批判。Auer氏は自身が査読した論文の最初の1本でこのプロンプトを発見し、当初は著者が挿入したものと考えてリジェクトしたが、2本目でも同じプロンプトを見つけ、Redditでの議論を知って主催者の仕業と気づいたという。

一方、その有効性を評価する声もある。カーネギーメロン大学のNihar Shah氏は、同様のプロンプト注入を第43回国際機械学習会議(ICML 2026)で実施し、数百人の不正利用者を特定。同会議ではLLMレビューポリシー違反で約500件(全投稿の約2%)をデスクリジェクトした。Shah氏は「研究者からの圧倒的な支持を受けた。査読者がAI生成のレビューをコピーペーストする状況に多くの人が疲れていた」と語る。

サリー大学のAI研究者Sara Atito氏は、自身が査読した4本すべてのNeurIPS論文で同じプロンプトを発見。さらに、自身の論文の査読用バージョンにも存在したという。Atito氏は隠しプロンプトを「貧弱な仕組み」と評し、問題のある投稿を一部フィルタリングできても、ピアレビューの根本的な問題は解決しないと指摘する。

NeurIPS組織委員会は声明で、プロンプトの詳細を明かすと対策の効果が薄れるとし、直接問い合わせた査読者には個別に論文を不当に評価しないよう伝えていると説明した。

この騒動は、学術出版におけるAI利用の倫理的ジレンマを浮き彫りにしている。AIツールの普及が進む中、レビューの公正性と信頼のバランスをどう取るかが、今後の学会にとって重要な課題となりそうだ。