ArXiv將封禁上傳充斥AI垃圾論文的研究人員
預印本平台ArXiv宣佈新政策,將對提交明顯未檢查LLM生成結果(如虛構參考文獻或聊天機器人遺留的“元評論”)的論文作者實施一年封禁,並要求後續提交需經同行評審會議或期刊接受。該政策旨在減少平台上的AI生成低質量內容。
文章情報
要點
- ArXiv將對提交含有LLM未檢查證據(如虛構參考文獻或LLM元評論)的論文作者封禁一年。
- 封禁後,該作者未來的提交必須先在知名同行評審會議或期刊發表。
- 政策僅適用於“不容置疑的證據”案例,作者可上訴。
- 此前ArXiv已限制計算機科學綜述文章僅接受經同行評審的投稿。
為甚麼重要
這條新聞值得關注,因為ArXiv將對提交含有LLM未檢查證據(如虛構參考文獻或LLM元評論)的論文作者封禁一年。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
ArXiv,這個廣受歡迎的預印本學術研究平台,近期出台了新措施,旨在遏制平台上充斥着AI生成低質量內容(即所謂“AI slop”)的論文數量。據ArXiv計算機科學章節主席Thomas Dietterich透露,如果一篇論文包含“不容置疑的證據,表明作者對LLM生成的結果未經檢查”,例如出現虛構的參考文獻或LLM留下的“元評論”,該論文的作者將被禁止向ArXiv投稿一年。不僅如此,在禁令解除後,這些作者未來的提交還需要首先在“知名的同行評審會議或期刊”上獲得發表,才能再次提交至ArXiv。
Dietterich在社交平台X上詳細解釋了這一政策。他指出,根據ArXiv的行為準則,所有署名作者都應對論文內容負全部責任,無論這些內容是如何生成的。若生成式AI工具產生了不當語言、抄襲內容、偏見、錯誤、虛假引用或誤導性信息,並且這些輸出被納入科學作品,責任應歸咎於作者。針對此類違規行為,ArXiv已明確了處罰標準:如果提交的論文中包含不容置疑的證據,證明作者沒有檢查LLM生成的結果,那麼該論文的可靠性將受到質疑。處罰措施包括從ArXiv封禁一年,並且後續提交必須先在信譽良好的同行評審平台獲得接受。
Dietterich特別舉例説明了“不容置疑的證據”的類型,例如論文中出現完全虛構的參考文獻,或者保留着LLM生成的“元評論”,如“這是一份200字的摘要;您想讓我做任何修改嗎?”或“此表中的數據僅供説明,請用實驗中的真實數字替換”等。他向404Media透露,作者可以就封禁決定提出上訴。同時,他強調這一政策僅適用於存在“不容置疑證據”的案例,並且內部流程要求首先由管理員記錄問題,然後由章節主席確認後才能實施處罰。
值得注意的是,ArXiv去年就已經採取了措施來減少AI低質量內容,當時它只允許計算機科學領域的綜述文章和立場論文在經過同行評審並被會議或期刊接受後才能發表。ArXiv當時表示:“大語言模型的出現使得這類內容相對容易按需大量生產,而我們收到的大多數綜述文章只不過是一些帶註釋的參考書目,缺乏對開放研究問題的實質性討論。”這些舉措共同反映了學術界對AI濫用現象日益增長的擔憂。