研究人員警告:AI幻覺引用正滲透入影響臨床指南的論文
哥倫比亞大學等機構對250萬篇生物醫學論文的審查顯示,自2023年以來,偽造參考文獻的比例增加了超過12倍。研究人員懷疑這與語言模型的廣泛使用有關——這些虛假引用與論文主題匹配,格式正確,幾乎無法識別。98%的受影響論文未得到出版商回應。
文章情報
工程師進階
要點
- 250萬篇生物醫學論文審計發現偽造引用率自2023年增加12倍以上
- 虛假引用與論文主題相關、格式規範,極難被發現
- 98%的受影響論文未收到出版商回應
為什麼重要
這條新聞值得關注,因為250萬篇生物醫學論文審計發現偽造引用率自2023年增加12倍以上。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
哥倫比亞大學及其他機構的一項大規模審計發現,在250萬篇生物醫學論文中,AI生成的虛假參考文獻比例自2023年以來驚人地增長了超過12倍。研究人員指出,這一現象很可能與大型語言模型的廣泛使用直接相關——這些模型經常“幻覺”出看似真實但實際不存在的引用。值得注意的是,這些偽造的引用不僅與論文主題高度吻合,還遵循了正確的格式規範,使得同行評審和編輯幾乎無法識別。
這項研究揭示了學術出版中一個日益嚴重的信任危機。審計結果顯示,幾乎所有(98%)受影響的論文都未得到出版商的任何回應或糾正。考慮到這些論文可能被用於制定臨床指南或影響醫療決策,這種沉默可能對患者安全和醫療實踐產生深遠影響。
研究人員呼籲學術社群和出版商迅速採取行動,包括改進審稿流程、開發檢測AI幻覺引用的工具,以及加強對使用語言模型輔助寫作的透明度要求。否則,學術文獻的完整性將持續受到侵蝕。