圖對齊拓撲作為接地檢測的歸納偏置
大型語言模型(LLM)最佳化於生成分佈上合理的續接,而非明確驗證生成命題是否源於源文件。這一歸納偏置促進了泛化,但未編碼響應是否相對於參考文本接地。現有幻覺檢測方法透過檢索增強、自一致性或宣告驗證改善事實性,但通常不直接學習對齊拓撲。本文構建參考資訊與LLM輸出之間的對齊二分圖,並訓練圖神經網路(GNN)透過訊息傳遞建模對齊結構。該方法在四個不同的幻覺和問答資料集上取得了最先進的結果,優於包括GPT-4o在內的所有比較方法。
文章情報
要點
- 大型語言模型缺乏接地驗證,限制了在臨床決策等高風險領域的使用。
- 現有方法不直接學習對齊拓撲結構。
- 新方法構建二分圖並使用圖神經網路訊息傳遞。
- 在四個資料集上超過GPT-4o等基線模型。
為什麼重要
這條新聞值得關注,因為大型語言模型缺乏接地驗證,限制了在臨床決策等高風險領域的使用。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
大型語言模型(LLM)在生成流暢文本方面表現卓越,但其核心最佳化目標並非驗證生成內容是否嚴格源自參考文件,而是產生分佈上合理的延續。這種歸納偏置使模型具備出色的泛化能力,但同時也意味著模型無法確保其輸出相對於給定參考是“接地”的——即生成的事實是否真正被源文件所蘊含。這一問題在臨床決策支援等對事實準確性要求極高的領域尤為突出,因為這些場景中任何幻覺都可能導致嚴重後果。
現有的幻覺檢測方法主要依賴檢索增強生成(RAG)、自一致性檢查或宣告級驗證等技術來提升事實性,但這些方法通常不直接利用對齊拓撲——即參考文本與模型輸出之間的結構關係。例如,RAG透過引入外部知識庫來輔助生成,但並未顯式建模生成內容與參考資訊之間的對齊關係;自一致性依賴多次取樣後的一致性,但無法捕捉細粒度的對齊模式。
針對這一空白,研究人員提出了一種基於圖對齊拓撲的新方法。該方法首先在參考資訊與LLM輸出之間構建對齊二分圖:圖中的節點代表來自參考和輸出的文本單元(如句子或短語),邊則代表兩者之間的對齊關係(如語義蘊含或事實匹配)。隨後,訓練一個圖神經網路(GNN),透過訊息傳遞機制來學習對齊結構中的模式。這種方式能夠直接從拓撲中捕捉接地線索,而無需依賴外部知識或多次推理,從而更高效、更直接地檢測幻覺。
在四個涵蓋幻覺檢測和問答任務的多樣化資料集上的實驗結果表明,該方法的效能達到了最先進的水平,超越了包括GPT-4o在內的所有對比模型。這一成果不僅為LLM的接地檢測提供了一種全新的有效方案,也證明了將對齊拓撲作為歸納偏置在提升模型事實準確性方面的巨大潛力。未來,該方法有望被整合到高風險領域的LLM應用中,為臨床決策、法律分析等場景提供更可靠的事實保障。