2026-06-19站内改写2 分鐘閱讀更新: 2026-06-19

檢測基於大型語言模型的知識圖譜推理中的幻覺

提出LUCID方法，結合注意力分數、知識圖譜語義和結構信息，通過圖神經網絡檢測LLM在知識圖譜推理中的幻覺，在九個數據集上達到最先進性能。

來源arXiv Computational Linguistics作者: Xinyan Zhu, Yaoqi Liu, Yue Gao, Huadong Ma, Cheng Yang, Chuan Shi

大型語言模型（LLM）在知識圖譜（KG）推理中的應用正變得越來越普遍。這種推理方式從現有事實中推斷新知識，廣泛應用於問答系統、推薦系統和決策支持等領域。然而，LLM在生成過程中容易產生幻覺（hallucinations），即生成與事實不符或毫無根據的內容。這一問題在知識圖譜推理中尤為嚴重，因為即使模型檢索並融入了相關的圖譜知識，仍然可能輸出錯誤的推理結果，導致虛假信息和不穩定的決策，嚴重威脅系統的可靠性。

目前已有的幻覺檢測方法主要分為兩類：一類關注LLM的內部狀態，例如分析神經元的激活模式；另一類則驗證生成內容與檢索上下文的一致性。然而，這兩種方法都忽略了知識圖譜中豐富的結構信息。知識圖譜本質上是圖結構數據，實體之間的關係和連接模式包含了大量語義和邏輯線索，但這些信息往往被現有方法忽視，導致檢測性能不佳。

為了彌補這一缺陷，研究團隊提出了一種名為LUCID（全稱為halLUcination deteCtIon for LLM-based knowleDge graph reasoning）的新方法。LUCID是首個專門為基於LLM的知識圖譜推理框架設計的幻覺檢測方法。它創新性地同時利用了來自LLM的注意力分數、知識圖譜的語義信息以及結構信息。具體來説，LUCID首先從LLM的注意力頭中提取節點和邊的特徵，同時利用預訓練模型計算語義相似度。然後，這些特徵通過圖神經網絡（GNN）被整合到知識圖譜的結構中，從而全面捕捉推理過程中的各種信息。

為了評估LUCID的性能，團隊還構建了人工標註的基準數據集。這些數據集包含了來自不同領域的知識圖譜和對應的LLM推理結果，並由人類評估者標註了是否存在幻覺。實驗在九個數據集上進行，涵蓋了知識圖譜推理的多個典型任務，例如鏈接預測、事實分類等。結果表明，LUCID在檢測幻覺方面顯著優於15種現有的基線方法，包括基於內部狀態的方法和基於上下文一致性的方法。LUCID在多個指標上達到了最先進的性能，為提升LLM在知識圖譜推理中的可信度開闢了新途徑。

這項研究不僅具有理論意義，也有實際應用價值。通過更準確地檢測和避免幻覺，LLM驅動的知識圖譜推理系統可以在問答、推薦、決策支持等關鍵應用中提供更可靠的結果。未來，研究人員可以進一步優化LUCID的架構，探索將其集成到現有LLM推理流程中的方法，從而在實際部署中有效降低幻覺率。