2026-06-19站内改写2 分钟阅读更新: 2026-06-19

检测基于大型语言模型的知识图谱推理中的幻觉

提出LUCID方法，结合注意力分数、知识图谱语义和结构信息，通过图神经网络检测LLM在知识图谱推理中的幻觉，在九个数据集上达到最先进性能。

来源arXiv Computational Linguistics作者: Xinyan Zhu, Yaoqi Liu, Yue Gao, Huadong Ma, Cheng Yang, Chuan Shi

大型语言模型（LLM）在知识图谱（KG）推理中的应用正变得越来越普遍。这种推理方式从现有事实中推断新知识，广泛应用于问答系统、推荐系统和决策支持等领域。然而，LLM在生成过程中容易产生幻觉（hallucinations），即生成与事实不符或毫无根据的内容。这一问题在知识图谱推理中尤为严重，因为即使模型检索并融入了相关的图谱知识，仍然可能输出错误的推理结果，导致虚假信息和不稳定的决策，严重威胁系统的可靠性。

目前已有的幻觉检测方法主要分为两类：一类关注LLM的内部状态，例如分析神经元的激活模式；另一类则验证生成内容与检索上下文的一致性。然而，这两种方法都忽略了知识图谱中丰富的结构信息。知识图谱本质上是图结构数据，实体之间的关系和连接模式包含了大量语义和逻辑线索，但这些信息往往被现有方法忽视，导致检测性能不佳。

为了弥补这一缺陷，研究团队提出了一种名为LUCID（全称为halLUcination deteCtIon for LLM-based knowleDge graph reasoning）的新方法。LUCID是首个专门为基于LLM的知识图谱推理框架设计的幻觉检测方法。它创新性地同时利用了来自LLM的注意力分数、知识图谱的语义信息以及结构信息。具体来说，LUCID首先从LLM的注意力头中提取节点和边的特征，同时利用预训练模型计算语义相似度。然后，这些特征通过图神经网络（GNN）被整合到知识图谱的结构中，从而全面捕捉推理过程中的各种信息。

为了评估LUCID的性能，团队还构建了人工标注的基准数据集。这些数据集包含了来自不同领域的知识图谱和对应的LLM推理结果，并由人类评估者标注了是否存在幻觉。实验在九个数据集上进行，涵盖了知识图谱推理的多个典型任务，例如链接预测、事实分类等。结果表明，LUCID在检测幻觉方面显著优于15种现有的基线方法，包括基于内部状态的方法和基于上下文一致性的方法。LUCID在多个指标上达到了最先进的性能，为提升LLM在知识图谱推理中的可信度开辟了新途径。

这项研究不仅具有理论意义，也有实际应用价值。通过更准确地检测和避免幻觉，LLM驱动的知识图谱推理系统可以在问答、推荐、决策支持等关键应用中提供更可靠的结果。未来，研究人员可以进一步优化LUCID的架构，探索将其集成到现有LLM推理流程中的方法，从而在实际部署中有效降低幻觉率。