检测基于大型语言模型的知识图谱推理中的幻觉
提出LUCID方法,结合注意力分数、知识图谱语义和结构信息,通过图神经网络检测LLM在知识图谱推理中的幻觉,在九个数据集上达到最先进性能。
大型语言模型(LLM)在知识图谱(KG)推理中的应用正变得越来越普遍。这种推理方式从现有事实中推断新知识,广泛应用于问答系统、推荐系统和决策支持等领域。然而,LLM在生成过程中容易产生幻觉(hallucinations),即生成与事实不符或毫无根据的内容。这一问题在知识图谱推理中尤为严重,因为即使模型检索并融入了相关的图谱知识,仍然可能输出错误的推理结果,导致虚假信息和不稳定的决策,严重威胁系统的可靠性。
目前已有的幻觉检测方法主要分为两类:一类关注LLM的内部状态,例如分析神经元的激活模式;另一类则验证生成内容与检索上下文的一致性。然而,这两种方法都忽略了知识图谱中丰富的结构信息。知识图谱本质上是图结构数据,实体之间的关系和连接模式包含了大量语义和逻辑线索,但这些信息往往被现有方法忽视,导致检测性能不佳。
为了弥补这一缺陷,研究团队提出了一种名为LUCID(全称为halLUcination deteCtIon for LLM-based knowleDge graph reasoning)的新方法。LUCID是首个专门为基于LLM的知识图谱推理框架设计的幻觉检测方法。它创新性地同时利用了来自LLM的注意力分数、知识图谱的语义信息以及结构信息。具体来说,LUCID首先从LLM的注意力头中提取节点和边的特征,同时利用预训练模型计算语义相似度。然后,这些特征通过图神经网络(GNN)被整合到知识图谱的结构中,从而全面捕捉推理过程中的各种信息。
为了评估LUCID的性能,团队还构建了人工标注的基准数据集。这些数据集包含了来自不同领域的知识图谱和对应的LLM推理结果,并由人类评估者标注了是否存在幻觉。实验在九个数据集上进行,涵盖了知识图谱推理的多个典型任务,例如链接预测、事实分类等。结果表明,LUCID在检测幻觉方面显著优于15种现有的基线方法,包括基于内部状态的方法和基于上下文一致性的方法。LUCID在多个指标上达到了最先进的性能,为提升LLM在知识图谱推理中的可信度开辟了新途径。
这项研究不仅具有理论意义,也有实际应用价值。通过更准确地检测和避免幻觉,LLM驱动的知识图谱推理系统可以在问答、推荐、决策支持等关键应用中提供更可靠的结果。未来,研究人员可以进一步优化LUCID的架构,探索将其集成到现有LLM推理流程中的方法,从而在实际部署中有效降低幻觉率。