2026-05-27 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

为什么LLM会在结构化知识上产生幻觉：线性化表示推理的机制分析

一项新研究揭示了大型语言模型（LLM）在处理结构化知识（如图和表格）时产生幻觉的机制。研究发现，幻觉源于系统性的内部动态，而非随机噪声：注意力过度集中于类似捷径的结构线索，而前馈表示无法将知识接地，导致模型退回到参数记忆。这些模式在不同结构化知识格式中普遍存在，可用于幻觉检测。

来源arXiv Computational Linguistics作者: Shanghao Li, Jinda Han, Yibo Wang, Yuanjie Zhu, Zihe Song, Langzhou He, Kenan Kamel A Alghythee, Philip S. Yu

大型语言模型（LLM）在涉及结构化外部知识（如知识图谱和表格）的推理任务中常常产生幻觉，即使相关知识充分可用。这一现象背后的机制长期未明。近日，一篇即将发表在ACL 2026上的论文《Why LLMs Hallucinate on Structured Knowledge: A Mechanistic Analysis of Reasoning over Linearized Representations》对此进行了深入探究。

研究团队通过系统性实验发现，LLM在结构化知识上的幻觉并非随机错误，而是由模型内部的系统性动态导致。首先，注意力机制会不成比例地集中在类似捷径的结构性线索上，而非均匀分布在整个上下文。这导致模型忽略了关键信息。其次，前馈层的表示无法有效接地所提供的外部知识，迫使模型依赖其内部参数记忆，从而产生与事实不符的输出。

值得注意的是，即使任务简单（如单跳图查询），这些机制同样生效，且在不同复杂度（多跳图、表格）的设置中表现出普遍性。这一发现意味着幻觉检测可以基于这些内部模式进行，而不必依赖外部验证。

研究还指出，注意力分配的模式在不同任务间存在较大差异，而前馈层的接地失败则是幻觉的稳定预测指标。这一洞察有助于开发更可靠的LLM推理系统，尤其是在金融、医疗等需要结构化知识的高风险领域。

该论文由Shanghao Li等八位作者共同完成，提交于2026年5月25日，并将在ACL 2026会议上发表。其提供的机制性理解不仅加深了我们对LLM内部工作原理的认识，也为缓解幻觉问题指明了新方向。