2026-05-29 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

微宏检索：减少大语言模型中的长文本幻觉

大语言模型在长文本生成中容易出现幻觉，现有检索增强模型无法保证关键信息靠近输出。本文提出的微宏检索（M2R）框架通过宏观检索粗粒度证据和微观检索关键信息库，显著减少了长文本任务中的幻觉，并采用基于课程学习的强化学习策略进行训练。

来源arXiv Computational Linguistics作者: Yujie Feng, Jian Li, Zhihan Zhou, Pengfei Xu, Yujia Zhang, Xiaoyu Li, Xiaohui Zhou, Alan Zhao, Xi Chen, Xiao-Ming Wu

大语言模型（LLM）在多种任务中表现出色，但在长文本生成中仍然容易出现幻觉，尤其是在检索上下文冗余或推理链较长的情况下，事实错误会被进一步放大。近年来的研究揭示了一个关键现象：关键信息越靠近模型输出，事实准确性就越高。然而，现有的检索增强语言模型（RALM）缺乏有效机制来保证这种接近性——外部证据通过多轮检索被注入推理过程，但无法确保关键信息始终靠近最终输出。

为了填补这一空白，Yujie Feng等十位研究者在arXiv上提交了一篇论文（编号2605.28828），提出了一种名为微宏检索（M2R）的新型“边检索边生成”框架。在宏观层面，M2R从外部来源检索粗粒度的证据；在微观层面，它从推理过程中构建的关键信息库中提取核心结果，并在生成答案时重新利用这些结果。这种双层设计直接解决了关键信息到输出的接近性瓶颈，从而有效减少了长文本任务中的幻觉现象。

M2R的训练采用了基于课程学习的强化学习策略，并使用定制化的基于规则的奖励机制，使模型能够稳定地掌握检索和归因技能。论文在多个基准测试上进行了广泛的实验，结果显示M2R非常有效，尤其在长上下文设置中表现突出。这项工作对于提升LLM在长文本生成任务中的可靠性具有重要意义，未来可能影响模型选型、推理成本、产品能力和评测基准。