AI News HubLIVE
站内改写

微宏检索:减少大语言模型中的长文本幻觉

大语言模型在长文本生成中容易出现幻觉,现有检索增强模型无法保证关键信息靠近输出。本文提出的微宏检索(M2R)框架通过宏观检索粗粒度证据和微观检索关键信息库,显著减少了长文本任务中的幻觉,并采用基于课程学习的强化学习策略进行训练。

文章情报

工程师进阶

要点

  • 大语言模型在长文本生成中因冗余检索和长推理链易产生幻觉
  • 关键信息越靠近输出,事实准确性越高
  • M2R框架通过宏观和微观两级检索确保关键信息与输出靠近
  • 基于课程学习的强化学习策略稳定训练检索与归因能力

为什么重要

这条新闻值得关注,因为大语言模型在长文本生成中因冗余检索和长推理链易产生幻觉。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

大语言模型(LLM)在多种任务中表现出色,但在长文本生成中仍然容易出现幻觉,尤其是在检索上下文冗余或推理链较长的情况下,事实错误会被进一步放大。近年来的研究揭示了一个关键现象:关键信息越靠近模型输出,事实准确性就越高。然而,现有的检索增强语言模型(RALM)缺乏有效机制来保证这种接近性——外部证据通过多轮检索被注入推理过程,但无法确保关键信息始终靠近最终输出。

为了填补这一空白,Yujie Feng等十位研究者在arXiv上提交了一篇论文(编号2605.28828),提出了一种名为微宏检索(M2R)的新型“边检索边生成”框架。在宏观层面,M2R从外部来源检索粗粒度的证据;在微观层面,它从推理过程中构建的关键信息库中提取核心结果,并在生成答案时重新利用这些结果。这种双层设计直接解决了关键信息到输出的接近性瓶颈,从而有效减少了长文本任务中的幻觉现象。

M2R的训练采用了基于课程学习的强化学习策略,并使用定制化的基于规则的奖励机制,使模型能够稳定地掌握检索和归因技能。论文在多个基准测试上进行了广泛的实验,结果显示M2R非常有效,尤其在长上下文设置中表现突出。这项工作对于提升LLM在长文本生成任务中的可靠性具有重要意义,未来可能影响模型选型、推理成本、产品能力和评测基准。