AI News HubLIVE
站内改写1 分钟阅读

ToE:一种分层且可解释的声明验证框架,具有动态多源证据检索与聚合功能

本文提出Tree of Evidence (ToE),一种用于自动事实核查的分层证据推理框架。ToE将每个声明建模为动态扩展的论证树,集成强化学习驱动的多源检索代理、证据评估代理和论证树聚合算法,通过可解释的证据链迭代分解、检索和验证声明。理论分析确保了检索策略收敛到信息论最优策略。实验表明,ToE在多个数据集和骨干LLM上比竞争基线提升4到24个百分点,尤其在对对抗性污染输入上表现显著。

来源arXiv AI作者: Zhaoqi Wang, Zijian Zhang, Kun Zheng, Zhen Li, Xin Li, Chunlei Li, Jiamou Liu

随着虚假新闻的快速传播,信息生态系统正面临日益严重的威胁。尤其是生成引擎优化(GEO)投毒的出现,使得人工智能生成的虚假内容可以被检索系统系统地呈现,从而污染大语言模型(LLM)的推理过程。针对这一问题,来自多家机构的研究人员提出了一种名为“Tree of Evidence”(ToE)的分层证据推理框架,旨在实现自动化的可解释事实核查。

ToE的核心创新在于将每个待验证的声明建模为一棵动态扩展的论证树。该框架整合了三个关键组件:基于强化学习的多源检索代理、证据评估代理以及论证树聚合算法。多源检索代理能够从多个信息源中动态检索相关证据,证据评估代理对检索到的证据进行可信度评估,而论证树聚合算法则通过迭代分解、检索和验证声明,构建出一条完整的可解释证据链。这一过程不仅提高了事实核查的准确性,还使得验证过程透明化,用户能够清晰地看到每一步的推理依据。

在理论层面,研究团队对检索过程进行了深入分析,推导出形式化的误差界,保证了学习到的策略能够收敛到信息论最优策略的邻域内。这一成果为ToE的可靠性提供了坚实的数学基础。

实验部分,研究人员在多个数据集和不同骨干LLM上对ToE进行了评估。结果表明,与竞争基线相比,ToE的性能提升幅度在4到24个百分点之间,尤其在对对抗性污染输入进行验证时,优势更为明显。这一发现表明,ToE在应对由GEO投毒等新型威胁引发的复杂虚假信息方面具有显著潜力。

总的来说,ToE通过其分层结构和动态证据链,为自动事实核查提供了一种高效且可解释的解决方案,有望在未来的信息生态系统中发挥重要作用。该工作已发表于arXiv,论文编号2606.27736。