2026-06-29 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-29 15:53 UTC+8

ToE：一种分层且可解释的声明验证框架，具有动态多源证据检索与聚合功能

本文提出Tree of Evidence (ToE)，一种用于自动事实核查的分层证据推理框架。ToE将每个声明建模为动态扩展的论证树，集成强化学习驱动的多源检索代理、证据评估代理和论证树聚合算法，通过可解释的证据链迭代分解、检索和验证声明。理论分析确保了检索策略收敛到信息论最优策略。实验表明，ToE在多个数据集和骨干LLM上比竞争基线提升4到24个百分点，尤其在对对抗性污染输入上表现显著。

来源arXiv AI作者: Zhaoqi Wang, Zijian Zhang, Kun Zheng, Zhen Li, Xin Li, Chunlei Li, Jiamou Liu

随着虚假新闻的快速传播，信息生态系统正面临日益严重的威胁。尤其是生成引擎优化（GEO）投毒的出现，使得人工智能生成的虚假内容可以被检索系统系统地呈现，从而污染大语言模型（LLM）的推理过程。针对这一问题，来自多家机构的研究人员提出了一种名为“Tree of Evidence”（ToE）的分层证据推理框架，旨在实现自动化的可解释事实核查。

ToE的核心创新在于将每个待验证的声明建模为一棵动态扩展的论证树。该框架整合了三个关键组件：基于强化学习的多源检索代理、证据评估代理以及论证树聚合算法。多源检索代理能够从多个信息源中动态检索相关证据，证据评估代理对检索到的证据进行可信度评估，而论证树聚合算法则通过迭代分解、检索和验证声明，构建出一条完整的可解释证据链。这一过程不仅提高了事实核查的准确性，还使得验证过程透明化，用户能够清晰地看到每一步的推理依据。

在理论层面，研究团队对检索过程进行了深入分析，推导出形式化的误差界，保证了学习到的策略能够收敛到信息论最优策略的邻域内。这一成果为ToE的可靠性提供了坚实的数学基础。

实验部分，研究人员在多个数据集和不同骨干LLM上对ToE进行了评估。结果表明，与竞争基线相比，ToE的性能提升幅度在4到24个百分点之间，尤其在对对抗性污染输入进行验证时，优势更为明显。这一发现表明，ToE在应对由GEO投毒等新型威胁引发的复杂虚假信息方面具有显著潜力。

总的来说，ToE通过其分层结构和动态证据链，为自动事实核查提供了一种高效且可解释的解决方案，有望在未来的信息生态系统中发挥重要作用。该工作已发表于arXiv，论文编号2606.27736。