2026-06-29 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-29 15:53 UTC+8

ToE：一種分層且可解釋的聲明驗證框架，具有動態多源證據檢索與聚合功能

本文提出Tree of Evidence (ToE)，一種用於自動事實核查的分層證據推理框架。ToE將每個聲明建模為動態擴展的論證樹，集成強化學習驅動的多源檢索代理、證據評估代理和論證樹聚合算法，通過可解釋的證據鏈迭代分解、檢索和驗證聲明。理論分析確保了檢索策略收斂到信息論最優策略。實驗表明，ToE在多個數據集和骨幹LLM上比競爭基線提升4到24個百分點，尤其在對對抗性污染輸入上表現顯著。

來源arXiv AI作者: Zhaoqi Wang, Zijian Zhang, Kun Zheng, Zhen Li, Xin Li, Chunlei Li, Jiamou Liu

隨着虛假新聞的快速傳播，信息生態系統正面臨日益嚴重的威脅。尤其是生成引擎優化（GEO）投毒的出現，使得人工智能生成的虛假內容可以被檢索系統系統地呈現，從而污染大語言模型（LLM）的推理過程。針對這一問題，來自多家機構的研究人員提出了一種名為“Tree of Evidence”（ToE）的分層證據推理框架，旨在實現自動化的可解釋事實核查。

ToE的核心創新在於將每個待驗證的聲明建模為一棵動態擴展的論證樹。該框架整合了三個關鍵組件：基於強化學習的多源檢索代理、證據評估代理以及論證樹聚合算法。多源檢索代理能夠從多個信息源中動態檢索相關證據，證據評估代理對檢索到的證據進行可信度評估，而論證樹聚合算法則通過迭代分解、檢索和驗證聲明，構建出一條完整的可解釋證據鏈。這一過程不僅提高了事實核查的準確性，還使得驗證過程透明化，用户能夠清晰地看到每一步的推理依據。

在理論層面，研究團隊對檢索過程進行了深入分析，推導出形式化的誤差界，保證了學習到的策略能夠收斂到信息論最優策略的鄰域內。這一成果為ToE的可靠性提供了堅實的數學基礎。

實驗部分，研究人員在多個數據集和不同骨幹LLM上對ToE進行了評估。結果表明，與競爭基線相比，ToE的性能提升幅度在4到24個百分點之間，尤其在對對抗性污染輸入進行驗證時，優勢更為明顯。這一發現表明，ToE在應對由GEO投毒等新型威脅引發的複雜虛假信息方面具有顯著潛力。

總的來説，ToE通過其分層結構和動態證據鏈，為自動事實核查提供了一種高效且可解釋的解決方案，有望在未來的信息生態系統中發揮重要作用。該工作已發表於arXiv，論文編號2606.27736。