2026-05-25 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

EVE-Agent：可验证证据的自我进化代理

EVE-Agent是一种新的自我进化搜索代理，通过引入证据可验证性来确保训练实例的来源可靠性。它修改了提出者-求解者框架，使用证据验证器根据证据带来的边际准确率增益进行奖励，从而在不依赖人工标注的情况下提升模型的证据基础正确性。实验表明，EVE-Agent显著优于先前的自我进化代理，并且其生成的数据集具有可审计性。

来源arXiv AI作者: Yamato Arai, Yuma Ichikawa

近年来，自我进化代理在人工智能领域引起了广泛关注。这类系统能够自主生成问题、回答并从自身反馈中学习，而无需人类标注数据。然而，这种自主学习过程存在一个关键隐患：如果无法验证训练实例中的证据，系统可能会奖励那些流畅但缺乏依据的回答，导致训练信号变得不透明甚至不可靠。针对这一问题，来自日本的研究人员提出了EVE-Agent（Evidence-Verifiable Self-Evolving Agent），一种可验证证据的自我进化代理。

EVE-Agent的核心思想是：每个生成的自训练实例不仅应包含答案，还应包含一个可溯源至原始来源的证据片段。为了落实这一理念，研究者对经典的“提出者-求解者”框架进行了修改。在该框架中，提出者负责生成问题、答案以及一字不差的证据片段。随后，一个专门的证据验证器根据提供证据前后模型的准确率变化来评估该片段的价值，并据此分配奖励信号。这种机制使得训练算法能够自动筛选出那些真正有助于回答问题的证据，而无需依赖先知答案或人工标注。值得注意的是，EVE-Agent的设计保持了对底层模型、检索器、搜索工具和优化框架的完全兼容，无需额外修改。

研究团队通过一系列实验对EVE-Agent进行了评估。结果表明，与之前的自我进化搜索代理相比，EVE-Agent在证据基础正确性（evidence-grounded correctness）指标上取得了显著提升。更重要的是，由EVE-Agent生成的课程不仅是自我产生的，而且是结构上可审计的：每一个训练实例都附带一个可检查的源证据片段，明确解释了为何该实例值得信赖。这种透明性为自我进化代理的安全部署提供了新的保障。

该研究发表于arXiv预印本平台，论文题为《EVE-Agent: Evidence-Verifiable Self-Evolving Agents》，共23页，包含2张图表。研究者来自日本，论文的作者包括Yamato Arai等人。感兴趣的读者可以通过arXiv ID 2605.22905获取完整内容。