2026-04-22 00:42 UTC+8站内改写1 分钟阅读更新: 2026-06-27 08:25 UTC+8

ReasoningBank：让智能体从经验中学习

Google Cloud的研究人员提出了ReasoningBank，一种新型智能体记忆框架，能从成功和失败经验中提炼可推广的推理策略，显著提升智能体在复杂任务中的表现和效率。

智能体在复杂现实任务中越来越重要，但在长期运行中，它们缺乏从经验中学习的能力。现有记忆方法如Synapse和AWM存在不足：要么记录详细动作而非高层策略，要么只关注成功经验。为此，Google Cloud的研究团队在ICLR 2026上提出了ReasoningBank框架。

ReasoningBank将经验转化为结构化的记忆，每一条记忆包含标题、描述和内容。工作流程包括检索、提取和整合三个环节。智能体在行动前从ReasoningBank中获取相关记忆，行动后通过LLM自评来提取成功经验或失败反思。即使自评不完全准确，框架也能保持鲁棒性。关键创新在于同时分析成功和失败经验，从失败中学习警示性教训。

为了进一步扩展能力，研究团队提出了记忆感知测试时扩展（MaTTS）。MaTTS通过并行扩展（生成多条轨迹并进行对比）和顺序扩展（在单条轨迹中逐步优化）来产生更高质量的记忆。实验表明，在WebArena和SWE-Bench-Verified基准上，ReasoningBank相比无记忆基线成功率分别提升8.3%和4.6%，且步骤数减少。结合MaTTS后，性能进一步提升。此外，随着经验积累，智能体表现出策略成熟度，从简单检查表演变为组合性预防逻辑。

该工作展示了记忆驱动经验扩展作为智能体缩放新前沿的潜力。