ReasoningBank:让智能体从经验中学习
Google Cloud的研究人员提出了ReasoningBank,一种新型智能体记忆框架,能从成功和失败经验中提炼可推广的推理策略,显著提升智能体在复杂任务中的表现和效率。
智能体在复杂现实任务中越来越重要,但在长期运行中,它们缺乏从经验中学习的能力。现有记忆方法如Synapse和AWM存在不足:要么记录详细动作而非高层策略,要么只关注成功经验。为此,Google Cloud的研究团队在ICLR 2026上提出了ReasoningBank框架。
ReasoningBank将经验转化为结构化的记忆,每一条记忆包含标题、描述和内容。工作流程包括检索、提取和整合三个环节。智能体在行动前从ReasoningBank中获取相关记忆,行动后通过LLM自评来提取成功经验或失败反思。即使自评不完全准确,框架也能保持鲁棒性。关键创新在于同时分析成功和失败经验,从失败中学习警示性教训。
为了进一步扩展能力,研究团队提出了记忆感知测试时扩展(MaTTS)。MaTTS通过并行扩展(生成多条轨迹并进行对比)和顺序扩展(在单条轨迹中逐步优化)来产生更高质量的记忆。实验表明,在WebArena和SWE-Bench-Verified基准上,ReasoningBank相比无记忆基线成功率分别提升8.3%和4.6%,且步骤数减少。结合MaTTS后,性能进一步提升。此外,随着经验积累,智能体表现出策略成熟度,从简单检查表演变为组合性预防逻辑。
该工作展示了记忆驱动经验扩展作为智能体缩放新前沿的潜力。