2026-04-22 00:42 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

ReasoningBank：讓智能體從經驗中學習

Google Cloud的研究人員提出了ReasoningBank，一種新型智能體記憶框架，能從成功和失敗經驗中提煉可推廣的推理策略，顯著提升智能體在複雜任務中的表現和效率。

智能體在複雜現實任務中越來越重要，但在長期運行中，它們缺乏從經驗中學習的能力。現有記憶方法如Synapse和AWM存在不足：要麼記錄詳細動作而非高層策略，要麼只關注成功經驗。為此，Google Cloud的研究團隊在ICLR 2026上提出了ReasoningBank框架。

ReasoningBank將經驗轉化為結構化的記憶，每一條記憶包含標題、描述和內容。工作流程包括檢索、提取和整合三個環節。智能體在行動前從ReasoningBank中獲取相關記憶，行動後通過LLM自評來提取成功經驗或失敗反思。即使自評不完全準確，框架也能保持魯棒性。關鍵創新在於同時分析成功和失敗經驗，從失敗中學習警示性教訓。

為了進一步擴展能力，研究團隊提出了記憶感知測試時擴展（MaTTS）。MaTTS通過並行擴展（生成多條軌跡並進行對比）和順序擴展（在單條軌跡中逐步優化）來產生更高質量的記憶。實驗表明，在WebArena和SWE-Bench-Verified基準上，ReasoningBank相比無記憶基線成功率分別提升8.3%和4.6%，且步驟數減少。結合MaTTS後，性能進一步提升。此外，隨着經驗積累，智能體表現出策略成熟度，從簡單檢查表演變為組合性預防邏輯。

該工作展示了記憶驅動經驗擴展作為智能體縮放新前沿的潛力。