AI News HubLIVE
站內改寫1 分鐘閱讀

ReasoningBank:讓智能體從經驗中學習

Google Cloud的研究人員提出了ReasoningBank,一種新型智能體記憶框架,能從成功和失敗經驗中提煉可推廣的推理策略,顯著提升智能體在複雜任務中的表現和效率。

智能體在複雜現實任務中越來越重要,但在長期運行中,它們缺乏從經驗中學習的能力。現有記憶方法如Synapse和AWM存在不足:要麼記錄詳細動作而非高層策略,要麼只關注成功經驗。為此,Google Cloud的研究團隊在ICLR 2026上提出了ReasoningBank框架。

ReasoningBank將經驗轉化為結構化的記憶,每一條記憶包含標題、描述和內容。工作流程包括檢索、提取和整合三個環節。智能體在行動前從ReasoningBank中獲取相關記憶,行動後通過LLM自評來提取成功經驗或失敗反思。即使自評不完全準確,框架也能保持魯棒性。關鍵創新在於同時分析成功和失敗經驗,從失敗中學習警示性教訓。

為了進一步擴展能力,研究團隊提出了記憶感知測試時擴展(MaTTS)。MaTTS通過並行擴展(生成多條軌跡並進行對比)和順序擴展(在單條軌跡中逐步優化)來產生更高質量的記憶。實驗表明,在WebArena和SWE-Bench-Verified基準上,ReasoningBank相比無記憶基線成功率分別提升8.3%和4.6%,且步驟數減少。結合MaTTS後,性能進一步提升。此外,隨着經驗積累,智能體表現出策略成熟度,從簡單檢查表演變為組合性預防邏輯。

該工作展示了記憶驅動經驗擴展作為智能體縮放新前沿的潛力。