2026-04-22 01:42 UTC+9サイト内リライト1 分で読了更新: 2026-06-27 09:25 UTC+9

ReasoningBank: エージェントが経験から学習できるようにする

Google Cloudの研究者は、成功と失敗の両方の経験から一般化可能な推論戦略を抽出する新しいエージェント記憶フレームワーク「ReasoningBank」を提案し、展開後の継続的な学習を可能にします。Webおよびソフトウェアエンジニアリングのベンチマークでベースラインを上回る成果を上げました。

ソースGoogle Research Blog

エージェントは複雑な現実世界のタスクで重要性を増していますが、長期間の運用において経験から学ぶ能力が不足しています。既存の記憶手法（Synapse、AWMなど）は、行動の詳細記録や成功体験のみに焦点を当てるなどの欠点があります。これに対し、Google Cloudの研究チームはICLR 2026でReasoningBankフレームワークを提案しました。

ReasoningBankは成功と失敗の両方の経験から構造化された記憶（タイトル、説明、内容）を抽出します。ワークフローは検索、抽出、統合の連続ループで構成され、エージェントは行動前に記憶を取得し、LLMによる自己評価を通じて洞察を抽出します。自己評価が完全でなくても頑健性が保たれます。重要なのは、失敗経験から予防的な教訓を学ぶ点です。

さらに、メモリ対応テスト時スケーリング（MaTTS）を導入しました。並列スケーリング（複数軌跡の生成と対比）と逐次スケーリング（単一軌跡の反復改良）により、より高品質な記憶を生成します。WebArenaとSWE-Bench-Verifiedの評価では、ReasoningBankは無記憶ベースラインと比較して成功率が8.3%と4.6%向上し、ステップ数も削減されました。MaTTSの追加でさらに改善が見られました。また、エージェントは戦略的な成熟を示し、単純なチェックリストから複合的な予防ロジックへと進化しました。

この研究は、記憶駆動型経験拡張がエージェントスケーリングの新たなフロンティアであることを示しています。