AI News HubLIVE
サイト内リライト3 分で読了

記憶を持つエージェント:Agent Memory の紹介

Cloudflare Agent Memory は、AIエージェントに永続的な記憶を提供するマネージドサービスであり、重要なことを記憶し、不要なことを忘れ、時間とともに賢くなります。

ソースCloudflare AI Blog著者: Tyson Trautmann

開発者が Cloudflare 上でますます高度なエージェントを構築するにつれて、適切な情報を適切なタイミングでコンテキストに取り込むことが最大の課題の一つとなっています。モデルが出力する結果の品質は、操作するコンテキストの品質に直接依存しますが、コンテキストウィンドウが100万トークンを超えて拡大しても、コンテキストの腐敗は未解決の問題です。すべてをコンテキストに保持して品質が劣化するのを待つか、積極的に刈り込んで後でエージェントが必要とする情報を失うリスクを冒すか、という悪い選択肢の間で自然な緊張が生じます。

本日、Cloudflare は Agent Memory のプライベートベータ版を発表します。これは、エージェントの会話から情報を抽出し、必要なときに利用可能にするマネージドサービスであり、コンテキストウィンドウを埋めることなく実現します。AIエージェントに永続的な記憶を提供し、重要なことを記憶し、不必要なことを忘れ、時間の経過とともに賢くなります。

エージェントメモリはAIインフラストラクチャの中で最も急速に進化している分野の一つで、新しいオープンソースライブラリ、マネージドサービス、研究用プロトタイプがほぼ毎週リリースされています。LongMemEval、LoCoMo、BEAMなどのベンチマークは有用ですが、特定の評価に過適合して本番環境で崩壊するシステムを構築しやすくなります。既存のサービスはアーキテクチャも異なります。バックグラウンドで抽出と検索を処理するマネージドサービスもあれば、自分でメモリパイプラインを実行するセルフホスト型フレームワークもあります。

Agent Memory は、意見を持つAPIと検索ベースのアーキテクチャを備えたマネージドサービスです。綿密に検討した結果、この組み合わせがほとんどの本番ワークロードに適切なデフォルトであると確信しています。タイトな取り込み・検索パイプラインは、エージェントに生のファイルシステムアクセスを与えるよりも優れています。コストとパフォーマンスが向上するだけでなく、時間的論理、更新、指示追跡など、本番環境で必要な複雑な推論タスクのためのより良い基盤を提供します。

Agent Memory は名前でアドレス指定されるプロファイルに記憶を保存します。プロファイルでは、会話の取り込み、特定の記憶の即時保存、必要な記憶の検索、記憶の一覧表示、特定の記憶の忘却などの操作が可能です。取り込みは、ハーネスがコンテキストを圧縮する際に通常呼び出される一括パスです。記憶は、モデルがその場で重要なものを保存するためのものです。検索は、完全な検索パイプラインを実行し、合成された回答を返します。

Agent Memory の内部では、抽出パイプラインと検索パイプラインが連携します。抽出パイプラインは、メッセージのコンテンツベースの決定論的ID生成から始まり、並行してフルパスと詳細抽出を実行します。検証後、記憶は事実、イベント、指示、タスクの4種類に分類され、重複排除されて保存されます。検索パイプラインは、5つの並列チャネル(全文検索、正確な事実キー検索、生メッセージ検索、直接ベクトル検索、HyDEベクトル検索)を実行し、逆数ランク融合で結果を統合し、合成モデルが自然言語の回答を生成します。

興味深い発見として、より大きく強力なモデルが常に優れているわけではありません。Cloudflare は現在、抽出、検証、分類、クエリ分析に Llama 4 Scout(17B、16エキスパートMoE)をデフォルトで使用し、合成には Nemotron 3(120B MoE、12Bアクティブパラメータ)を使用しています。合成ステージでのみ、より多くのパラメータを投入することが一貫して効果的でした。

Agent Memory は Cloudflare の内部でも使用されています。コーディングエージェントの記憶、エージェントコードレビュー、チャットボットなど、さまざまなユースケースで活用されています。たとえば、コードレビュアーは過去のレビューを記憶し、時間の経過とともにノイズが減少し、よりスマートになります。

今後、Agent Memory はまもなく一般公開される予定です。早期アクセスを希望する方は、ウェイトリストにご登録ください。アーキテクチャの詳細や開発状況については、Cloudflare Discord または Cloudflare Community で議論に参加できます。