AI News HubLIVE
站内改写2 分で読了

Deep Agentsのコンテキスト管理

Deep Agents SDKは、オフロード、要約、ファイルシステム抽象化を通じて、長時間実行されるAIタスクのコンテキストを管理し、コンテキスト腐敗を防ぎます。本記事では、3つの圧縮技術(大規模ツール結果のオフロード、大規模ツール入力のオフロード、要約)の仕組みと実践ガイドを紹介します。

Deep Agents SDKは、LangChainが提供するオープンソースのエージェントハーネスであり、計画、サブエージェントの生成、ファイルシステムを使用した複雑な長期タスクの実行が可能なAIエージェントを構築するためのものです。タスク長が増大するにつれて、コンテキスト腐敗を防ぎ、LLMの有限メモリ制約を管理するために、効果的なコンテキスト管理が重要になります。

コンテキスト圧縮とは、エージェントのワーキングメモリ内の情報量を削減しつつ、タスク完了に必要な詳細を保持する技術です。これには、以前のインタラクションの要約、古い情報のフィルタリング、保持/破棄の戦略的判断が含まれます。Deep Agentsはファイルシステム抽象化を実装し、エージェントがファイルの一覧表示、読み取り、書き込み、検索、パターンマッチング、ファイル実行などの操作を行えるようにします。エージェントは必要に応じてファイルシステムを使用してオフロードされたコンテンツを検索および取得します。

Deep Agentsは3つの主要な圧縮技術を異なる頻度でトリガーします:

  • 大規模ツール結果のオフロード:ツール呼び出しの応答が20,000トークンを超える場合、応答をファイルシステムにオフロードし、ファイルパス参照と最初の10行のプレビューで置き換えます。エージェントは後で必要に応じて内容を再読み込みまたは検索できます。
  • 大規模ツール入力のオフロード:セッションコンテキストがモデルの利用可能ウィンドウの85%に達すると、古いツール呼び出し(ファイル書き込み/編集引数)を切り詰め、ディスク上のファイルへのポインタで置き換えてアクティブコンテキストのサイズを削減します。
  • 要約:オフロードで十分なスペースが確保できなくなった場合、要約ステップにフォールバックします。LLMが会話の構造化要約(セッションの意図、作成されたアーティファクト、次のステップを含む)を生成し、ワーキングメモリ内の完全な会話履歴を置き換えます。元の完全なメッセージはファイルシステムに正規の記録として書き込まれます。

実践的には、ベンチマークデータセットで圧縮をより積極的にトリガーすることで、個々の機能のシグナルを増幅できます。例えば、利用可能コンテキストウィンドウの10-20%で要約をトリガーすると全体的なパフォーマンスは最適でないかもしれませんが、より多くの要約イベントが生成され、異なる設定(要約プロンプトのバリエーションなど)を比較しやすくなります。

Deep Agents SDKは、個々のコンテキスト管理メカニズムを分離して検証するためのターゲット評価を維持しています。これらは意図的に小さなテストであり、特定の障害モードを明らかでデバッグ可能にします。例えば:

  • 要約がエージェントの目標を維持しているか?タスクの途中で要約をトリガーして、エージェントが継続するか確認します。
  • エージェントは要約で失われた情報を回復できるか?会話の早い段階で「針干し草」の事実を埋め込み、要約イベントを強制し、後でその事実を思い出してタスクを完了するよう要求します。

コンテキスト圧縮戦略を評価する際の推奨事項:現実世界のベンチマークから始め、次に個々の機能をストレステストする;回復可能性をテストする;目標ドリフトを監視する。Deep Agentsハーネスのすべての機能はオープンソースです。最新バージョンを試して、どの圧縮戦略があなたのユースケースに最適かをお知らせください。