LangSmith Context Hub のご紹介
LangSmith は Context Hub を発表しました。これは、AGENTS.md、スキル、ポリシーなどの AI エージェントの動作ファイルを集中管理、バージョン管理、共同編集するためのプラットフォームです。コンテキストはエンジニア以外によって管理されることが多く、頻繁に更新されるため、専用の管理場所が必要です。バージョン管理、タグ、コメント機能を提供し、Deep Agents との統合により永続的なメモリを実現します。
記事インテリジェンス
要点
- Context Hub はエージェントのコンテキストファイル(AGENTS.md、スキル、ポリシーなど)を一元管理します。
- コンテキストはエージェントの動作に大きな影響を与え、欠落や古いコンテキストが多くの障害の原因になります。
- バージョン管理、タグ(dev/staging/prod)、コメントなどの機能を提供します。
- CLI、UI、またはエージェントによる自動作成でアップロード可能です。
重要な理由
このニュースが重要なのは、Context Hub はエージェントのコンテキストファイル(AGENTS.md、スキル、ポリシーなど)を一元管理しますためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
LangSmith は本日、Context Hub をリリースしました。これは、AI エージェントの動作を定義するファイル(AGENTS.md、スキル、ポリシー、サンプルなど)を保存、バージョン管理、共同編集するための集中型プラットフォームです。Context Hub はこれらのファイルに中央のホームを提供し、チームがエージェントシステムの他の重要な部分と同じ方法でこれらを管理できるようにします。
コンテキストが重要な理由
エージェントは主に3つの要素で構成されます:モデル、ハーネス、コンテキスト。モデルは推論と生成を担当します。ハーネスはモデルを囲むコードで、エージェントループ、ツール、状態、権限などのランタイム動作を定義します。コンテキストはエージェントが読み取り従う情報で、システム指示、AGENTS.md ファイル、スキル、サンプル、企業ポリシー、ライティングガイドライン、サポート手順、ドメイン固有知識などが含まれます。コンテキストはエージェントの動作に大きな影響を与えます。より良いモデルやハーネスは役立ちますが、多くのエージェント障害は欠落、古い、または不適切に管理されたコンテキストに起因します。エージェントが適切なツールにアクセスできていても、それらを効果的に使用するための正しい指示、サンプル、ポリシーが必要です。中には、コンテキストへの投資がハーネス自体よりも重要だと主張する人もいます。
コンテキストに独自のホームが必要な理由
ハーネスコードは通常 GitHub またはエンジニアリングチームがコードを管理する場所に属します。コンテキストはしばしば異なるワークフローを必要とします。まず、コンテキストはエンジニアリング外の人々によって管理されることが多いです。LangChain では、ブランドデザイン、ブログ作成、プロダクトメッセージングなどにスキルを使用しています。これらのファイルを作成・レビューするのに最適な人は、多くの場合デザイナー、マーケター、サポートリーダー、プロダクトマネージャー、またはその他のテーマエキスパートです。GitHub は一部のチームには機能しますが、エージェントの動作を形作る必要があるすべての人にとって適切なインターフェースとは限りません。第二に、コンテキストは急速に変化します。チームは何が機能するかを学ぶにつれて、指示を更新し、サンプルを改良し、ポリシーを追加し、スキルを調整します。エージェント自身もコンテキストを作成・更新できます。例えば、エージェントがトピックを調査し、参照ファイルを作成し、将来のエージェントが使用できるように保存することができます。
Context Hub が提供するもの
Context Hub は、LangSmith 内でエージェントコンテキストを管理するための中央の場所をチームに提供します。AGENTS.md ファイルとスキルをすぐにサポートし、他のファイルバンドルも保存できる柔軟性があります。主な機能には、バージョン管理(変更の追跡、以前のバージョンの確認、ロールバック)、タグ(dev、staging、prod などのタグでエージェントが適切な環境のコンテキストを使用できるようにする)、コメント(チームメンバーとの直接的なコラボレーション)が含まれます。目標は、コンテキストをエージェントシステムのファーストクラス部品として管理しやすくすることです。
LangSmith Context Hub の使用方法
Context Hub を使用するには、まずスキルやその他のファイルをアップロードする必要があります。UI から手動で定義する、ローカルコンピュータからアップロードする、またはエージェントに作成させる方法があります。
手動定義:LangSmith UI で Context Hub を開き、新しいリポジトリを作成し、タイプ(スキルまたはエージェント)を選択してハンドルを設定し、UI エディタでファイルを作成し、コミットとして保存してタグを追加します。
ローカルからのアップロード:LangSmith CLI を使用します。認証後、ローカルでスキルフォルダをスキャフォールドし、ファイルを編集し、Context Hub にプッシュします。
エージェントによる作成:エージェント自身がコンテキストを作成できます。このアイデアは Karpathy の LLM wiki に端を発します。
コンテキストが存在すると、ローカルディスクへの同期、Deep Agents での仮想ファイルシステムとしての使用、永続的なメモリとしての利用など、複数の方法で使用できます。
LLM wiki の構築例
エージェントに調査タスクを与え、情報を収集・整理して Context Hub に保存するワークフローを構築しました。エージェントは要約、ソースノート、用語、例、および研究結果の使用方法を含むフォルダを作成します。Context Hub に保存されると、チームメンバーはレビュー、コメント、バージョンタグ付けを行い、他のエージェントが利用できるようにします。このパターンは、エージェントが永続的な知識を必要とし、時間とともに改善する場合に有用です。
Context Hub による継続的学習
本番環境のエージェントは、初期コンテキストが想定していなかったエッジケース、ミス、状況に遭遇します。継続的学習とは、実際の使用状況に基づいて行動を改善することでギャップを埋める方法です。実際には、その作業のほとんどはコンテキスト層(AGENTS.md、スキル、ポリシー、サンプル、メモリファイル)で行われます。Context Hub は、すべてをバージョン管理し、レビュー可能にし、将来の実行ですぐに利用できるようにすることで、継続的学習を実用的にします。エージェントの品質問題のほとんどは、指示、メモリ、またはポリシーの問題です。コンテキストファイルはモデルやハーネスの変更よりも迅速に反復でき、バージョン管理されたコンテキストと課題追跡を組み合わせることで、反復可能な改善ループが生まれます。
オープンメモリ標準
エージェントメモリは、エピソードメモリ(過去の対話)、セマンティックメモリ(ベクターまたはハイブリッド検索で取得)、手続きメモリ(指示、スキル、ポリシーの形式)のいくつかの一般的なカテゴリに分類されつつあります。しかし、エージェント、フレームワーク、データ層をまたいでメモリを保存、読み取り、更新、バージョン管理、移動するための共有方法がまだ不足しています。Elastic、MongoDB、Pinecone、Redis と協力して、エージェントメモリのオープンスタンダードを開発しています。AGENTS.md とスキルファイルは手続きメモリとして有用な慣習になっていますが、それらのバージョン管理、環境別タグ付け、エージェント間での移植性のための共有仕様はありません。本番データと検索ワークロードをサポートするパートナーとともに、メモリシステムが共有する必要があるインターフェース、メタデータ、バージョン管理パターン、検索セマンティクスを定義しています。