AI News HubLIVE
站内改写

ハーネス、スキャフォールド、そしてAIエージェント用語の正しい理解

本稿はAIエージェント分野で混同されがちな用語、特に「ハーネス」(実行層)と「スキャフォールド」(行動定義層)の違いを明確にし、モデル、エージェント、ツール使用、サブエージェント、訓練関連概念を解説する。

記事インテリジェンス

エンジニア中級

要点

  • AIエージェント=モデル+ハーネス。ハーネスはモデル呼び出しとツール実行を管理する。
  • スキャフォールドはモデルを取り巻く行動定義層:システムプロンプト、ツール記述など。
  • コンテキストエンジニアリング、ポリシー、スキル、サブエージェントはエージェントシステムの重要要素。
  • 訓練にはRL環境、トレーナー、ロールアウト、報酬が含まれる。

重要な理由

このニュースが重要なのは、AIエージェント=モデル+ハーネス。ハーネスはモデル呼び出しとツール実行を管理するためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

人工知能の分野が急速に進化する中、用語の理解は共通認識に追いついていない。特にAIエージェント領域では「ハーネス」と「スキャフォールド」が混同され、新規参入者や実務者を悩ませている。本稿はICLR 2026での議論を基に、これらの概念を整理し、実用的な思考モデルを提供する。

**モデル**は言語モデル(LLM)そのものであり、単独では記憶もループも持たない。モデルはツール呼び出しの意図を表現できるが、実際に実行するにはハーネスが必要である。モデルをスキャフォールドとハーネスで包むことでエージェントとなる。

**スキャフォールド**はモデルを取り巻く行動定義層であり、システムプロンプト、ツール記述、出力解析方法、コンテキスト管理を含む。これがモデルの世界認識と行動を形作る。Claude CodeやCodexなどの製品は非モデル部分全体を「ハーネス」と呼ぶことがあるが、厳密にはスキャフォールドとハーネスは異なる。

**ハーネス**はエージェント内部の実行層であり、モデル呼び出し、ツール実行の処理、停止判断を行う。ハーネス工学はこの層を適切に設計する学問で、停止条件、エラー処理、ガードレールを含む。評価時には評価ハーネスとして機能する。コミュニティでは「エージェント=モデル+ハーネス」という式が一般的である。

**エージェント**は強化学習に由来する用語で、LLMの文脈ではモデルとそれを取り巻くすべてのコンポーネントからなるシステムを指す。コードエージェントを例にとると、システムプロンプトやツール記述がスキャフォールドを形成し、モデル呼び出しとツール処理のループがハーネスである。同じモデルを使ってもハーネスの設計次第で体験は大きく異なる。

**コンテキストエンジニアリング**はエージェントのコンテキストウィンドウに含める内容を設計することである。短期記憶(セッション内)と長期記憶(セッション間)が含まれる。**ポリシー**はエージェントの行動確率を定義するが、モデル重みだけでなくスキャフォールドやハーネスにも依存する。ポリシーはエージェントそのものではない。

**ツール使用**によりエージェントはAPIやコードインタプリタなどの外部資源を利用できる。モデルは構造化形式でツール呼び出し意図を表現し、ハーネスがそれを適切な関数にルーティングする。**スキル**は再利用可能な多段階タスクパッケージであり、**サブエージェント**は独立したモデルとスキャフォールドを持つ子エージェントである。

訓練面では、**RL環境**はエージェントが相互作用する有状態オブジェクトであり、**トレーナー**(例:TRLのGRPOTrainer)は多数のエピソードを実行して重みを更新する。**ロールアウト**は開始から終了までの完全な実行記録であり、**報酬**は検証可能、学習可能、疎または密の形態があり、訓練アルゴリズムに改善方向を伝える。ルーブリックは報酬を重み付きの次元に分解する。

これらの用語の正確な理解は、効果的なAIエージェントシステムの構築と展開に不可欠である。本稿が議論の基盤となり、さらなる定義の洗練に貢献することを願っている。