AI News HubLIVE
サイト内リライト4 分で読了

AI成果カタログ:制度投資に値する耐久性のある標準規格

企業はAIで生産性向上を目指すが、大半のパイロットは失敗する。Agent Skills、MCP、プラグインなどのオープン標準への投資は、ベンダーロックインを防ぎ、切り替えコストを削減する。AI成果カタログは個々の成功を共有可能な組織知に変え、チーム間やエージェント間の再利用を促進する。

ソースO'Reilly AI & ML Radar著者: Tadas Antanavicius

企業はAIを活用して内部生産性を向上させようと躍起になっているが、成功例はRampやIntercomなど限られている。さらに複雑なことに、生産性向上を実現するツールの主流は絶えず変化している。ソフトウェアエンジニアにとって、2024年はGitHub Copilotの自動補完、2025年はCursor、2026年はClaude CodeやCodexといったコマンドラインベースのコーディングエージェントが台頭した。

ツールの流行は移り変わるが、多くは共通のプリミティブを共有し始めている。それは、ツールの機能を設定・誘導するためのオープン標準だ。Agent Skills、MCP(モデルコンテキストプロトコル)、プラグインは、ベンダーに依存しないメカニズムを提供するが、万能ではない。MCPサーバーへの接続方法は組織のセキュリティポリシーに依存し、あるチームのデザインシステム向けに作られたAgent Skillは他のチームにはそのまま流用できない。

組織内の個人がスキルやMCPサーバーを設定・構築して生産性向上を実現し始めると、次のステップはそれらの成功を共有可能で再利用可能な組織知に変換することだ。AI成果カタログはこのステップの出力である。これらは、従業員が現在手作業で行っている業務をつなぐ内部知識と接着剤を表現し、以下の両方を促進する。同僚に対しては、成果物をチーム間で共有することで生産性向上が組織全体に広がる。エージェントに対しては、Claude CodeやCodexなどのエージェントランタイムに、苦労して得たドメイン固有のガイダンスを装備することで、従業員は反復作業に費やす時間を減らし、エージェントシステムの構築に集中できる。

オープン標準の耐久性は重要だ。業界全体がAIソリューションを購入しようと殺到しているが、パイロットプロジェクトの95%は失敗している。Anthropicのツールに全面的に依存する(IntercomがClaude Codeで行ったように)場合、Anthropicが業界をリードし続ければうまくいく。しかし、広く採用されないスタートアップの製品に同じ決定を下すと、独自のデータモデルに行き詰まり、1年後にゼロから再構築する羽目になる。

別の道がある。オープン標準にコミットすることだ。Agent Skills、MCP、プラグインに投資すれば、単一ベンダーの倒産から保護されるだけでなく、来四半期にエンジニアが要求する主要なコーディングエージェントが再び変わっても、まったく影響を受けない。切り替えコストは独自スタックの場合の数分の一に低下する。

AI機能は驚くべき速さで進化しており、次のサイクルが何をもたらすか予測は難しい。しかし、これらのベンダーに依存しない標準化されたプリミティブがユニークなのは、それらが革新が構築できる概念であり、置き換えられる対象ではない点だ。私たちは今もWebの基盤であるHTTPの上に構築している。QWERTYキーボードはDvorakより劣るが、標準として今も普及している。JavaScriptはしばしば非難される言語だが、インターネットのフロントエンドのほぼ全体を支えている。

AIが構築コストを急速に低下させるにつれて、人と人、エンティティ間の調整コストは依然として高い。標準は希少で価値があり続ける。

AI成果物とその相対的な成熟度:標準の最も重要な側面は採用レベルだ。現在、内部AI変革を推進する主要ツールはClaude Code、Codex、Claude Cowork、AnthropicやOpenAIのエージェントSDKに集中している。これらのツールとの互換性を指標として、各成果物の状況は以下の通り:Agent Skills(スキル)とMCPサーバーはベンダー中立標準で最も高い採用。プラグインも高いが、CLIツールは標準化されていない。フック(Hooks)、ルート(Roots)、ルール(Rules)は中程度で、派生標準に依存する。

スキルはほとんどの組織知の生命線だ。Tim O'Reillyが述べたように、スキルは「各ツールをいつどのように使うかを調整する専門家のワークフローロジックと、LLMに文脈で適切な判断を下すためのドメイン知識」であり得る。スキルには複数のタイプがあるが、最も価値があるのは内部の専門知識をコード化したものである。この知識は多くの場合文書化されておらず、従業員の暗黙知として存在し、近い将来モデル訓練に取り込まれることもない。したがって、内部で作られたスキルの価値は公開されたものよりはるかに高い。

MCPとCLIツールは外部システムへの接続層だ。MCPにはServer Card、server.json、そして近々登場するmcp.jsonといった確立された規約がある。CLIは独自のカタログ形式が必要で、MCPほど構成可能ではない。MCPは非常によく採用され、ほとんどのエージェントフレームワークとネイティブ互換性がある。

フックは、非決定論的なエージェントセッションに決定論的な機能を注入するのに便利で、例えばセッションのトランスクリプトをキャプチャして後でレビューしたり、チーム内でどのスキルが呼び出されたかを分析したりできる。フックは独自の標準を持たず、Open Plugins標準に組み込まれている。主要なコーディングエージェントのほとんどがサポートするが、実装にばらつきがある。

ルールはCursorによって普及し、コンテキストの断片を注入できるが、機能的にはスキルやAGENTS.mdファイルでモデル化できるため、長期的に存続するかは不明だ。ルートはエージェントのファイルシステム上の開始点で、Gitリポジトリ内のフォルダーなどであり、AGENTS.md標準に暗黙的に含まれる。

プラグインは上記の複数の成果物をバンドルしたものである。Vercelが主導するOpen Pluginsイニシアチブが仕様を固めている。Claude Codeのプラグインマーケットプレイスは事実上の配布メカニズムになりつつある。Intercomのように、スキルやフックを個別にカタログ化せず、すべてプラグインにインライン化する企業もある。ほとんどのエージェントツールエコシステムはプラグインに概ね合意しているが、PiとOpenCodeは例外だ。

豊かで実用的なカタログこそが、AIの成功事例と繰り返される失敗を分けるものだ。プラグインに全面的に賭けるか、成果物タイプごとに詳細なカタログを構築するかは自由だが、重要なのは共通言語を確立し、チームがシームレスに連携し、AIの未来に興奮できるようにすることだ。