AI News HubLIVE
站内改写5 分で読了

モデル中立性:AIベンダーロックインを避ける重要性

モデル中立性がAIエージェントにとって重要な理由を探ります。ラボがハーネス層でどのようにロックインを行い、なぜ中立的なオープンソースフレームワークが答えなのかを解説します。

私たちは、ソフトウェア構築方法の世代交代を経験しています。およそ20年ごとに、ソフトウェアの構築方法が変わり、すべてのエンジニアリング組織が作業方法を再構築することを余儀なくされます。前回はオンプレミスからクラウドへの移行でした。次はエージェントであり、前回の移行とは異なり、今回は数ヶ月単位で、数年ではなく進行しています。

毎回の移行は、誰に依存するのか、ビジネスロジックのどの程度が単一ベンダーに囲い込まれるのか、離脱コストはいくらかという同じ疑問を生み出します。前回、企業はこれらの疑問に遅れて答えました。ロックイン、予測不可能な価格設定、失敗した移行という代償は、その後10年間にわたって支払われました。

私たちはモデルに関して全く同じことをしようとしています。私たちは前回の移行を生き抜いたばかりです。教訓はそこにあります。

クラウド時代の教訓

著者はHashiCorpでクラウド時代の真っ只中に何年も過ごしました。そこで学んだ最も重要なことは、クラウドロックインに関する表面的な話(障害、価格決定権、フェイルオーバー)は議論の簡単な部分に過ぎないということです。より深い話は、ハイパースケーラーが実際に何を売っていたかです。

彼らはコモディティを売っていました。ストレージ、ネットワーク、コンピュート。AWSストレージとGCPストレージは、バイトレベルでは区別できない製品です。そして、基盤となる製品がコモディティであるため、顧客に自社製品を使い続けさせる唯一の耐久性のある方法は、ツール層でロックインすることです。AWSのCloudFormation、AzureのARMテンプレート、GCPのVertex。これらのツールはどれも、競合他社の最高クラスの機能を同等にサポートする intrinsic な動機を持っていません。そうすることは、顧客が離れやすくするだけだからです。

Terraformの存在理由全体は、このツール層のロックインが現実的で、高コストで、悪化していることであり、正しい答えはその1つ上の層で中立的な抽象化を提供すること、つまり切り替える権利と、インフラを書き換えずに単一のデプロイメントでプロバイダーを混在させる能力であるということでした。

その議論は勝利しました。一度にではありませんが、勝利しました。早期に中立性を採用した企業は、ハイパースケーラーの価格設定に対抗できました。なぜなら、離脱が信頼できるものだったからです。また、障害を乗り切ることができました。なぜなら、フェイルオーバーが理論上のものではなかったからです。これらはいずれも単一ベンダーのスタックでは利用できません。

基礎モデル研究所は同じ戦略を採用している

次に、モデルで何が起こっているかを見てみましょう。

研究所はあなたにトークンを販売しています。トークンはコモディティであり、ますますその傾向が強まっています。フロンティアモデル間のギャップは狭まり、オープンウェイトモデルは急速に追いついており、百万トークンあたりの価格チャートは過去2年間着実に下降傾向にあります。研究所はそれを知っています。彼らはあなたと同じチャートを見ることができます。

したがって、彼らの次の一手は、ハーネス層で顧客を捕らえることであり、彼らが一度にそれを行っているのを見ることができます。Claude Agent SDK、OpenAIのAgents API、Vertex AI Agent Builder。すべて同じ形状です。彼らがビジネスロジックが存在するオーケストレーション層を所有すれば、他の場所に、より良く、より安く、より適切なモデルが存在しても、顧客は彼らのトークンを消費し続けます。

彼らには、自社のハーネスを競合他社のモデルを実行するための優れた体験にすることに対して商業的なインセンティブはありません。CloudFormationがGCPリソースを同等にプロビジョニングする理由は決してありませんでした。Claude Agent SDKには、GPT、Gemini、Llamaの呼び出しをファーストクラスに感じさせる理由はありません。研究所の観点からは、競合他社のモデルを自社のハーネス内でうまく機能させることは収益を損なうことです。彼らはそうしません。

ハーネスロックインはモデルロックイン自体よりも解消が難しいでしょう。なぜなら、ハーネスにはビジネスロジックが存在するからです。

なぜモデル中立性がクラウド中立性よりも重要なのか

教訓が同じであれば、対応も同じです。中立的なハーネスです。Terraformがクラウドに対して果たしたような層です。

モデル中立性は、クラウド中立性がこれまでに持ったよりも重要です。3つの理由があります。

第一に、変化の速度が根本的に異なります。アプリケーションをAWSからGCPに毎月移動することはありません。契約更新時か障害時に移動します。おそらく数年ごとです。しかし、研究所は四半期ごと、しばしば毎月、互いに追い越しています。単一のプロバイダーにロックインされたチームは、障害や価格設定にさらされるだけでなく、次の飛躍が起こるたびにその恩恵を受けられなくなります。

第二に、モデルは選択的にコモディティ化しています。研究所がハーネス層を競っているのは、まさに基本的な推論、一般的なQ&A、要約といった簡単な次元で生のモデルの差別化が侵食されているからです。しかし、どこでもコモディティ化しているわけではありません。Anthropicは現在、コーディングにおいて選ばれるモデルですが、OpenAIが差を縮めており、OpenAIはマルチモーダルでリードしています。ランキングは数ヶ月ごとに変わります。実際のプロダクションエージェントにおける正しい答えは、しばしば同じワークフロー内で複数のモデルを使用し、各タスクをその時点で最も得意なモデルにルーティングすることです。これは、偏りのないハーネスでのみ可能です。

第三に、オープンウェイトモデルは現実的な選択肢です。Llama、Mistral、DeepSeek、Qwen。セルフホスティングは、ほとんどの企業にとって「独自のプライベートクラウドを運用する」ことが実際には決してなかった方法で信頼できるものです。したがって、中立性は防御的なだけではありません。同じエージェント内でクローズドモデルとオープンモデルを混在させ、タスクに最も安く、速く、正確なものにルーティングし、より良いものがリリースされたらすぐに切り替えることができます。

さらに、モデル時代には、クラウドには存在しなかった別の層があります。クラウド中立性は契約更新時か障害時にのみ活用できるものでした。モデル中立性は、単一のエージェント実行中に行使できるものです。コーディングステップにClaudeを選び、画像ステップにGPTを選び、あるプロバイダーがレート制限をかけたときに実行途中でフェイルオーバーし、高価なモデルが正当化されない場合に安価なモデルにフォールバックする。クラウド中立性は契約で止まりました。エージェント中立性はリクエストに従わなければなりません。

中立的なハーネスが意味するもの

中立的なハーネスは3つの要素からなります。

  • オープンソース。すべてのコードを読むことができます。隠されたもの、静かにキャプチャされたもの、ベンダーのためにあなたを犠牲にして最適化されたものは何もありません。モデル研究所が提供するクローズドソースのエージェントフレームワークは、マーケティングが何を主張しようと中立ではありません。
  • マルチモデルが標準装備。同じハーネス、任意のバックエンド。GPT、Claude、Gemini、Llama、Mistral、DeepSeek、Qwen、そしてファイアウォールの背後でセルフホストするものすべて。1つのエージェント定義で、すべてのプロバイダーがファーストクラスです。なぜなら、どのプロバイダーも抽象化を所有していないからです。
  • プロファイル対応であり、最低共通分母ではない。中立性は、すべてのモデルが交換可能であるふりをする義務ではありません。すべてのフロンティアモデルには独自の個性があり、強み、プロンプトパターン、ツール呼び出しスタイルがあり、それらは一般化しません。優れた中立ハーネスはモデルプロファイルを公開し、それぞれのモデルの優れた点を活用できるようにしつつ、どれにも捕らわれないようにします。切り替える権利。平坦化の要件ではありません。

これがDeep Agentsで私たちが構築したものであり、LangChainが常に中核として持ってきたものです。それはオープンで、マルチモデルで、プロファイル対応です。単一のモデルプロバイダーを超えて持続するように設計されたハーネスです。

私たちは以前にこれをやりました

ハイパースケーラーはコモディティを販売し、ツール層でロックインしました。研究所はコモディティを販売し、ハーネスでロックインしようとしています。Terraformは、1つ上の層で中立的な存在になることでクラウド時代に勝利しました。中立的でオープンなハーネスは、モデル時代に対する同等の答えです。

違いは、今回の移行は前回よりも一桁速く進んでおり、間違えた場合のコストも一桁速く積み上がるということです。