AI News HubLIVE
站内改写4 分で読了

AIコスト危機にようやく監視役が登場——ただし原因企業は含まれず

Linux Foundationは、AIトークン消費の経済学に関するオープンスタンダード、ベンチマーク、ベストプラクティスを策定するTokenomics Foundationの設立を発表した。Google、Microsoft、IBMなど多くの企業が支援する一方、OpenAIやAnthropicなどのフロンティアモデルプロバイダーは参加していない。トークン使用量の急増とコスト上昇の中、同財団はAI支出の透明性と標準化を目指す。

ソースThe New Stack AI著者: Paul Sawers

AIは企業にとって最大かつ最も理解が難しいテクノロジー支出になりつつあり、支出はアカウンタビリティを大幅に上回っている。こうした背景から、Linux Foundationは水曜日、AIトークン消費の経済学に関するオープンスタンダード、ベンチマーク、ベストプラクティスを策定する新組織「Tokenomics Foundation」の設立を発表した。財団は6月下旬にサンディエゴで開催されるFinOps Xで正式に発足し、リーダーらが技術ロードマップと関連ワーキンググループの詳細を共有する予定だ。Google、Microsoft、IBM、JPモルガン・チェース、KPMG、Oracle、Salesforceなど、業界の幅広いセクターから初期支援を得ている。

トークンとは、AIモデルが処理するテキストの単位であり、AI経済のあらゆる層の中心に位置する。モデルはこれで思考し、データセンターはこれで課金し、企業は最終的にこれに対して支払い、価値を引き出す。しかし、トークンは財務チームがこれまで扱ってきたどのコストカテゴリーとも異なる行動を示す。クラウドでさえ、飼いならすのに数年を要したが、より予測可能な使用パターンがあった。

4月には、フィンテック大手のRampが、AIプロバイダーからトークンレベルのデータを取得し、財務チームがAIコストの生成と配分を可視化できるようにすると発表した。これは、従来のソフトウェア契約とは異なり、AIコストが消費に結びつき、急速に拡大する可能性があるという緊張の高まりに対応したものだ。Rampの内部データによると、2025年1月以来、月間平均トークン支出は13倍に増加し、ヘビーユーザーでは1四半期で50%以上コストが跳ね上がっている。ゴールドマン・サックスが5月に発表したデータもこれを裏付けており、世界のトークン使用量は2026年から2030年にかけて24倍に増加し、月間120京トークンに達すると予測している。

この軌道はすでにAI製品の価格設定と販売方法を変えつつある。GitHubが今週、Copilotの定額制サブスクリプションモデルを廃止し、トークンベースの課金に移行したことは、旧来の経済学が持続不可能になった最も明確な兆候だ。エージェンティックなコーディングセッションが長期化・高負荷化するにつれ、GitHubはその使用量の背後にある推論コストの多くを吸収していたが、これが持続不可能になった。GitHubの変更に対するコミュニティの反発は急速で、一部のCopilot加入者は「ベイトアンドスイッチ」と特徴づけ、予想月額料金が一夜で10倍に跳ね上がったと報告している。

Tokenomics Foundationはまさにこの不安に対処するために設計されている。買い手と売り手の双方にとって現在不透明なコスト構造に秩序をもたらすのだ。FinOps Foundationのエグゼクティブディレクター、J.R. Storment氏はThe New Stackに対し、断片化が核心的な問題だと語る。「各ハイパースケーラー、各モデルプロバイダー、各ハードウェアプロバイダーは独自のアプローチ、データ、価値指標を持っています。私たちは以前に行ったように、それらの間で一貫したモデルを調整することを目指しています」。

Tokenomics Foundationは、2020年からLinux Foundationの一部としてクラウドコスト管理に関する共有の規律を構築してきた非営利団体FinOps Foundationと緊密に連携する。同じ考え方をAIにも適用し、FinOpsがクラウド請求にもたらしたのと同じ厳格さをトークン支出にもたらすことが期待されている。しかし、その類推は限界がある。トークン経済は、クラウドにはなかった複雑さの層を導入する。入力トークンと出力トークンでは価格が異なり、キャッシュされたトークンはさらに異なる方法で課金され、プロバイダー間の価格設定構造は十分に異なるため、ベンダー比較が非常に難しい。

発表に伴うプレスリリースで、Salesforceの最高可用性責任者Nishant Gupta氏は、トークン経済学はクラウドコスト管理よりも本質的に難しい問題であり、業界が集合的に実験し知見を共有する必要があり、個々の企業が孤立して再発明するのを避けるべきだと論じている。「トークン経済学は、これまでこの規模で管理してきたどのものよりも根本的に抽象的で不透明です。クラウドのために業界が構築したものとは異なる運用筋肉が必要であり、その筋肉は業界全体の幅広い実験を通じて進化し、最良のアイデアと実践が還元されて、永続的な基準を共同で確立するべきです」。

運用の詳細の多くはまだ発表されていないが(さらなる詳細は6月8日のFinOps Xで予定)、財団の大まかな構造はすでに形になりつつある。技術委員会は、トークンコストの測定と報告のための共通仕様とベンチマークに取り組み、すでにクラウドプロバイダー間で使用されているオープンな課金フォーマットであるFOCUSをAIトークン支出に拡張することも含まれる。運営委員会は戦略的方向性を設定し、リソースを割り当てる。

創設支援者リストはAI経済の広がりを網羅している。アクセンチュア、Booking.com、Flexera、Google Cloud、IBM、JPモルガン・チェース、KPMG、Microsoft、Oracle、Salesforce、SAP、ServiceNowが暫定的に署名している。ただし、GoogleやMicrosoftなどがどのような金銭的支援を提供しているか尋ねられた際、財団のスポークスパーソンは、まだ当事者間で評価中であると述べた。

注目すべきは、問題の核心にあるフロンティアモデルプロバイダーが欠席していることだ。AnthropicもOpenAIも初期支援者に含まれていない。そしてこれは重要である。最近のトークン価格危機の分析が示すように、企業予算はすでにフロンティアモデルのコストに押しつぶされつつある。UberのCTOは最近、同社が2026年のAI予算全体をわずか4ヶ月で使い果たしたことを明らかにし、その主な要因はエンジニアリング組織全体でのClaude Codeの採用急増だった。Linux Foundationが対処しようとしているのはまさにこの種のプレッシャーである。組織には現在、支払うべき金額を測定し、プロバイダー間のコストを比較し、AI導入について情報に基づいた決定を下すための一貫したベンダー中立的な方法がない。

ただし、部屋の中の象を無視することはできない。トークン価格はモデルとベンダー間で大きく異なる。入力トークン、出力トークン、キャッシュトークン、異なる乗数、まったく異なる構造。その全体にわたって共通基準をどのように構築し、そのテーブルにいないフロンティアモデルプロバイダーにどのように受け入れさせるのか?Storment氏は、クラウドの先例が参考になると主張する。ハイパースケーラーはFOCUSの作成には参加しなかったが、顧客が要求したため全員が採用した。「私たちはクラウドで既にこれをやり遂げました。クラウド課金データの一貫したフレームワークと仕様を公開し、今ではすべてのハイパースケーラーがその標準をサポートしています。クラウドプロバイダーは初日から部屋にいたわけではありませんが、顧客がそこにいたため、全員が参加しました。ここでも同じパターンが期待されます」。

おそらく標準自体よりも重要なのは、誰がテーブルに着いているかである。世界最大のAI消費者の一部が同じ部屋にいる今、財団は市場が各ベンダーが一方的に課すものに固まる前に、共有フレームワークを確立する機会を得ている。Storment氏は付け加える。「大規模なトークン消費者が集まり、トークンベースのサービスの消費を最大化するための最善のアプローチに合意することは、フレームワーク、メトリクス、効率的な使用のためのガイダンス、そして価値とビジネス成果を促進する上で最も迅速な勝利となるでしょう」。