AI News HubLIVE
サイト内リライト5 分で読了

AIトークンが企業のクラウド請求書を再び天井知らずに引き上げる理由

AIの利用はトークンベースの課金に移行しており、以前の定額モデルよりもはるかに高額です。AIから得られる価値を測定することは未解決の問題のままです。FinOps X 2026では、専門家がトークンをAIの原子単位と宣言し、トークン単価は低下したものの、使用量の急増により総支出は高騰しています(ジェボンズのパラドックス)。企業はAIトークンコストを管理し、ビジネス価値に結びつけるための新しいFinOpsフレームワークを急いで構築しています。

ソースZDNet AI

ZDNetの報道によると、AIトークンが企業のクラウド請求書の新たな痛点になっています。サンディエゴで開催されたFinOps X 2026カンファレンスで、専門家はAIの価格設定が損失覚悟のユーザー獲得時代を終え、トークンベースの課金モデルが生成AI経済の基盤となりつつあり、従来モデルよりもはるかに高コストであると指摘しました。多くの企業顧客は、クラウド初期の予測不能な請求書やビジネスモデルの変動を思い起こさせると不安を感じています。

トークン:AIの「原子単位」

FinOps Foundationのエグゼクティブディレクター、J.R. Storment氏はトークンを「AIの原子単位」と呼びます。基調講演で同氏は、トークンが現代経済において20世紀の石油をも上回る役割を果たす可能性があると述べました。トークンは同時に、ハードウェアと計算リソースの出力単位、AIラボの価格設定単位、そして企業が収益化を目指す価値単位でもあります。この抽象性こそが、AIラボとハイパースケーラーに好まれる理由です。GPUタイプやメモリ、電力消費に直接課金する代わりに、「100万トークンあたり」という統一単位で課金し、入力トークンと出力トークンを区別します。

トークンとは一体何でしょうか?Storment氏は、トークンは大規模言語モデルがテキストを処理する際に分割できる最小単位だと説明します。英語の場合、1トークンは約4文字、つまり約4分の3単語に相当します。しかし、この単純な単位の背後には、モデル選択、量子化、キャッシュ戦略、エージェント使用など、膨大な複雑さが隠されており、FinOpsチームが解読すべき課題となっています。

「無制限トークン」時代の終焉

2023年から2025年初頭まではAI実験の低コスト時代でしたが、過去18か月で企業は厳しい現実に直面しています。Storment氏は3つの明確なフェーズを説明しました。ChatGPT以前の「旧AI時代」、チャットボットがまともなコードを書けた「良い旧時代」、そして2025年11月以降のモデル性能が大幅に向上した新世界です。「良い旧時代」には、企業は無制限トークンのサブスクリプションを享受し、「トークン最大化」競争さえありました。今日、トークンリーダーボードは過去のものとなり、誰もトークンを無駄にする余裕はありません。アマゾンの上級副社長Dave Treadwell氏は、「AIを使うためだけにAIを使わないでください」と懇願しました。

Storment氏によると、2025年6月から11月にかけて世界のトークン使用量は線形的に増加しましたが、新しいモデルとエージェントパターンの登場で状況は一変しました。コンテキストウィンドウは数千から数百万トークンに拡大し、エージェントパターンはループ、リトライ、修正を導入して使用量を爆発的に増加させました。企業はこの行動を喜んで補助していましたが、請求書を見て驚愕しました。月額200ドルのパワーユーザーが、実際には数万ドルのコストを生み出していたのです。例えば、SemiAnalysisは、Anthropicの200ドルプランが以前は8,000ドル相当のClaudeトークンを提供し、OpenAIの同様プランは14,000ドル相当のCodexトークンを提供していたと推定しています。こうした日々は終わり、企業はAIトークンの実際のコストを支払わなければなりません。

Storment氏は「今最も重要なのはAI価値です。価値を私たちの活動に戻さなければなりません」と強調しました。トークンはあらゆるものを測定する基準となり、世界のトークン経済を牽引しています。

トークン価格が暴落しない理由

ムーアの法則とハイパースケール競争だけが働けば、トークン価格は下がり続けると予想されます。実際、2023年以来トークン価格は大幅に低下しています。SAPのデータも単位コストの低下傾向を示しています。しかし、両者は価格の下限が近づいていると警告します。Storment氏は、2025年11月以降、主要ラボのトークン価格はほぼ横ばいであり、これはハードウェアと電力の制約に直接起因すると指摘します。「十分なハードウェアも電力も得られず、バックログ、長期コミットメント、不足が発生しています。」IntelのCEOは、GPUと関連部品の供給が2028年まで本格的に緩和しないと予想しています。SAPのFrederik Pohl氏も、サプライチェーンの制約とハードウェア価格の上昇により、最先端モデルのコストがますます高くなっていると述べています。

結果は古典的なジェボンズのパラドックスです。単位コストは低下する一方、総支出は爆発的に増加します。Pohl氏は「これは有名なパラドックスです。当社の規模では単位コストが低下しているにもかかわらず、一部の月では支出が倍増しました」と語ります。ゴールドマン・サックスは、世界のトークン使用量が現在の6兆から約3.5年後には120兆に増加すると予測しています。仮に供給が緩和されてトークン価格がさらに下落しても、24倍の使用量増加に追いつくことは難しいでしょう。

FinOps、トークン経済を発見

クラウドの適正規模化とリザーブドインスタンスに精通したFinOpsコミュニティにとって、トークン課金は馴染み深いと同時にまったく異質です。馴染み深いのは、従量課金で、請求額が大きく、予測が難しい点です。異質なのは、単位がインフラではなく言語に結びついており、モデルリリースと同じ速さで変化する点です。Pohl氏は「AIはクラウドのプレイブックを拡張するだけでなく、それを壊します。AIはクラウドがデータセンターにもたらした変化よりも大きな違いを生み出しています」と断言します。CPUと異なり、AIモデルはそれぞれ独自の強みとコスト構造を持ち、LLMの交換は価格決定だけでなく、出力品質の決定でもあります。

SAPの経験は、企業がどのように再構築しているかを示すケーススタディです。同社のBusiness AIプラットフォームは、複数のLLMとハイパースケーラー上で稼働しています。SAPが初めてAIコストデータを探したとき、「すぐに壁にぶつかりました」とデータサイエンティストのMaida Nazifi氏は振り返ります。既存のツールはモデルごとの使用量を区別できず、手動でデータを抽出しテーブルを結合して初めて全体像を得ました。このデータはCTOに届き、数日で「興味深い」から「定期的なレポートが必要」に変わりました。Pohl氏はFinOpsの教訓を述べます。「CTOが数字を求めてきたら、それは質問ではなく命令です。」

SAPはこれを受けて、3本の柱からなる内部AI FinOpsフレームワークを構築しました。支出可視性(何を、どのように、どこで消費しているか)、経済性(入出力比、キャッシュトークン比、トークン対支出ドリフトなどのトークンレベル指標で効率を測定)、価値(AI支出をビジネス成果に結び付け、「ユースケースあたりコスト」と「収益あたり推論コスト」でAI機能の経済的実現可能性を判断)です。Pohl氏は「すべてのトークンはそのコストを稼ぎ出さなければならない」と述べ、NVIDIA CEOのジェンスン・ファン氏の「トークンファクトリー効果」という言葉を引用しました。

トークノミクス:単なるカウントを超えて

FinOpsがコスト管理と説明責任に関するものなら、トークノミクスはトークンを経済的財としての全ライフサイクルを扱います。Storment氏はこれを「エネルギーと資本をAIトークンとリソースに変換し、それらのトークンを消費して効率的なインテリジェンスを駆動し、最終的に価値を創出する新興の学問」と定義します。これは3つのバケットに分かれます。生産(クラウドデータセンター、エッジデバイス、さらには宇宙データセンターでトークンを作成)、消費(割り当て、予測、最適化。これはAI向けFinOpsに似ている)、価値(トークンをどう収益化するか、コストに基づいて価格を調整するか、全社的な労働への影響)です。

最後のバケットはSaaSビジネスモデルに直接影響します。Storment氏はインタビューで、トークン課金がフォーチュン100企業の価格設定モデルを変えていると述べました。彼はMicrosoftのGitHubがCopilotをより明確な使用量ベースの課金に移行した例を挙げ、無制限トークンを愛した開発者が怒りを感じていると指摘します。AIラボ自体も、無制限トークンを制限したり価格を調整するなど、規制を強化しています。Storment氏は最後に、企業はトークンの価値を測定する再現可能なシステムを構築しなければ、制御不能な支出に直面すると強調しました。