AI価値の獲得
エージェントAIの急速な採用により、トークンの価値と需要が大幅に増加し、AnthropicなどのAIラボが大きな価値を獲得しています。エンドユーザーや推論プロバイダーは利益を得ていますが、TSMCとNVIDIAはブームにもかかわらず価格調整を行っていません。
2025年12月以降、エージェントAIが実際に機能し始め、AI業界の価値構造を変えました。過去数か月で、エージェントAIは重要な転換点を超え、トークンの価値が大幅に上昇する一方、ハードウェアとソフトウェアの改善によりトークン生成コストは急激に低下しました。ユーザーはトークン消費から大きな投資収益率を得ており、需要の爆発的成長はまだ初期段階に過ぎません。例えば、AnthropicのARRは90億ドルから440億ドル以上に急増し、推論インフラの粗利益率は38%から70%に上昇しました。
エンドユーザーは生産性の恩恵を享受しています。以前は数十人時間と数千ドルを要したタスクが、今では数分とわずか数ドルのトークンで完了できます。この収益と利益の急増は、トークンが生み出す価値がビジネスを劇的に改善しているためです。例えば、SemiAnalysisはAnthropic Claudeトークンに年間最大1095万ドルを費やしていますが、その価値により競合他社を凌駕し市場シェアを拡大しています。
供給側では、Blackwellなどの新しいチップはHopperと比較して1秒あたり30倍のトークンを生成でき、TPUv7やTrainium 3などのASICも同様の改善を示しています。Fireworks、Baseten、Falなどの推論プロバイダーは利益率を拡大し、収益は超成長を遂げています。ハードウェアコストも再評価され、メモリ価格は過去1年で6倍に上昇し、GPUレンタル料金も急騰しています。
しかし、業界で驚異的な価格決定力を持つ2社、TSMCとNVIDIAはまだ動いていません。彼らは古い前提に基づいて運営されており、コンピューティング単位あたりの支払い意欲は時間とともに低下するという想定がもはや成立しません。エージェントAIにより需要は線形から複合成長へと変化しました。
本記事では、エンドユーザーから推論プロバイダー、Neocloud、ハードウェアプロバイダーに至るまで、AIからの価値がどこに蓄積されているかを探ります。TSMCとNVIDIAがどのようにしてエコシステムのあらゆる垂直分野に莫大な価値を放出しているかを明らかにします。最後に、「すべてを統治する1つのチャート」という新しいフレームワークを導入し、GPUレンタル経済学を分析して、AIエコシステムで誰が最も価値を獲得しているかを検証します。
AI価値の利益プール:2023年から2025年まで、AIのすべての価値はインフラ層に獲得されました。NVIDIAは2023年5月の決算発表で25%上昇し、AI取引の始まりを告げました。2024年にはVistraとGE VernovaがS&P500でトップパフォーマンスとなり、電力が重要なボトルネックであることが認識されました。2025年にはメモリが主役となり、SanDisk、Western Digital、Seagate、Micronが年間200%以上の上昇を記録しました。一方、モデル作成者と推論プロバイダーの粗利益率は低く、AIの実用性はせいぜいチャットインターフェースに閉じ込められたGoogle検索の改良とスタジオジブリ風の自撮りに過ぎませんでした。懐疑論者はAIが数兆ドルの設備投資を実現できないと主張しました。
エージェントAIがゲームを変えた:2025年12月、エージェントAIが実際に機能し始めました。SemiAnalysisはClaude Codeを多用しており、エージェントはもはやコーディングに限定されません。アナリストは毎日エージェントを使用してExcelモデルをダッシュボードに変換し、チャートを作成し、財務モデルを構築し、企業収益を分析しています。SemiAnalysisの年間トークン支出は従業員報酬の約30%に達し、従業員1人あたり月間約50億トークンを消費しています(Metaの5倍以上)。各トークンの価値は明らかに増加しており、Opus 4.7のエージェントタスクにおける実際の混合価格は100万トークンあたり0.99ドルと推定されます(定価は5/25ドル)。これはエージェントワークロードの入力対出力比が非常に高く(約300:1)、キャッシュヒット率が90%以上であるため、ほとんどのトークンが最も安い階層に分類されるからです。
トークン生産コストの低下:トークンの生産コストは急落しており、これが推論プロバイダーの価値増大の最大の原動力です。アクセラレータの価格は世代ごとに上昇していますが、はるかに高いスループットによって相殺されています。B300ではソフトウェア最適化のみでスループットが14倍向上し、ハードウェア改善も加えると、GB300 NVL72構成はFP8でH100比17倍、FP4では32倍のスループットを達成しますが、GPUあたりの総所有コストはわずか70%高いだけです。
モデルプロバイダーの利益率は上昇を続ける:AnthropicはOpus 4.5の価格を引き下げましたが、TrainiumとNVIDIA GPUのソフトウェア改善、およびHopperからBlackwellへの移行により、実際にはOpusトークンの利益率が向上しています。Anthropicはコスト削減で利益率を拡大し、より高価なSKUに需要をシフトさせています。Opus fastは通常のOpusの6倍、Mythosは5倍の価格ですが、AIに積極的な企業は生産性向上がコストを上回るため喜んで支払います。
モデルプロバイダーの利益が競争で奪われない理由:第一に、フロンティアモデルは価格決定力を維持しており、オープンソースモデルは現実の知識作業では依然として劣っています。第二に、計算制約により単一のラボが市場全体にサービスを提供できず、トークン需要は供給を大幅に上回ります。
TSMCとNVIDIAはまだ動かない:ジェンセンのGTC基調講演でエージェントAIが強調されたにもかかわらず、NVIDIAとTSMCはここ数か月のトークン経済の変革を完全には理解していません。彼らは時間とともにコンピューティング単位あたりの支払い意欲が低下するという古い前提で運営されていますが、その前提はもはや成り立ちません。需要は複合成長しており、AnthropicのARRは440億ドル以上に達し、オープンウェイトモデルも計算基盤を拡大しています。これらの企業は莫大な価値をエコシステムのあらゆる垂直分野に放出しています。