アマゾンのAI復活:AWSとAnthropicによるマルチギガワットのTrainium拡大
2年半前、SemiAnalysisはAWSの「クラウド危機」を警告した。今やその証拠は積み上がり、Azureが四半期の新規クラウド収益でリードし、Google CloudがAWSとの差を縮めている。しかしSemiAnalysisは逆張りでAWSのAI復活を予想し、中心的な原動力はAnthropicとの提携だ。Anthropicの2025年の収益は10億ドルから50億ドル(年率換算)に急増し、AWSは同社向けに1.3ギガワット超のデータセンターを建設、約100万個のTrainium2チップを搭載する。Trainium2はスペック面でNvidiaに劣るものの、TCOあたりのメモリ帯域で優位性があり、Anthropicの強化学習ロードマップに適合する。この協力関係はカスタムシリコンプログラムへと発展し、2025年末までにAWSの成長率を20%超に押し上げるとみられる。
2年半前、SemiAnalysisはAWSに迫る「クラウド危機」を警告しました。今やその証拠は積み上がっています。AWSはアマゾン帝国の王冠の宝石であり、グループ利益の約60%を生み出し、利益率の高いクラウドコンピューティング市場を支配しています。しかし、新しいGPU/XPUクラウド時代において、この強みを活かすことに苦戦しています。マイクロソフトのAzureは現在、四半期の新規クラウド収益で市場をリードし、Google CloudとAWSの差は大幅に縮小しています。特にGoogleはTPUで大きく動いており、市場もそれに気づいています。年初来、アマゾンは4大テクノロジー・AI企業の中で明らかに劣後しており、投資家はAIでの勢いを失ったとして最も評価を下げています。
しかし本日、SemiAnalysisは再びコンセンサスに反する予想を発表します。市場が「クラウド危機」テーマを過大評価する一方で、私たちはAWSのAI復活を予想します。1か月前にCore Researchの購読者に提示した通り、2025年末までに年率20%超の成長加速を予測しています。
アマゾンの救世主の名前はAnthropicです。このスタートアップは2025年の生成AI市場で明らかにアウトパフォームしており、年初来収益が5倍に増加し、年率50億ドルに達しました。この軌道を維持するため、Anthropicはスケーリング則に大きく賭けています。DarioのスタートアップはOpenAI、xAI、Meta Superintelligenceほど注目を集めていませんが、投資を惜しみません。AWSはアンカー顧客のために、最終建設段階にあるデータセンター容量が1ギガワットを超えています。AWSは史上最速のペースでデータセンターを建設しています。そして、さらに多くの計画が地平線にあります。
これらの施設の特異性は内部にあります。世界最大の非Nvidia AIチップクラスターを収容し、最大のキャンパスには100万近くのTrainium2が設置されます。Trainium2は多くの点でNvidiaのシステムに劣りますが、AWS/Anthropicのマルチギガワット取引において極めて重要でした。TCOあたりのメモリ帯域幅の優位性が、Anthropicの積極的な強化学習ロードマップに完璧に適合します。Dario Amodeiのスタートアップは設計プロセスに深く関与しており、Trainiumロードマップへの影響力は今後さらに拡大します。簡単に言えば、Trainium2はAnthropicのカスタムシリコンプログラムに収束しつつあります。これによりAnthropicは、Google DeepMindと並んで、近い将来に緊密なハードウェア・ソフトウェア協調設計の恩恵を受ける唯一のAIラボとなります。
本レポートでは、アマゾンのAI復活のあらゆる側面(Anthropicとの提携、データセンター、Trainium)を掘り下げます。レポートの最後には、Anthropic、AWS Bedrock、内部モデルに関する長期的見通しを提供し、なぜすべてが順調ではないのかを説明します。
まず、AWSがこれまで競合他社のAIクラウドに劣後してきた理由を振り返ります。生成AI時代におけるアマゾンのパフォーマンス低迷の原因を理解するために、GPU/XPUクラウド市場の成功要因を分析します。最も単純化すると、GPU/XPU容量の顧客には2つの主要グループがあります。卸売りのベアメタルユーザー(OpenAI、Anthropic、ByteDanceなどの大規模顧客)と、マネージドSLURM/Kubernetesユーザー(スタートアップ、研究機関、企業パイロットプロジェクトなど)です。第2のカテゴリでは、ClusterMax AIクラウドレーティングが相対的な強みと弱みを比較する最良の方法です。プラチナおよびゴールド評価のAIクラウドは他の追随を許さず、平均以上の価格決定力を誇ります。そのため、CoreWeave、Oracle、Nebius、Crusoe、Azureなどは、マルチテナントGPUクラスター(高性能で高度なソフトウェア層が必要)で市場をアウトパフォームしてきました。
2年前に予測された通り、アマゾンのパフォーマンス低迷の鍵はカスタムネットワークファブリックEFAの使用です。フロントエンドネットワークでのENAの成功は、バックエンドのEFAにはまだ転換されていません。EFAは依然として、NVIDIAのInfiniBandやSpectrum-X、Cisco、Arista、JuniperのRoCEv2などの他のネットワーキングオプションに性能で劣っています。生のパフォーマンスだけでなく、EFAのユーザーエクスペリエンスもInfiniBandやRoCEv2ほど良くありません。とはいえ、アマゾンの最新EFAv4は実際のメッセージサイズでの性能が改善されていますが、それでも競合に劣ります。アマゾンのカスタムネットワーキングは、Nvidiaシステムのカスタマイズ要件により市場投入までの時間も長くします。また、高度なパッシブおよびアクティブな自動週次ヘルスチェック戦略などの他の項目も、ゴールドやプラチナ評価のクラウドほど堅牢ではありません。
AWSのXPUビジネス成長にとってより重要なのは、アンカー顧客を獲得できるかどうかです。これこそが生成AI需要の第一波におけるマーケットメーカーです。規模、市場投入までの時間、深いパートナーシップ、価格設定が、高度なソフトウェア層以上にこれらの顧客を獲得する鍵です。この点を最もよく示す企業はマイクロソフトです。AzureのAIにおける優位性は、OpenAIとの提携によって完全に説明されます。2025年第2四半期現在、OpenAIの1000億ドルを超えるクラウド支出はすべてAzureに計上されています。アマゾンはアンカー顧客の必要性を早くから理解し、2023年9月にAnthropicに12.5億ドル(最大40億ドルに拡大可能)を投資しました。2024年3月には提携が拡大し、AnthropicはTrainiumおよびInferentiaチップの使用を約束しました。2024年11月には、アマゾンは追加で40億ドルをAnthropicに投資し、AnthropicはAWSを主要なLLMトレーニングパートナーに指名しました。
アマゾンの賭けは正しかったのです。Anthropicは2025年の生成AI市場で明らかにアウトパフォームし、収益は10億ドルから年率50億ドルへと急増しました。この文脈では、AWSのパフォーマンス低迷は当然投資家を苛立たせますが、彼らはAnthropicのトレーニングと推論への支出構成を誤解しています。アマゾンがAnthropicとの関係から真の恩恵を受けていない理由は明確に2つあります。2025年第2四半期時点で、Anthropicのクラウド支出はOpenAIの半分強であること。そして、Anthropicの支出のかなりの部分がGoogle Cloudに向かっていることです。Google CloudはAnthropicの初期の主要投資家(2022年末の3億ドルラウンド)であり、2023年から2024年までは、AWSとの拡大取引以前の優先クラウドパートナーでした。
特に、Anthropicの急増する推論ニーズの大部分はGoogle Cloudが満たしていると考えられます。世界最高の推論システム(TPU)を持つことは、重要な競争優位性です。AWSのインフラ構築は、主要顧客向けにこのシェアを獲得し、同時にトレーニングに焦点を当てることを目的としています。Anthropicは同業のOpenAI、xAI、Metaほど話題になりませんが、AGIレースに全力を注いでおり、トレーニング支出を惜しむつもりはありません。Anthropicのリーダーシップは、強化学習のためのスケーリングを真に信じています。その信念は今年中に具体化します。最終建設段階にある3つのAWSキャンパスを示します。これらのキャンパスは1.3ギガワット超のIT容量を誇り、Anthropicのトレーニングニーズにのみ対応します。建設速度は驚異的です。
これらのデータセンターは空から見ると完成しているように見えますが、まだ意味のある収益を生み出していないと考えています。Trainiumは組み立て段階でいくつかの歩留まり問題に直面しました。これは新しいシステムでは標準的です。3つの大規模AWSキャンパスは2025年末までにAWSのトップラインに有意義に貢献し、成長率を20%超に押し上げるとみています。Anthropicはこれで止まりません。約130億ドル、評価額1830億ドルの資金調達ラウンドにより、AWS、Googleなどとの追加契約を結ぶ資本が得られます。AWSも待っているわけではありません。この成長を取り込むために、すでにギガワット級の新データセンターの着工を始めています。
これらのデータセンターは主にAWSのカスタムチップTrainiumで満たされる予定です。規模を考慮すると、Anthropicの賭けがどれほど大胆かは軽視できません。彼らは数百億ドルの支出を約束するだけでなく、それをほとんど実績のないチップで行っているのです。TrainiumのTCOとロードマップを掘り下げて、彼らの賭けを理解しましょう。
Trainium2のサプライチェーンシグナルは現在非常に強いです。当社の業界をリードするAIアクセラレータモデルは、パッケージ出荷とシステム/ラック出荷の両方を追跡しており、年初から急増しています。Trainium2およびTrainium3製品ファミリーの10以上のSKUの四半期ごとの出荷量予測を提供し、特定のSKUから不均衡に利益を得るサプライヤーを特定しています。NvidiaやGoogleのTPUとの競争はもちろん容易ではありません。Googleが第7世代TPU Ironwoodを展開する一方、Trainium2はアマゾンにとってわずか第3世代のAIアクセラレータです。
チップ仕様を見ると、TrainiumはNvidiaに対して明らかに劣っています。Nvidia GB200はFP16演算で3.85倍のアドバンテージ、メモリ帯域幅では2.75倍の差があります。スケールアップネットワーク帯域幅も重要な要素です。Nvidia GB200 NVL72の総メモリ帯域幅はTrainium2の3.1倍です。しかし、総所有コスト(TCO)を考慮すると状況は変わります。Trainium2はTCOあたりのメモリ帯域幅で非常に競争力があります。そして、Anthropicはハードウェア・ソフトウェア協調設計に賭けています。Trainium2のTCOあたりメモリ帯域幅の優位性は、Anthropicの選択を理解する鍵です。Anthropicは強化学習などのポストトレーニング技術の拡大に最も積極的なAIラボであり、そのロードマップは演算能力よりもメモリ帯域幅に制約されています。
Anthropicの台頭により、Trainium2の唯一の大規模外部エンドユーザーとなるだけでなく、その規模はアマゾン内部のニーズ(Bedrock、Alexaなど)を大幅に上回ります。彼らは現在、すべてのTrainium設計決定に深く関与しており、実質的にアマゾンのAnnapurna Labsをカスタムシリコンパートナーとして活用しています。これによりAnthropicは、Google DeepMindと並んで、緊密なハードウェア・ソフトウェア協調設計の恩恵を受ける唯一のAIラボとなります。
アマゾンはアンカー顧客向けに新しいシステムレベルアーキテクチャを展開しています。現在、AWSが展開する2つのシステムはTeton PDとTeton PD Ultraです。来年には、新しいTeton PDSとTeton Maxが大量に出荷される予定です。主な違いは、NeuronLinkv3と呼ばれるオールツーオールスケールアップネットワークの導入です。Trainiumのアーキテクチャは、NvidiaのNVL72 NVLinkに収束しつつあります。4つのNeuronLinkv3スイッチトレイがラック中央に配置され、16のコンピュートトレイが上下に均等に分割されます。特定のサプライチェーンベンダーが不均衡に利益を得るでしょう。PDSの導入は、TrainiumがNvidiaに追いつくための中間ステップと考えています。また、Anthropicがこの新しいシステムレベルアーキテクチャの立ち上げに深く関与したと考えています。
Anthropicの設計決定への関与拡大は、将来の出荷量にとって良い兆候です。しかし、彼らはTPUやNvidia GPUを放棄するわけではありません。当社のアクセラレータモデルは、アマゾンとGoogle Cloudのチップ購入をSKUレベルで予測し、データセンターモデルはどのデータセンターとクラウドパートナーがAnthropicの成長を支えるかを理解します。2026年のAnthropic向けTPU出荷は膨大であり、彼らの取引には独自の側面があります。
では、より長期的な視点でAWSの将来を評価しましょう。ペイウォールの先では、以下の項目について議論します。主要顧客Anthropicの見通し。AWSの生成AIビジネス(Bedrockと内部LLMの取り組み)。2026年と2027年のTrainium出荷、潜在的な新規外部顧客、そしてそれが将来のアマゾンの財務プロファイルにどのような影響を与えるか。