xAIのColossus 2 – 世界初のギガワット級データセンター、独自の強化学習手法、資金調達
xAIは、州をまたいだ電源調達とSolaris Energyとの提携を活用し、ギガワット級のトレーニングデータセンター「Colossus 2」を建設中。2025年第3四半期には競合を凌駕し、中東からの資金調達も見込まれる。
- xAIはColossus 1を122日で記録的に完成。Colossus 2はさらに大規模で、6ヶ月で200MWの冷却能力を達成。
- Colossus 2の電力は、テネシー州の反対を避けるため、ミシシッピ州の旧デューク・エネルギー発電所のガスタービンから供給。
さらなる巨大な飛躍:Rubin CPX専用アクセラレータとラック
Nvidiaは、プリフィルフェーズに特化して最適化されたRubin CPXを発表しました。シングルダイのRubin CPXは、メモリ帯域幅よりもコンピュートFLOPSを重視しています。これは推論におけるゲームチェンジャーであり、その重要性は2024年3月に発表されたGB200 NVL72 Oberonラックスケールフォームファクターに次ぐものです。プリフィルとデコードという推論の異なるフェーズに特化したハードウェアによってのみ、分離型サービングの真の可能性が発揮されます。Nvidiaのラックシステム設計の差は峡谷のように広がり、競合他社はロードマップを再構成せざるを得なくなりました。
- Rubin CPXはプリフィル専用GPUで、20 PFLOPSのFP4密結合計算と2 TB/sのメモリ帯域幅を備え、128GBのGDDR7を採用しコストを削減。
- 新しいVR200 NVL144 CPXおよびデュアルラック構成により、分離型推論のためのプリフィル対デコード比率を柔軟に設定可能。
Huawei Ascend生産加速:Die Bank、TSMCの継続生産、HBMがボトルネックに
Huaweiは、TSMCからのDie BankとSMICの生産能力を活用し、Ascend AIチップの生産を加速しています。しかし、HBM(高帯域幅メモリ)の不足が今後の生産の最大のボトルネックとなるでしょう。中国国内のHBMサプライヤーCXMTは急速に能力を向上させていますが、短期的には需要を満たせません。この記事では、輸出規制の影響とNVIDIA H20チップの中国販売の潜在的な影響についても分析しています。
- Huaweiは2024年に507k個のAscendチップを出荷し、2025年には805k個(主に910C)を見込む。
- SMICの能力はもはやボトルネックではないが、HBMの供給不足により来年は100万個未満に制限される。
アマゾンのAI復活:AWSとAnthropicによるマルチギガワットのTrainium拡大
2年半前、SemiAnalysisはAWSの「クラウド危機」を警告した。今やその証拠は積み上がり、Azureが四半期の新規クラウド収益でリードし、Google CloudがAWSとの差を縮めている。しかしSemiAnalysisは逆張りでAWSのAI復活を予想し、中心的な原動力はAnthropicとの提携だ。Anthropicの2025年の収益は10億ドルから50億ドル(年率換算)に急増し、AWSは同社向けに1.3ギガワット超のデータセンターを建設、約100万個のTrainium2チップを搭載する。Trainium2はスペック面でNvidiaに劣るものの、TCOあたりのメモリ帯域で優位性があり、Anthropicの強化学習ロードマップに適合する。この協力関係はカスタムシリコンプログラムへと発展し、2025年末までにAWSの成長率を20%超に押し上げるとみられる。
- AWSはAIクラウド市場シェアを失っているが、SemiAnalysisはAnthropicとの提携による復活を予測。
- Anthropicの2025年収益は年率50億ドルと5倍に成長し、AWSのアンカー顧客に。
H100 vs GB200 NVL72 トレーニングベンチマーク – 電力、TCO、信頼性分析、ソフトウェアの経時改善
本記事では、H100とGB200 NVL72のトレーニングベンチマークを詳細に分析し、モデル浮動小数点演算利用率(MFU)、総所有コスト(TCO)、100万トークンあたりのコスト、エネルギー消費、信頼性を扱う。H100は12ヶ月間のソフトウェア最適化のみで最大57%のスループット向上を達成。一方、GB200 NVL72は潜在的な性能優位性を持つが、信頼性課題に直面し、大規模トレーニング実行は未完了である。GPT-3 175BやLlama 3 405Bなどの具体的なモデルのベンチマーク結果を提示し、Nvidiaへの3つの提言(ベンチマーク透明性の向上、ネイティブPyTorchへの拡張、GB200診断ツールの改善)を行う。
- H100はソフトウェアのみで1年間にBF16 MFUを34%から54%、FP8 MFUを29.5%から39.5%に改善。
- GB200 NVL72のGPUあたり総コストはH100の約1.6倍であり、TCO優位性を得るには少なくとも1.6倍の性能が必要。
GPT-5が広告収益化とスーパーアプリへの道を開く
GPT-5のリリースはパワーユーザーにとって失望だったが、実際の焦点は7億以上の無料ユーザーの収益化にある。本記事は、OpenAIが新しいルーター技術でクエリの意図を区別し、将来的にはエージェント購入と取引手数料を通じて無料ユーザーを収益化し、消費者向けスーパーアプリを創り出す可能性を分析する。
- GPT-5はパワーユーザーよりも無料ユーザーを優先し、ルーターで広告収益化の準備を整えている。
- ルーターは情報クエリと商業クエリを区別し、高価値クエリにより多くの計算リソースを割り当てる。
ロボットの自律レベル:スクリプト動作から汎用タスクへの道筋
本記事は業界初の「ロボット自律レベル」分類法を提案し、ロボットの自律性を0から4までの5段階に分類する。各レベルは前段階を基盤に新たな能力を解放する。現在の汎用ロボットはレベル2の初期生産段階にあり、レベル3はパイロット段階、レベル4は研究中である。AI基盤モデルがロボットの障害をデータ問題に変換し、能力向上を加速させている。
- ロボット自律レベルは5段階:レベル0(スクリプト動作)、レベル1(スマートピック&プレイス)、レベル2(自律移動)、レベル3(低スキル操作)、レベル4(力依存タスク)。
- 汎用ロボットはレベル2(初期生産)およびレベル3(パイロット)にあり、レベル4は研究中。
Metaのスーパーインテリジェンス – リーダーシップ、計算、人材、データ
MetaはScale AIの49%を約300億ドルの評価額で買収し、資金には事欠かないことを示した。しかし、潤沢なリソースにもかかわらず、モデル性能では基礎研究所に遅れを取っている。ザッカーバーグは新たな「スーパーインテリジェンス」チームを自ら率い、巨額の報酬でトップ人材を引き抜き、データセンター戦略を抜本的に見直してテント式の高速建設を採用している。一方、Llama 4は注意機構やデータ品質の問題で失敗したが、Metaは買収と人材獲得でギャップを埋めつつある。
- MetaがScale AIの49%を約300億ドルで買収。
- ザッカーバーグがスーパーインテリジェンスチームを結成、4年で2~3億ドルの報酬を提示。