SemiAnalysis AI ニュースソース

公開記事 8収集記事 10信頼度 84更新頻度 120 分

稼働状態正常ソース種別 メディア全文利用権限 サイト内リライト最終取り込み 2026-05-07ID semianalysis状態有効

AI chips and infrastructure analysis source; summary-only unless authorization is obtained.

最新公開記事

xAIのColossus 2 – 世界初のギガワット級データセンター、独自の強化学習手法、資金調達

2025-09-17 02:38 UTC+9

xAIは、州をまたいだ電源調達とSolaris Energyとの提携を活用し、ギガワット級のトレーニングデータセンター「Colossus 2」を建設中。2025年第3四半期には競合を凌駕し、中東からの資金調達も見込まれる。

xAIはColossus 1を122日で記録的に完成。Colossus 2はさらに大規模で、6ヶ月で200MWの冷却能力を達成。
Colossus 2の電力は、テネシー州の反対を避けるため、ミシシッピ州の旧デューク・エネルギー発電所のガスタービンから供給。

さらなる巨大な飛躍：Rubin CPX専用アクセラレータとラック

2025-09-11 04:57 UTC+9

Nvidiaは、プリフィルフェーズに特化して最適化されたRubin CPXを発表しました。シングルダイのRubin CPXは、メモリ帯域幅よりもコンピュートFLOPSを重視しています。これは推論におけるゲームチェンジャーであり、その重要性は2024年3月に発表されたGB200 NVL72 Oberonラックスケールフォームファクターに次ぐものです。プリフィルとデコードという推論の異なるフェーズに特化したハードウェアによってのみ、分離型サービングの真の可能性が発揮されます。Nvidiaのラックシステム設計の差は峡谷のように広がり、競合他社はロードマップを再構成せざるを得なくなりました。

Rubin CPXはプリフィル専用GPUで、20 PFLOPSのFP4密結合計算と2 TB/sのメモリ帯域幅を備え、128GBのGDDR7を採用しコストを削減。
新しいVR200 NVL144 CPXおよびデュアルラック構成により、分離型推論のためのプリフィル対デコード比率を柔軟に設定可能。

Huawei Ascend生産加速：Die Bank、TSMCの継続生産、HBMがボトルネックに

2025-09-08 18:54 UTC+9

Huaweiは、TSMCからのDie BankとSMICの生産能力を活用し、Ascend AIチップの生産を加速しています。しかし、HBM（高帯域幅メモリ）の不足が今後の生産の最大のボトルネックとなるでしょう。中国国内のHBMサプライヤーCXMTは急速に能力を向上させていますが、短期的には需要を満たせません。この記事では、輸出規制の影響とNVIDIA H20チップの中国販売の潜在的な影響についても分析しています。

Huaweiは2024年に507k個のAscendチップを出荷し、2025年には805k個（主に910C）を見込む。
SMICの能力はもはやボトルネックではないが、HBMの供給不足により来年は100万個未満に制限される。

アマゾンのAI復活：AWSとAnthropicによるマルチギガワットのTrainium拡大

2025-09-04 05:55 UTC+9

2年半前、SemiAnalysisはAWSの「クラウド危機」を警告した。今やその証拠は積み上がり、Azureが四半期の新規クラウド収益でリードし、Google CloudがAWSとの差を縮めている。しかしSemiAnalysisは逆張りでAWSのAI復活を予想し、中心的な原動力はAnthropicとの提携だ。Anthropicの2025年の収益は10億ドルから50億ドル（年率換算）に急増し、AWSは同社向けに1.3ギガワット超のデータセンターを建設、約100万個のTrainium2チップを搭載する。Trainium2はスペック面でNvidiaに劣るものの、TCOあたりのメモリ帯域で優位性があり、Anthropicの強化学習ロードマップに適合する。この協力関係はカスタムシリコンプログラムへと発展し、2025年末までにAWSの成長率を20%超に押し上げるとみられる。

AWSはAIクラウド市場シェアを失っているが、SemiAnalysisはAnthropicとの提携による復活を予測。
Anthropicの2025年収益は年率50億ドルと5倍に成長し、AWSのアンカー顧客に。

H100 vs GB200 NVL72 トレーニングベンチマーク – 電力、TCO、信頼性分析、ソフトウェアの経時改善

2025-08-20 13:56 UTC+9

本記事では、H100とGB200 NVL72のトレーニングベンチマークを詳細に分析し、モデル浮動小数点演算利用率（MFU）、総所有コスト（TCO）、100万トークンあたりのコスト、エネルギー消費、信頼性を扱う。H100は12ヶ月間のソフトウェア最適化のみで最大57%のスループット向上を達成。一方、GB200 NVL72は潜在的な性能優位性を持つが、信頼性課題に直面し、大規模トレーニング実行は未完了である。GPT-3 175BやLlama 3 405Bなどの具体的なモデルのベンチマーク結果を提示し、Nvidiaへの3つの提言（ベンチマーク透明性の向上、ネイティブPyTorchへの拡張、GB200診断ツールの改善）を行う。

H100はソフトウェアのみで1年間にBF16 MFUを34%から54%、FP8 MFUを29.5%から39.5%に改善。
GB200 NVL72のGPUあたり総コストはH100の約1.6倍であり、TCO優位性を得るには少なくとも1.6倍の性能が必要。

GPT-5が広告収益化とスーパーアプリへの道を開く

2025-08-13 09:27 UTC+9

GPT-5のリリースはパワーユーザーにとって失望だったが、実際の焦点は7億以上の無料ユーザーの収益化にある。本記事は、OpenAIが新しいルーター技術でクエリの意図を区別し、将来的にはエージェント購入と取引手数料を通じて無料ユーザーを収益化し、消費者向けスーパーアプリを創り出す可能性を分析する。

GPT-5はパワーユーザーよりも無料ユーザーを優先し、ルーターで広告収益化の準備を整えている。
ルーターは情報クエリと商業クエリを区別し、高価値クエリにより多くの計算リソースを割り当てる。

ロボットの自律レベル：スクリプト動作から汎用タスクへの道筋

2025-07-31 02:02 UTC+9

本記事は業界初の「ロボット自律レベル」分類法を提案し、ロボットの自律性を0から4までの5段階に分類する。各レベルは前段階を基盤に新たな能力を解放する。現在の汎用ロボットはレベル2の初期生産段階にあり、レベル3はパイロット段階、レベル4は研究中である。AI基盤モデルがロボットの障害をデータ問題に変換し、能力向上を加速させている。

ロボット自律レベルは5段階：レベル0（スクリプト動作）、レベル1（スマートピック＆プレイス）、レベル2（自律移動）、レベル3（低スキル操作）、レベル4（力依存タスク）。
汎用ロボットはレベル2（初期生産）およびレベル3（パイロット）にあり、レベル4は研究中。

Metaのスーパーインテリジェンス – リーダーシップ、計算、人材、データ

2025-07-12 05:12 UTC+9

MetaはScale AIの49%を約300億ドルの評価額で買収し、資金には事欠かないことを示した。しかし、潤沢なリソースにもかかわらず、モデル性能では基礎研究所に遅れを取っている。ザッカーバーグは新たな「スーパーインテリジェンス」チームを自ら率い、巨額の報酬でトップ人材を引き抜き、データセンター戦略を抜本的に見直してテント式の高速建設を採用している。一方、Llama 4は注意機構やデータ品質の問題で失敗したが、Metaは買収と人材獲得でギャップを埋めつつある。

MetaがScale AIの49%を約300億ドルで買収。
ザッカーバーグがスーパーインテリジェンスチームを結成、4年で2～3億ドルの報酬を提示。

SemiAnalysis