AI News HubLIVE
公開記事 8収集記事 10信頼度 84更新頻度 120 分
稼働状態 正常ソース種別 メディア全文利用権限 サイト内リライト最終取り込み 2026-05-07ID semianalysis状態 有効

AI chips and infrastructure analysis source; summary-only unless authorization is obtained.

最新公開記事

xAIのColossus 2 – 世界初のギガワット級データセンター、独自の強化学習手法、資金調達

xAIは、州をまたいだ電源調達とSolaris Energyとの提携を活用し、ギガワット級のトレーニングデータセンター「Colossus 2」を建設中。2025年第3四半期には競合を凌駕し、中東からの資金調達も見込まれる。

  • xAIはColossus 1を122日で記録的に完成。Colossus 2はさらに大規模で、6ヶ月で200MWの冷却能力を達成。
  • Colossus 2の電力は、テネシー州の反対を避けるため、ミシシッピ州の旧デューク・エネルギー発電所のガスタービンから供給。
サイト内本文

さらなる巨大な飛躍:Rubin CPX専用アクセラレータとラック

Nvidiaは、プリフィルフェーズに特化して最適化されたRubin CPXを発表しました。シングルダイのRubin CPXは、メモリ帯域幅よりもコンピュートFLOPSを重視しています。これは推論におけるゲームチェンジャーであり、その重要性は2024年3月に発表されたGB200 NVL72 Oberonラックスケールフォームファクターに次ぐものです。プリフィルとデコードという推論の異なるフェーズに特化したハードウェアによってのみ、分離型サービングの真の可能性が発揮されます。Nvidiaのラックシステム設計の差は峡谷のように広がり、競合他社はロードマップを再構成せざるを得なくなりました。

  • Rubin CPXはプリフィル専用GPUで、20 PFLOPSのFP4密結合計算と2 TB/sのメモリ帯域幅を備え、128GBのGDDR7を採用しコストを削減。
  • 新しいVR200 NVL144 CPXおよびデュアルラック構成により、分離型推論のためのプリフィル対デコード比率を柔軟に設定可能。
サイト内本文

Huawei Ascend生産加速:Die Bank、TSMCの継続生産、HBMがボトルネックに

Huaweiは、TSMCからのDie BankとSMICの生産能力を活用し、Ascend AIチップの生産を加速しています。しかし、HBM(高帯域幅メモリ)の不足が今後の生産の最大のボトルネックとなるでしょう。中国国内のHBMサプライヤーCXMTは急速に能力を向上させていますが、短期的には需要を満たせません。この記事では、輸出規制の影響とNVIDIA H20チップの中国販売の潜在的な影響についても分析しています。

  • Huaweiは2024年に507k個のAscendチップを出荷し、2025年には805k個(主に910C)を見込む。
  • SMICの能力はもはやボトルネックではないが、HBMの供給不足により来年は100万個未満に制限される。
サイト内本文

アマゾンのAI復活:AWSとAnthropicによるマルチギガワットのTrainium拡大

2年半前、SemiAnalysisはAWSの「クラウド危機」を警告した。今やその証拠は積み上がり、Azureが四半期の新規クラウド収益でリードし、Google CloudがAWSとの差を縮めている。しかしSemiAnalysisは逆張りでAWSのAI復活を予想し、中心的な原動力はAnthropicとの提携だ。Anthropicの2025年の収益は10億ドルから50億ドル(年率換算)に急増し、AWSは同社向けに1.3ギガワット超のデータセンターを建設、約100万個のTrainium2チップを搭載する。Trainium2はスペック面でNvidiaに劣るものの、TCOあたりのメモリ帯域で優位性があり、Anthropicの強化学習ロードマップに適合する。この協力関係はカスタムシリコンプログラムへと発展し、2025年末までにAWSの成長率を20%超に押し上げるとみられる。

  • AWSはAIクラウド市場シェアを失っているが、SemiAnalysisはAnthropicとの提携による復活を予測。
  • Anthropicの2025年収益は年率50億ドルと5倍に成長し、AWSのアンカー顧客に。
サイト内本文

H100 vs GB200 NVL72 トレーニングベンチマーク – 電力、TCO、信頼性分析、ソフトウェアの経時改善

本記事では、H100とGB200 NVL72のトレーニングベンチマークを詳細に分析し、モデル浮動小数点演算利用率(MFU)、総所有コスト(TCO)、100万トークンあたりのコスト、エネルギー消費、信頼性を扱う。H100は12ヶ月間のソフトウェア最適化のみで最大57%のスループット向上を達成。一方、GB200 NVL72は潜在的な性能優位性を持つが、信頼性課題に直面し、大規模トレーニング実行は未完了である。GPT-3 175BやLlama 3 405Bなどの具体的なモデルのベンチマーク結果を提示し、Nvidiaへの3つの提言(ベンチマーク透明性の向上、ネイティブPyTorchへの拡張、GB200診断ツールの改善)を行う。

  • H100はソフトウェアのみで1年間にBF16 MFUを34%から54%、FP8 MFUを29.5%から39.5%に改善。
  • GB200 NVL72のGPUあたり総コストはH100の約1.6倍であり、TCO優位性を得るには少なくとも1.6倍の性能が必要。
サイト内本文

GPT-5が広告収益化とスーパーアプリへの道を開く

GPT-5のリリースはパワーユーザーにとって失望だったが、実際の焦点は7億以上の無料ユーザーの収益化にある。本記事は、OpenAIが新しいルーター技術でクエリの意図を区別し、将来的にはエージェント購入と取引手数料を通じて無料ユーザーを収益化し、消費者向けスーパーアプリを創り出す可能性を分析する。

  • GPT-5はパワーユーザーよりも無料ユーザーを優先し、ルーターで広告収益化の準備を整えている。
  • ルーターは情報クエリと商業クエリを区別し、高価値クエリにより多くの計算リソースを割り当てる。
サイト内本文

ロボットの自律レベル:スクリプト動作から汎用タスクへの道筋

本記事は業界初の「ロボット自律レベル」分類法を提案し、ロボットの自律性を0から4までの5段階に分類する。各レベルは前段階を基盤に新たな能力を解放する。現在の汎用ロボットはレベル2の初期生産段階にあり、レベル3はパイロット段階、レベル4は研究中である。AI基盤モデルがロボットの障害をデータ問題に変換し、能力向上を加速させている。

  • ロボット自律レベルは5段階:レベル0(スクリプト動作)、レベル1(スマートピック&プレイス)、レベル2(自律移動)、レベル3(低スキル操作)、レベル4(力依存タスク)。
  • 汎用ロボットはレベル2(初期生産)およびレベル3(パイロット)にあり、レベル4は研究中。
サイト内本文

Metaのスーパーインテリジェンス – リーダーシップ、計算、人材、データ

MetaはScale AIの49%を約300億ドルの評価額で買収し、資金には事欠かないことを示した。しかし、潤沢なリソースにもかかわらず、モデル性能では基礎研究所に遅れを取っている。ザッカーバーグは新たな「スーパーインテリジェンス」チームを自ら率い、巨額の報酬でトップ人材を引き抜き、データセンター戦略を抜本的に見直してテント式の高速建設を採用している。一方、Llama 4は注意機構やデータ品質の問題で失敗したが、Metaは買収と人材獲得でギャップを埋めつつある。

  • MetaがScale AIの49%を約300億ドルで買収。
  • ザッカーバーグがスーパーインテリジェンスチームを結成、4年で2~3億ドルの報酬を提示。
サイト内本文

全ソース