AMD、AI推論向けPCIe GPUカードを発表
AMDは新しいInstinct MI350P GPUを発表した。PCIe Gen 5インターフェースを採用し、企業はデータセンターを再構築することなくAI推論能力を向上させることができる。1850億トランジスタ、144GB HBM3eメモリ、600W TDPを備え、1ノードあたり最大8基のGPUを構成可能。DellやGigabyteなどのサポートを受ける。
AMDは先週、Instinctシリーズの最新GPUであるMI350Pを発表した。この製品は、企業がデータセンターを再構築することなく、既存のサーバーに直接挿入してAI推論能力を迅速に向上させることを目的としている。MI350Pは標準のPCIe Gen 5インターフェースを採用し、ホストとの間に128GB/sの接続帯域幅を提供する。
MI350Pは1850億個のトランジスタ、144GBのHBM3eメモリ、4TB/sのピークメモリ帯域幅を備え、600Wの熱設計電力内で動作する。BF16、FP8、MXFP6、MXFP4精度をサポートし、128のAMD CDNA第4世代コンピュートユニットにより、MXFP4精度で最大4600テラフロップスのピーク性能を実現する。このGPUは、最大2000億~2500億パラメータのAIモデルを処理可能で、ビデオおよびJPEGデコードもサポートする。
各ノードには最大8基のMI350P GPUを構成でき、各GPUは4つのパーティションに分割可能で、各パーティションは36GBのHBM3メモリを持つ。AMDは、このGPUが標準の空冷を使用することを強調している。AMDのコンピュートおよびエンタープライズAI事業開発責任者であるSuresh Andani氏はブログで次のように述べている。「AIを採用することは、インフラをゼロから再構築することを意味しません。AMD Instinct MI350P PCIeカードにより、企業は既存のデータセンター内でより多くのモデルを実行し、より多くのユーザーにサービスを提供できます。」
MI350PはDellやGigabyteなどのOEMメーカーの支持を得ている。Dellのプロダクトマネジメント担当バイスプレジデントDavid Schmidt氏は、新しいGPUが顧客のAI計画を加速すると述べた。「AIに真剣に取り組む企業にとって、オンプレミスインフラは妥協ではなく、制御、セキュリティ、予測可能な結果を提供する競争優位性です。」GigabyteのゼネラルマネージャーDaniel Hou氏も実用性を称賛した。「PCIeベースの設計により、MI350Pは柔軟な展開とシステムへのシームレスな統合を可能にし、企業はグローバルにスケールするために必要な柔軟性と効率性を備えた高性能AI環境を構築できます。」
MI350Pに加えて、AMDはよりハイエンドな空冷GPUや液冷モデルも開発中である。例えば、Instinct UB B8はMI350XおよびMI355Xシリーズの8GPU空冷構成で、ユニバーサルベースボードとして提供され、2.3TBのHBM3と8TB/sのメモリ帯域幅を提供する。また、AMD Infinity Fabricを介したスケールアップ機能を備え、AMDはNvidia Blackwellと同等の性能を主張している。UB B8は最大5000億パラメータのモデルをサポートし、大規模なAIトレーニングと推論向けに設計されている。
AMDは液冷版のInstinct MI355Xも提供しており、熱設計電力は最大1400Wである。SupermicroとTensorWaveはAMDと協力してこれらの液冷チップをサポートしている。また、AMDは液冷版のRadeonゲーミングGPUも提供している。
超高端GPUは液冷や800V直流電源を必要とする場合もあるが、多くの顧客は既存のインフラでやや小規模なAIモデルを実行したいと考えており、新しいデータセンターを建設することを望んでいない。AMDのMI355Pシリーズはこのセグメントをターゲットにしている。