AI News HubLIVE
站内改写

NVIDIA Vera CPU、競合に対して「強力なパンチ」を繰り出す

エージェンティックAIへの移行により、AIファクトリーには高速コア、大容量メモリ帯域幅、全コアアクティブ時の持続的高性能という新しいCPU要件が生じています。Phoronixが本日発表した初期ベンチマーク結果は、NVIDIA Vera CPUがこのニーズを満たすことを示しています。Veraは88個のカスタムOlympusコア、1.2TB/sのメモリ帯域幅を備え、効率的な電力範囲内でパフォーマンスを発揮します。テストでは、Veraはコードコンパイル、ファイル圧縮、ビデオトランスコーディングなどで前世代Grace比1.6倍の性能向上を達成し、最新のx86プロセッサをリードしました。LPDDR5Xメモリサブシステムは30ワット未満の消費電力でピーク帯域幅の90%を達成し、従来のx86と比較してコアあたり4倍以上のメモリ帯域幅を提供します。NVIDIAは主要なAI企業やクラウドプロバイダーに初期Vera CPUを出荷しており、パートナーからの提供は2025年下半期を予定しています。

記事インテリジェンス

エンジニア上級

要点

  • Vera CPUはエージェンティックAIワークロード向けに設計され、88個のカスタムOlympusコアと1.2TB/sのメモリ帯域幅を搭載。
  • Phoronixのベンチマークでは、VeraはGrace比1.6倍の世代間性能向上を示し、多くのタスクで最新のx86プロセッサを上回る。
  • LPDDR5Xメモリは30ワット未満の消費電力で従来のDDR5の2倍のピーク帯域幅を実現し、持続帯域幅利用率は90%。
  • 最初のVera CPUは主要AI企業とクラウドプロバイダーに出荷済み。パートナーシステムは2025年下半期に登場予定。

重要な理由

このニュースが重要なのは、Vera CPUはエージェンティックAIワークロード向けに設計され、88個のカスタムOlympusコアと1.2TB/sのメモリ帯域幅を搭載ためです。

技術的影響

Agent アーキテクチャ、ツール呼び出し、ワークフロー自動化、プロダクト統合に影響する可能性があります。

エージェンティックAIへの移行は、AIファクトリー向けCPUに新たな要件をもたらしています:高速コア、大容量メモリ帯域幅、そして全コアがアクティブな状態での持続的な高性能です。本日Phoronixが公開した初期ベンチマーク結果は、NVIDIA Vera CPUがこのニーズを満たすことを示しています。今回の初公開では、ベンチマークの範囲はVeraが設計された現代のデータセンターにおけるエージェンティックワークロードに焦点を当てています。

Vera CPUは、AIファクトリーに必要なスループットを提供しつつ、プラットフォームの電力を最適化します。88個のNVIDIAカスタムOlympusコア、1.2TB/sのメモリ帯域幅、および高速オンチップファブリックにより、効率的な電力範囲内でコア性能とメモリ帯域幅を兼ね備えたCPUプラットフォームを実現します。

**NVIDIA Olympusが積極的なパフォーマンスを実現**

Veraの中心には、カスタムNVIDIA Olympus CPUコアがあります。Armv9.2命令セットアーキテクチャと完全互換のOlympusは、エージェンティックAIを支えるシーケンシャルCPUワーク(ブランチヘビーなランタイム、サンドボックスコード、データ処理、オーケストレーション)向けに設計されています。Veraのモノリシックダイ、ワイドコア、高度な分岐予測、および第2世代NVIDIAスケーラブルコヒーレンシファブリックにより、Veraは88個すべてのコアにわたってデータを移動し続けます。

Phoronixによる定格450ワット熱設計電力(メモリ電力30ワット未満)のシングルソケットVera CPUのテストでは、その電力プロファイル内で卓越したパフォーマンスを発揮し、コードコンパイル、ファイル圧縮、ビデオトランスコーディング、Python、Java、データベース管理など幅広いワークロードで世代間の向上を示しました。これらはエージェントとAIファクトリーが毎日実行するCPU集約型タスクと同じものです:コードのコンパイル、ランタイムの実行、データの圧縮、データベースのクエリ、大規模ソフトウェアスタックの調整などです。

「今回のテストに臨むにあたり、新しいOlympusコアを搭載したNVIDIA Veraに何を期待すべきか本当にわかりませんでした」とPhoronixの創設者兼主席著者Michael Larabelは書いています。「しかし最終的に、これがIntelやAMDのx86_64プロセッサに対するこれまでで最も強力な競争者であることに気づきました。」

**メモリパフォーマンスにおける「信じられないアドバンテージ」**

エージェンティックワークロードはコア数だけで制限されるわけではありません。高いコア利用率と持続的なメモリ帯域幅が必要であり、メモリのワットあたりのパフォーマンスがCPU全体の効率の重要な要素となります。Veraは第2世代LPDDR5Xメモリサブシステムを搭載しており、DDR5と比較してビットあたりのエネルギーを劇的に低減します。これにより、Veraは最大1.2TB/sの帯域幅を提供できます。これは従来のCPUのピークメモリ帯域幅の最大2倍であり、メモリ電力は30ワット未満(従来のDDR5では100ワット以上)です。

PhoronixのSTREAM TRIADテストでは、Veraはピークメモリ帯域幅の90%を維持し、Phoronixがテストした全CPUの中で最高の定格ピーク帯域幅達成率を記録し、従来のx86 CPUと比較してコアあたり4倍以上のメモリ帯域幅を提供しました。「NVIDIA VeraはLPDDR5Xメモリにより、現在のIntel XeonやAMD EPYCプロセッサを上回るメモリパフォーマンスで信じられないアドバンテージを示しています」とLarabelは書いています。

しかし、ピーク帯域幅は全体像の一部に過ぎません。AIファクトリーワークロードは多数のサンドボックス、ツールコール、データサービスを同時に実行します。Prime IntellectによるVeraの別のテストでは、より多くのワークロードが並行して実行されるにつれて、Veraは高い帯域幅と低く一貫したメモリレイテンシを維持しました。これはエージェンティックAIに必要な予測可能なパフォーマンスです。

**大きな世代間飛躍 – Phoronixテストでのリーダーシップ**

前世代のNVIDIA Grace CPUと比較して、VeraはPhoronixテストで幾何平均1.6倍の向上を達成しました。これは信じられないほどの世代間ゲインです。「GraceからVeraへの差は、プロセッサで通常見られる世代間パフォーマンスに対する私の期待を一貫して上回っていました」とLarabelは書いています。「NVIDIAのVera CPUは社内設計のOlympus CPUコアにより、Intel/AMD x86_64 CPUに対する競争力で、これまで他のARMや非x86_64プロセッサで見たことのない強力なパンチを繰り出しています。」

VeraはテストされたCPUフィールドをリードし、最新世代の128コアx86プロセッサと比較して全体で1.5倍のパフォーマンスアドバンテージを提供しました。その向上は実際の開発者ワークロードに現れています。シングルソケットVeraはデフォルトのLinuxカーネルをわずか20秒でコンパイルし、Phoronixがそのテストで計測した最速の結果でした。Veraは128コアプロセッサと比較してコアあたり2倍のLinuxカーネルコンパイル速度を実現しました。「幾何平均ベースでは、NVIDIA VeraはAMD EPYC 9575F 5.0 GHz高周波数プロセッサよりも10%優れたパフォーマンスを提供しました」とLarabelは書いています。

**カスタマーテスト中のVera – パートナーから間もなく登場**

NVIDIA GTCで、NVIDIAはVeraの広範なエコシステムサポートを発表しました。これにはAIネイティブ企業、スーパーコンピューティングセンター、クラウドサービスプロバイダー、インフラストラクチャプロバイダーが含まれます。NVIDIAは主要なAI企業やクラウドプロバイダーに最初のVera CPUを出荷しており、これはVeraが今年下半期にパートナーから入手可能になる重要なマイルストーンです。Veraはパートナーからデュアルソケットおよびシングルソケットシステムで提供され、標準エンタープライズデータセンターから高密度エージェンティックAIインフラまで、AIファクトリー展開をサポートするための空冷および液冷オプションが用意されます。

NVIDIA Veraの詳細はこちら。