2026-05-27 05:15 UTC+8站内改写3 分钟阅读更新: 2026-06-30 21:03 UTC+8

NVIDIA Vera CPU 对竞争对手“重拳出击”

随着AI向智能体方向演进，对CPU提出了新要求：快速内核、海量内存带宽以及全核高负载下的持续性能。Phoronix今日发布的基准测试结果显示，NVIDIA Vera CPU满足这些需求。Vera采用88个定制Olympus核心，1.2TB/s内存带宽，在功率效率内提供强劲性能。测试中，Vera在单插槽系统中展现了卓越的代码编译、文件压缩、视频转码等能力，并在STREAM TRIAD测试中实现了90%峰值带宽，远超传统x86 CPU。与上一代Grace相比，Vera性能提升1.6倍，在多项测试中领先于Intel和AMD的最新处理器。NVIDIA已向主要AI公司和云提供商交付首批Vera CPU，预计下半年通过合作伙伴上市。

来源NVIDIA Blog作者: Diana Aung

随着人工智能向智能体（agentic AI）方向演进，AI工厂对CPU提出了全新的要求：快速内核、海量内存带宽以及在全核激活时维持高性能的能力。今日，Phoronix发布的初步基准测试结果显示，NVIDIA Vera CPU完全满足这些需求。这是Vera的首次公开亮相，测试重点正是其设计的核心工作负载——现代数据中心中的智能体任务。

Vera CPU提供了AI工厂所需的吞吐量，同时优化了平台功耗。它集成了88个NVIDIA定制的Olympus核心、1.2TB/s的内存带宽以及高速片上互连结构，打造出一个在高效功耗范围内平衡核心性能与内存带宽的CPU平台。

NVIDIA Olympus带来强劲性能

Vera的核心是NVIDIA定制的Olympus CPU核心。Olympus完全兼容Armv9.2指令集架构，专为支撑智能体AI的序列化CPU工作而设计，包括分支密集型运行时、沙箱代码、数据处理和编排。Vera采用单芯片设计，拥有宽核心、先进分支预测和第二代NVIDIA可扩展一致性互连结构，帮助数据在全部88个核心间高效流动。

Phoronix对单插槽Vera CPU（额定热设计功耗450瓦，内存功耗低于30瓦）的测试显示，它在既定的功耗范围内提供了卓越性能，并在代码编译、文件压缩、视频转码、Python、Java和数据库管理等广泛工作负载上实现了代际提升。这些正是智能体和AI工厂日常运行的CPU密集型任务：编译代码、执行运行时、压缩数据、查询数据库和协调大型软件栈。

“在测试之前，我真的不知道对采用新Olympus核心的NVIDIA Vera能有什么期待，”Phoronix创始人兼首席作者Michael Larabel写道，“但最终我意识到，这是迄今为止对Intel和AMD x86_64处理器最 formidable 的竞争。”

内存性能的“不可思议优势”

智能体工作负载不仅受核心数量的限制，还需要高核心利用率和持续的内存带宽，这使得每瓦内存性能成为CPU整体效率的关键部分。Vara集成了第二代LPDDR5X内存子系统，每比特能耗远低于DDR5。这使得Vera能够提供高达1.2TB/s的带宽——是传统CPU峰值内存带宽的2倍，而内存功耗低于30瓦，相比之下传统DDR5的功耗超过100瓦。

在Phoronix的STREAM TRIAD测试中，Vera保持了90%的峰值内存带宽——这是Phoronix测试过的所有CPU中最高百分比——并且每核心内存带宽是传统x86 CPU的4倍以上。“NVIDIA Vera凭借其LPDDR5X内存在内存性能上展现出了对当前Intel Xeon和AMD EPYC处理器的不可思议优势，”Larabel写道。

然而，峰值带宽只是故事的一部分。AI工厂工作负载同时运行大量沙箱、工具调用和数据服务。在与Vera的单独测试中，Prime Intellect发现，随着更多工作负载并行运行，Vera能够保持高带宽和低且一致的内存延迟——这正是智能体AI所需的可预测性能。

巨大的代际飞跃——Phoronix测试中的领导地位

与上一代NVIDIA Grace CPU相比，Vera在Phoronix测试中的几何平均性能提升达到了1.6倍——这是一个令人难以置信的代际提升。“从Grace到Vera的差异 consistently 超出了我对处理器代际性能提升的预期，”Larabel写道，“NVIDIA Vera凭借其内部设计的Olympus CPU核心，对Intel/AMD x86_64 CPU发起了重拳出击，我从未在任何其他ARM或非x86_64处理器上见过这样的竞争力。”

Vera在测试的CPU中领先，与最新一代128核x86处理器相比，整体性能优势达到1.5倍。这些提升体现在实际的开发者工作负载中。单插槽Vera仅用20秒就编译了一个默认Linux内核，这是Phoronix在该测试中记录的最快结果。Vera在每核心基础上，Linux内核编译速度是128核处理器的2倍。“从几何平均来看，NVIDIA Vera比AMD EPYC 9575F 5.0 GHz高频处理器性能高出10%，”Larabel写道。

客户测试中的Vera——即将来自合作伙伴

在NVIDIA GTC上，NVIDIA宣布了Vera的广泛生态系统支持，涵盖AI原生公司、超算中心、云服务提供商和基础设施提供商。NVIDIA已经向领先的AI公司和云提供商交付了首批Vera CPU，这标志着Vera向今年下半年的合作伙伴供货迈出了重要一步。Vera将通过合作伙伴以双插槽和单插槽系统形式提供，并提供风冷和液冷选项，以支持从标准企业数据中心到高密度智能体AI基础设施的AI工厂部署。

了解更多关于NVIDIA Vera的信息。