NVIDIA Vera CPU 对竞争对手“重拳出击”
随着AI向智能体方向演进,对CPU提出了新要求:快速内核、海量内存带宽以及全核高负载下的持续性能。Phoronix今日发布的基准测试结果显示,NVIDIA Vera CPU满足这些需求。Vera采用88个定制Olympus核心,1.2TB/s内存带宽,在功率效率内提供强劲性能。测试中,Vera在单插槽系统中展现了卓越的代码编译、文件压缩、视频转码等能力,并在STREAM TRIAD测试中实现了90%峰值带宽,远超传统x86 CPU。与上一代Grace相比,Vera性能提升1.6倍,在多项测试中领先于Intel和AMD的最新处理器。NVIDIA已向主要AI公司和云提供商交付首批Vera CPU,预计下半年通过合作伙伴上市。
文章情报
要点
- Vera CPU针对智能体AI工作负载设计,拥有88个定制的Olympus核心和1.2TB/s内存带宽。
- Phoronix测试显示,Vera在单插槽系统中比前代Grace性能提升1.6倍,且领先于最新的x86处理器。
- Vera的LPDDR5X内存子系统在功耗低于30瓦的情况下提供2倍于传统DDR5的带宽,并保持90%的峰值带宽利用率。
- NVIDIA已向AI公司和云提供商交付Vera CPU,预计2025年下半年通过合作伙伴上市。
为什么重要
这条新闻值得关注,因为Vera CPU针对智能体AI工作负载设计,拥有88个定制的Olympus核心和1.2TB/s内存带宽。
技术影响
可能影响 Agent 架构、工具调用、工作流自动化和产品集成。
随着人工智能向智能体(agentic AI)方向演进,AI工厂对CPU提出了全新的要求:快速内核、海量内存带宽以及在全核激活时维持高性能的能力。今日,Phoronix发布的初步基准测试结果显示,NVIDIA Vera CPU完全满足这些需求。这是Vera的首次公开亮相,测试重点正是其设计的核心工作负载——现代数据中心中的智能体任务。
Vera CPU提供了AI工厂所需的吞吐量,同时优化了平台功耗。它集成了88个NVIDIA定制的Olympus核心、1.2TB/s的内存带宽以及高速片上互连结构,打造出一个在高效功耗范围内平衡核心性能与内存带宽的CPU平台。
**NVIDIA Olympus带来强劲性能**
Vera的核心是NVIDIA定制的Olympus CPU核心。Olympus完全兼容Armv9.2指令集架构,专为支撑智能体AI的序列化CPU工作而设计,包括分支密集型运行时、沙箱代码、数据处理和编排。Vera采用单芯片设计,拥有宽核心、先进分支预测和第二代NVIDIA可扩展一致性互连结构,帮助数据在全部88个核心间高效流动。
Phoronix对单插槽Vera CPU(额定热设计功耗450瓦,内存功耗低于30瓦)的测试显示,它在既定的功耗范围内提供了卓越性能,并在代码编译、文件压缩、视频转码、Python、Java和数据库管理等广泛工作负载上实现了代际提升。这些正是智能体和AI工厂日常运行的CPU密集型任务:编译代码、执行运行时、压缩数据、查询数据库和协调大型软件栈。
“在测试之前,我真的不知道对采用新Olympus核心的NVIDIA Vera能有什么期待,”Phoronix创始人兼首席作者Michael Larabel写道,“但最终我意识到,这是迄今为止对Intel和AMD x86_64处理器最 formidable 的竞争。”
**内存性能的“不可思议优势”**
智能体工作负载不仅受核心数量的限制,还需要高核心利用率和持续的内存带宽,这使得每瓦内存性能成为CPU整体效率的关键部分。Vara集成了第二代LPDDR5X内存子系统,每比特能耗远低于DDR5。这使得Vera能够提供高达1.2TB/s的带宽——是传统CPU峰值内存带宽的2倍,而内存功耗低于30瓦,相比之下传统DDR5的功耗超过100瓦。
在Phoronix的STREAM TRIAD测试中,Vera保持了90%的峰值内存带宽——这是Phoronix测试过的所有CPU中最高百分比——并且每核心内存带宽是传统x86 CPU的4倍以上。“NVIDIA Vera凭借其LPDDR5X内存在内存性能上展现出了对当前Intel Xeon和AMD EPYC处理器的不可思议优势,”Larabel写道。
然而,峰值带宽只是故事的一部分。AI工厂工作负载同时运行大量沙箱、工具调用和数据服务。在与Vera的单独测试中,Prime Intellect发现,随着更多工作负载并行运行,Vera能够保持高带宽和低且一致的内存延迟——这正是智能体AI所需的可预测性能。
**巨大的代际飞跃——Phoronix测试中的领导地位**
与上一代NVIDIA Grace CPU相比,Vera在Phoronix测试中的几何平均性能提升达到了1.6倍——这是一个令人难以置信的代际提升。“从Grace到Vera的差异 consistently 超出了我对处理器代际性能提升的预期,”Larabel写道,“NVIDIA Vera凭借其内部设计的Olympus CPU核心,对Intel/AMD x86_64 CPU发起了重拳出击,我从未在任何其他ARM或非x86_64处理器上见过这样的竞争力。”
Vera在测试的CPU中领先,与最新一代128核x86处理器相比,整体性能优势达到1.5倍。这些提升体现在实际的开发者工作负载中。单插槽Vera仅用20秒就编译了一个默认Linux内核,这是Phoronix在该测试中记录的最快结果。Vera在每核心基础上,Linux内核编译速度是128核处理器的2倍。“从几何平均来看,NVIDIA Vera比AMD EPYC 9575F 5.0 GHz高频处理器性能高出10%,”Larabel写道。
**客户测试中的Vera——即将来自合作伙伴**
在NVIDIA GTC上,NVIDIA宣布了Vera的广泛生态系统支持,涵盖AI原生公司、超算中心、云服务提供商和基础设施提供商。NVIDIA已经向领先的AI公司和云提供商交付了首批Vera CPU,这标志着Vera向今年下半年的合作伙伴供货迈出了重要一步。Vera将通过合作伙伴以双插槽和单插槽系统形式提供,并提供风冷和液冷选项,以支持从标准企业数据中心到高密度智能体AI基础设施的AI工厂部署。
了解更多关于NVIDIA Vera的信息。