AI News HubLIVE
站内改写

NVIDIA Vera CPU抵达顶尖AI实验室,代理式AI需求增长

2026年5月19日,NVIDIA Vera CPU正式交付给Anthropic、OpenAI、Oracle Cloud Infrastructure和SpaceXAI等领先AI实验室。Vera是一款专为代理式AI工作负载设计的独立CPU,具备88个定制Olympus核心、1.2 TB/s内存带宽和50%的单核性能提升。该CPU旨在处理AI代理所需的并发实时任务,如工具调用、编排和长上下文检索。Oracle计划从2026年开始部署数十万个Vera CPU。

文章情报

工程师进阶

要点

  • NVIDIA Vera CPU已交付给Anthropic、OpenAI、Oracle Cloud Infrastructure和SpaceXAI。
  • Vera配备88个定制Olympus核心,1.2 TB/s内存带宽,单核性能提升50%。
  • Vera专为代理式AI设计,处理工具调用、编排等CPU密集型任务。
  • Oracle成为首家超大规模部署Vera的云提供商,计划2026年起部署数十万个。

为什么重要

这条新闻值得关注,因为NVIDIA Vera CPU已交付给Anthropic、OpenAI、Oracle Cloud Infrastructure和SpaceXAI。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

2026年5月19日,NVIDIA首席执行官黄仁勋在3月GTC大会上推出的独立Vera CPU正式从实验室进入客户手中。NVIDIA副总裁Ian Buck亲自将首批Vera CPU系统交付给Anthropic、OpenAI、Oracle Cloud Infrastructure和SpaceXAI,标志着代理式AI CPU从发布走向生产。

代理式AI对基础设施提出了前所未有的要求:AI代理不仅依赖GPU,还需要CPU处理沙箱环境、工具调用、编排层和长上下文检索。Vera正是为此而生,集成了88个NVIDIA定制的Olympus核心,提供1.2 TB/s的内存带宽和较上一代50%的单核性能提升,确保在持续负载下快速完成任务。

交付首站是Anthropic位于旧金山SoMa的办公室。Anthropic计算主管James Bradbury接收了系统,并表示:“扩展计算能力是模型增长的重要催化剂,我们很高兴看到Vera成为解决代理工作负载的有前途的生态系统部分。”

第二站是OpenAI位于Mission Bay的总部。OpenAI计算基础设施主管Sachin Katti感谢Buck送来服务器,Buck当场用螺丝刀打开机箱,展示内部结构。

当天最后一站是SpaceXAI在帕洛阿尔托的办公室。埃隆·马斯克仔细询问了核心、内存布局和散热细节。SpaceXAI正在评估Vera用于强化学习和基于代理的仿真训练流水线。

周一,Oracle Cloud Infrastructure在圣克拉拉的AI客户体验中心接收了Vera系统。Oracle产品管理负责人Karan Batta和客户与合作伙伴成功负责人Gary Miller参与了开箱。Batta表示:“OCI计划从2026年开始部署数十万个NVIDIA Vera CPU,因为代理式AI需要大规模持续性能。Vera的架构专为高吞吐推理设计,提供OCI所需的高效、高密度和低功耗。”OCI成为首家超大规模部署Vera的云提供商,为企业提供生产级代理式AI基础设施。

Vera是NVIDIA极致协同设计的一部分,与Rubin GPU、BlueField 4 DPU、Spectrum-X和MGX机架架构配合使用。作为Vera Rubin NVL72的主机处理器,Vera通过第二代NVLink-C2C连接一对Rubin GPU,共享统一内存架构,使加速计算保持高利用率。Vera的快速CPU核心和互连以两倍于传统基础设施的能效处理GPU所需的编排、控制和数据移动。

代理式AI时代终于拥有了专属CPU——NVIDIA Vera。