Vera 到来:英伟达首款为智能体打造的 CPU 抵达顶级 AI 实验室
英伟达副总裁 Ian Buck 亲手将首款 Vera CPU 系统交付给 Anthropic、OpenAI、SpaceXAI 和甲骨文云基础设施。Vera 专为智能体 AI 工作负载设计,拥有 88 个定制内核、1.2 TB/s 内存带宽和 50% 的单核性能提升。
文章情报
要点
- 英伟达 Vera CPU 是首款为智能体 AI 设计的定制 CPU,已交付给顶级 AI 实验室。
- 副总裁 Ian Buck 亲自将系统送到 Anthropic、OpenAI、SpaceXAI 和甲骨文手中。
- Vera 针对工具调用、编排、长上下文检索等智能体任务进行了优化。
- 该 CPU 是英伟达全栈 AI 基础设施的一部分,配合 Rubin GPU 和 BlueField 4 DPU。
为什么重要
这条新闻值得关注,因为英伟达 Vera CPU 是首款为智能体 AI 设计的定制 CPU,已交付给顶级 AI 实验室。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
英伟达的 Vera CPU 标志着 AI 基础设施的一个转折点。5 月 18 日,英伟达副总裁 Ian Buck 亲自将首批 Vera CPU 系统交付给三家顶级 AI 实验室——旧金山的 Anthropic、Mission Bay 的 OpenAI 和帕洛阿尔托的 SpaceXAI,随后于 5 月 20 日将其送抵圣克拉拉的甲骨文云基础设施(OCI)。这一举措标志着专为智能体 AI 设计的 CPU 从发布走向生产。
Vera 是英伟达首款定制 CPU,于 3 月的 GTC 圣何塞大会上由 CEO 黄仁勋发布,被定位为英伟达下一个数十亿美元的业务。与传统的 CPU 不同,Vera 专门针对智能体 AI 的需求而设计——这些工作负载不仅依赖 GPU,还需要 CPU 处理工具调用、编排层、长上下文检索和实时并发任务。Vera 配备了 88 个英伟达定制的 Olympus 内核,提供 1.2 TB/s 的内存带宽和 50% 的单核性能提升,确保在持续负载下更快地完成任务。
在 Anthropic 的 SoMa 办公室,计算负责人 James Bradbury 从 Buck 手中接过系统,并称赞 Vera 是“解决智能体工作负载时生态系统中有前景的一部分”。在 OpenAI 的 Mission Bay 总部,基础设施负责人 Sachin Katti 在露天阳台与 Buck 会面,Buck 甚至用螺丝刀打开机箱展示内部设计。在 SpaceXAI,Elon Musk 亲自检查了系统,并详细询问了内核、内存布局和散热问题——该公司计划将 Vera 用于强化学习和基于智能体的模拟流水线。
甲骨文云基础设施是首家超大规模部署 Vera 的云提供商。在圣克拉拉的甲骨文 AI 客户卓越中心,OCI 团队评估了该系统。OCI 产品管理负责人 Karan Batta 表示:“Vera 的架构专为高吞吐量推理工作负载而设计,提供了 OCI 所需的高效性、密度和空间。” OCI 计划从 2026 年开始部署数十万个 Vera CPU,为企业客户提供生产级的智能体 AI 基础设施。
Vera 不仅是独立的 CPU 系统,它还是英伟达 Vera Rubin NVL72 的主处理器,通过第二代 NVLink-C2C 与一对 Rubin GPU 配对,形成统一内存架构。这种设计使加速计算保持高利用率,同时以传统基础设施两倍的能效处理 GPU 所需的编排和数据移动。随着智能体 AI 时代的到来,Vera 为这一新范式提供了专门的算力基础。