NVIDIA Vera CPU抵達頂尖AI實驗室,代理式AI需求增長
2026年5月19日,NVIDIA Vera CPU正式交付給Anthropic、OpenAI、Oracle Cloud Infrastructure和SpaceXAI等領先AI實驗室。Vera是一款專為代理式AI工作負載設計的獨立CPU,具備88個定製Olympus核心、1.2 TB/s記憶體頻寬和50%的單核效能提升。該CPU旨在處理AI代理所需的併發即時任務,如工具呼叫、編排和長上下文檢索。Oracle計劃從2026年開始部署數十萬個Vera CPU。
文章情報
要點
- NVIDIA Vera CPU已交付給Anthropic、OpenAI、Oracle Cloud Infrastructure和SpaceXAI。
- Vera配備88個定製Olympus核心,1.2 TB/s記憶體頻寬,單核效能提升50%。
- Vera專為代理式AI設計,處理工具呼叫、編排等CPU密集型任務。
- Oracle成為首家超大規模部署Vera的雲提供商,計劃2026年起部署數十萬個。
為什麼重要
這條新聞值得關注,因為NVIDIA Vera CPU已交付給Anthropic、OpenAI、Oracle Cloud Infrastructure和SpaceXAI。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
2026年5月19日,NVIDIA執行長黃仁勳在3月GTC大會上推出的獨立Vera CPU正式從實驗室進入客戶手中。NVIDIA副總裁Ian Buck親自將首批Vera CPU系統交付給Anthropic、OpenAI、Oracle Cloud Infrastructure和SpaceXAI,標誌著代理式AI CPU從釋出走向生產。
代理式AI對基礎設施提出了前所未有的要求:AI代理不僅依賴GPU,還需要CPU處理沙箱環境、工具呼叫、編排層和長上下文檢索。Vera正是為此而生,整合了88個NVIDIA定製的Olympus核心,提供1.2 TB/s的記憶體頻寬和較上一代50%的單核效能提升,確保在持續負載下快速完成任務。
交付首站是Anthropic位於舊金山SoMa的辦公室。Anthropic計算主管James Bradbury接收了系統,並表示:“擴充套件計算能力是模型增長的重要催化劑,我們很高興看到Vera成為解決代理工作負載的有前途的生態系統部分。”
第二站是OpenAI位於Mission Bay的總部。OpenAI計算基礎設施主管Sachin Katti感謝Buck送來伺服器,Buck當場用螺絲刀開啟機箱,展示內部結構。
當天最後一站是SpaceXAI在帕洛阿爾託的辦公室。埃隆·馬斯克仔細詢問了核心、記憶體佈局和散熱細節。SpaceXAI正在評估Vera用於強化學習和基於代理的模擬訓練流水線。
週一,Oracle Cloud Infrastructure在聖克拉拉的AI客戶體驗中心接收了Vera系統。Oracle產品管理負責人Karan Batta和客戶與合作伙伴成功負責人Gary Miller參與了開箱。Batta表示:“OCI計劃從2026年開始部署數十萬個NVIDIA Vera CPU,因為代理式AI需要大規模持續效能。Vera的架構專為高吞吐推理設計,提供OCI所需的高效、高密度和低功耗。”OCI成為首家超大規模部署Vera的雲提供商,為企業提供生產級代理式AI基礎設施。
Vera是NVIDIA極致協同設計的一部分,與Rubin GPU、BlueField 4 DPU、Spectrum-X和MGX機架架構配合使用。作為Vera Rubin NVL72的主機處理器,Vera透過第二代NVLink-C2C連線一對Rubin GPU,共享統一記憶體架構,使加速計算保持高利用率。Vera的快速CPU核心和互連以兩倍於傳統基礎設施的能效處理GPU所需的編排、控制和資料移動。
代理式AI時代終於擁有了專屬CPU——NVIDIA Vera。