Vera 到來:輝達首款為智慧體打造的 CPU 抵達頂級 AI 實驗室
輝達副總裁 Ian Buck 親手將首款 Vera CPU 系統交付給 Anthropic、OpenAI、SpaceXAI 和甲骨文雲基礎設施。Vera 專為智慧體 AI 工作負載設計,擁有 88 個定製核心、1.2 TB/s 記憶體頻寬和 50% 的單核效能提升。
文章情報
要點
- 輝達 Vera CPU 是首款為智慧體 AI 設計的定製 CPU,已交付給頂級 AI 實驗室。
- 副總裁 Ian Buck 親自將系統送到 Anthropic、OpenAI、SpaceXAI 和甲骨文手中。
- Vera 針對工具呼叫、編排、長上下文檢索等智慧體任務進行了最佳化。
- 該 CPU 是輝達全棧 AI 基礎設施的一部分,配合 Rubin GPU 和 BlueField 4 DPU。
為什麼重要
這條新聞值得關注,因為輝達 Vera CPU 是首款為智慧體 AI 設計的定製 CPU,已交付給頂級 AI 實驗室。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
輝達的 Vera CPU 標誌著 AI 基礎設施的一個轉折點。5 月 18 日,輝達副總裁 Ian Buck 親自將首批 Vera CPU 系統交付給三家頂級 AI 實驗室——舊金山的 Anthropic、Mission Bay 的 OpenAI 和帕洛阿爾託的 SpaceXAI,隨後於 5 月 20 日將其送抵聖克拉拉的甲骨文雲基礎設施(OCI)。這一舉措標誌著專為智慧體 AI 設計的 CPU 從釋出走向生產。
Vera 是輝達首款定製 CPU,於 3 月的 GTC 聖何塞大會上由 CEO 黃仁勳釋出,被定位為輝達下一個數十億美元的業務。與傳統的 CPU 不同,Vera 專門針對智慧體 AI 的需求而設計——這些工作負載不僅依賴 GPU,還需要 CPU 處理工具呼叫、編排層、長上下文檢索和即時併發任務。Vera 配備了 88 個輝達定製的 Olympus 核心,提供 1.2 TB/s 的記憶體頻寬和 50% 的單核效能提升,確保在持續負載下更快地完成任務。
在 Anthropic 的 SoMa 辦公室,計算負責人 James Bradbury 從 Buck 手中接過系統,並稱贊 Vera 是“解決智慧體工作負載時生態系統中有前景的一部分”。在 OpenAI 的 Mission Bay 總部,基礎設施負責人 Sachin Katti 在露天陽臺與 Buck 會面,Buck 甚至用螺絲刀開啟機箱展示內部設計。在 SpaceXAI,Elon Musk 親自檢查了系統,並詳細詢問了核心、記憶體佈局和散熱問題——該公司計劃將 Vera 用於強化學習和基於智慧體的模擬流水線。
甲骨文雲基礎設施是首家超大規模部署 Vera 的雲提供商。在聖克拉拉的甲骨文 AI 客戶卓越中心,OCI 團隊評估了該系統。OCI 產品管理負責人 Karan Batta 表示:“Vera 的架構專為高吞吐量推理工作負載而設計,提供了 OCI 所需的高效性、密度和空間。” OCI 計劃從 2026 年開始部署數十萬個 Vera CPU,為企業客戶提供生產級的智慧體 AI 基礎設施。
Vera 不僅是獨立的 CPU 系統,它還是輝達 Vera Rubin NVL72 的主處理器,透過第二代 NVLink-C2C 與一對 Rubin GPU 配對,形成統一記憶體架構。這種設計使加速計算保持高利用率,同時以傳統基礎設施兩倍的能效處理 GPU 所需的編排和資料移動。隨著智慧體 AI 時代的到來,Vera 為這一新正規化提供了專門的算力基礎。