AI News HubLIVE
站内改写2 分鐘閱讀

HPE ProLiant Compute DL394 Gen12 將 NVIDIA Vera CPU 引入代理式 AI

HPE 在 COMPUTEX 2026 上釋出了 ProLiant Compute DL394 Gen12,一款基於 NVIDIA Vera CPU 的 2U 伺服器,專為代理式 AI 和資料密集型工作負載設計。該平臺整合了 HPE 的企業管理和安全堆疊,並與 NVIDIA 和 Redpanda 合作,紐約證券交易所正在探索用於其代理式 AI 基礎設施。伺服器採用單晶片架構,配備 LPDDR5X 記憶體,頻寬高達 1.2TB/s,並支援量子抵抗加密。預計 2026 年秋季上市。

來源Hacker News AI作者: rbanffy

HPE 在 COMPUTEX 2026 上正式釋出了 ProLiant Compute DL394 Gen12,這是一款基於 NVIDIA Vera CPU 的下一代 2U 伺服器,旨在支援新興的代理式 AI 和資料密集型工作負載,這些工作負載需要高記憶體頻寬、低延遲和確定性效能。該系統整合了 HPE 的企業管理和安全堆疊,包括 Integrated Lights-Out (iLO) 和 Compute Ops Management,面向部署大規模 AI 和即時資料處理環境的組織。

此次釋出與 HPE、NVIDIA 和資料流公司 Redpanda 之間的新合作有關,紐約證券交易所正在探索將相關技術用於其代理式 AI 基礎設施。這項工作專注於針對代理式 AI 最佳化的技術,涵蓋資料儲存和處理、監控、管理和安全,而 DL394 Gen12 則作為基礎計算平臺。NYSE 是早期的驗證點,符合 HPE 瞄準的金融服務工作負載特徵。

HPE 領導層將此次釋出定位為從生成式 AI 向代理式 AI 的轉變,代理式 AI 系統能夠執行即時推理並做出自主決策,這對延遲一致性和記憶體吞吐量提出了更高要求。NVIDIA 將 Vera 定位為專為編排 AI 工廠而設計,聲稱其效率是 x86 的兩倍,任務完成速度更快。DL394 Gen12 旨在將這些能力投入企業和金融服務部署中。

架構聚焦記憶體頻寬與延遲

DL394 Gen12 以 NVIDIA Vera CPU 為核心,採用單晶片架構而非小晶片設計。這種方法避免了高核心數處理器中常見的非均勻記憶體訪問(NUMA)特性(記憶體延遲會因資料位置而異),透過消除 NUMA 相關的可變性,該平臺旨在為分散式 AI 工作負載提供更可預測的效能。

該系統採用 LPDDR5X 記憶體,總頻寬可達 1.2TB/s,每核心約 14GB/s。這一吞吐量旨在支援高速資料攝入和處理,特別是需要連續流處理和即時推理的工作負載。在此配置中,Vera CPU 充當編排層,平衡工作負載間的計算和記憶體資源,以減少低效並提高利用率。

整合安全與生命週期保護

透過 HPE 的矽信任根,安全機制嵌入硬體和韌體層面。DL394 Gen12 還整合了帶有安全飛地的 iLO 7,從製造到退役全程保護伺服器生命週期。這些功能旨在緩解韌體級攻擊,並確保在受監管環境中的系統完整性。

HPE 表示,這一代 ProLiant 系統是首批滿足 NIST 量子抵抗密碼學要求的系統。這使得該平臺能夠長期部署在資料保護標準預期將隨著新興威脅而演變的環境中。

統一管理與 AI 驅動運維

DL394 Gen12 整合了 HPE Compute Ops Management,提供了一個用於管理分散式基礎設施的集中平臺。該軟體層提供 AI 驅動的系統健康、效能和容量洞察,減少運維開銷並最大程度減少停機時間。

透過將監控和自動化整合到單一介面,HPE 旨在簡化大規模運營組織的基礎設施管理。這對於 AI 部署尤為重要,因為動態工作負載和資源需求需要持續最佳化。

上市時間

HPE ProLiant Compute DL394 Gen12 預計將於 2026 年秋季作為 HPE 的 NVIDIA AI Computing 產品組合的一部分上市。