AI News HubLIVE
站内改写2 分钟阅读

HPE ProLiant Compute DL394 Gen12 将 NVIDIA Vera CPU 引入代理式 AI

HPE 在 COMPUTEX 2026 上发布了 ProLiant Compute DL394 Gen12,一款基于 NVIDIA Vera CPU 的 2U 服务器,专为代理式 AI 和数据密集型工作负载设计。该平台集成了 HPE 的企业管理和安全堆栈,并与 NVIDIA 和 Redpanda 合作,纽约证券交易所正在探索用于其代理式 AI 基础设施。服务器采用单芯片架构,配备 LPDDR5X 内存,带宽高达 1.2TB/s,并支持量子抵抗加密。预计 2026 年秋季上市。

来源Hacker News AI作者: rbanffy

HPE 在 COMPUTEX 2026 上正式发布了 ProLiant Compute DL394 Gen12,这是一款基于 NVIDIA Vera CPU 的下一代 2U 服务器,旨在支持新兴的代理式 AI 和数据密集型工作负载,这些工作负载需要高内存带宽、低延迟和确定性性能。该系统集成了 HPE 的企业管理和安全堆栈,包括 Integrated Lights-Out (iLO) 和 Compute Ops Management,面向部署大规模 AI 和实时数据处理环境的组织。

此次发布与 HPE、NVIDIA 和数据流公司 Redpanda 之间的新合作有关,纽约证券交易所正在探索将相关技术用于其代理式 AI 基础设施。这项工作专注于针对代理式 AI 优化的技术,涵盖数据存储和处理、监控、管理和安全,而 DL394 Gen12 则作为基础计算平台。NYSE 是早期的验证点,符合 HPE 瞄准的金融服务工作负载特征。

HPE 领导层将此次发布定位为从生成式 AI 向代理式 AI 的转变,代理式 AI 系统能够执行实时推理并做出自主决策,这对延迟一致性和内存吞吐量提出了更高要求。NVIDIA 将 Vera 定位为专为编排 AI 工厂而设计,声称其效率是 x86 的两倍,任务完成速度更快。DL394 Gen12 旨在将这些能力投入企业和金融服务部署中。

架构聚焦内存带宽与延迟

DL394 Gen12 以 NVIDIA Vera CPU 为核心,采用单芯片架构而非小芯片设计。这种方法避免了高核心数处理器中常见的非均匀内存访问(NUMA)特性(内存延迟会因数据位置而异),通过消除 NUMA 相关的可变性,该平台旨在为分布式 AI 工作负载提供更可预测的性能。

该系统采用 LPDDR5X 内存,总带宽可达 1.2TB/s,每核心约 14GB/s。这一吞吐量旨在支持高速数据摄入和处理,特别是需要连续流处理和实时推理的工作负载。在此配置中,Vera CPU 充当编排层,平衡工作负载间的计算和内存资源,以减少低效并提高利用率。

集成安全与生命周期保护

通过 HPE 的硅信任根,安全机制嵌入硬件和固件层面。DL394 Gen12 还集成了带有安全飞地的 iLO 7,从制造到退役全程保护服务器生命周期。这些功能旨在缓解固件级攻击,并确保在受监管环境中的系统完整性。

HPE 表示,这一代 ProLiant 系统是首批满足 NIST 量子抵抗密码学要求的系统。这使得该平台能够长期部署在数据保护标准预期将随着新兴威胁而演变的环境中。

统一管理与 AI 驱动运维

DL394 Gen12 集成了 HPE Compute Ops Management,提供了一个用于管理分布式基础设施的集中平台。该软件层提供 AI 驱动的系统健康、性能和容量洞察,减少运维开销并最大程度减少停机时间。

通过将监控和自动化整合到单一界面,HPE 旨在简化大规模运营组织的基础设施管理。这对于 AI 部署尤为重要,因为动态工作负载和资源需求需要持续优化。

上市时间

HPE ProLiant Compute DL394 Gen12 预计将于 2026 年秋季作为 HPE 的 NVIDIA AI Computing 产品组合的一部分上市。