NVIDIA Vera CPU为洛斯阿拉莫斯国家实验室开启智能科学AI之路
洛斯阿拉莫斯国家实验室(LANL)将采用NVIDIA Vera CPU构建三台新超级计算机,旨在加速科学发现并实现智能体AI。这些系统基于HPE Cray GX5000架构和NVIDIA Vera Rubin平台,结合Vera CPU、Rubin GPU和Quantum-X800 InfiniBand网络。Vera CPU在早期测试中展现出卓越性能,例如在URSA工作负载上比Crossroads x86超级计算机的CPU快7倍,在热传导模拟工具Branson上快3倍以上。Mission系统预计2027年投入运行,将取代Crossroads处理机密国家安全工作负载;Vision系统将为基础科学研究提供服务。
洛斯阿拉莫斯国家实验室(LANL)正在与HPE和NVIDIA合作,打造三台新的超级计算机——Mission、Vision和Veritas,这些系统将采用NVIDIA Vera CPU,以加速科学发现并开辟智能体AI在科学领域的新应用。
这些超级计算机将基于HPE Cray Supercomputing GX5000架构和NVIDIA Vera Rubin平台,融合NVIDIA Vera CPU、NVIDIA Rubin GPU和NVIDIA Quantum-X800 InfiniBand网络。根据规划,Mission将包含NVIDIA Vera Rubin GPU节点和2,300个独立的NVIDIA Vera CPU(采用HPE Cray GX240刀片)。Veritas则配备约1,150个独立NVIDIA Vera CPU,用于补充Vera Rubin节点,并与Mission和Vision一同服务于实验室指导的研究与发展计划,加速科学领域的智能体AI。
研究人员正在通过AI智能体为科学增添新工具,这些智能体能够提出假设、选择工具、启动模拟、分析输出并优化下一步。LANL在URSA(通用研究与科学智能体)上的公开工作——运行于Venado,并即将应用于Mission和Vision——正是这一方向的具体体现:一个模块化、反馈驱动的AI框架,旨在帮助科学家构思假设、规划实验、运行模拟和分析结果。
LANL的测试显示,Vera CPU在URSA工作负载上的性能是Crossroads x86超级计算机中CPU的7倍。在Branson(一个开源蒙特卡洛热传导模拟工具)的早期测试中,Vera CPU的性能也超过Crossroads x86 CPU的3倍以上。这些成果得益于Vera的定制Olympus核心、LPDDR5内存和快速片上结构。单个Vera CPU比单路x86 CPU性能提升3倍以上,每核心内存带宽提升4倍,每节点内存容量提升6倍,从而为LANL提供更快的科学计算结果。
实验室的所有超级计算机均由硬件架构师、系统软件开发者、领域科学家、计算机科学家和应用数学家共同设计,确保系统根据真实科学工作负载而非抽象基准来塑造。
Mission预计于2027年投入运行,将成为国家核安全局先进模拟与计算项目的第五套先进技术系统,并取代Crossroads处理机密国家安全工作负载。Vision同样计划于2027年上线,将为基础科学研究提供资源,包括材料科学、核科学、能源建模、生物医学研究和AI,让更多科学家在进入更高风险工作之前能够测试方法、训练模型和探索想法。
这项工作延续了LANL与NVIDIA在CPU领域超过十年的深度合作,从Grace到Vera,通过极端协同设计满足LANL的模拟工作负载需求。三台新超级计算机基于Venado——2024年安装在洛斯阿拉莫斯的HPE Cray EX超级计算机,采用NVIDIA GH200 Grace Hopper超级芯片和NVIDIA Grace CPU超级芯片。
了解更多关于NVIDIA Vera CPU的信息。