AI News HubLIVE
站內改寫2 分鐘閱讀

NVIDIA Vera CPU為洛斯阿拉莫斯國家實驗室開啓智能科學AI之路

洛斯阿拉莫斯國家實驗室(LANL)將採用NVIDIA Vera CPU構建三台新超級計算機,旨在加速科學發現並實現智能體AI。這些系統基於HPE Cray GX5000架構和NVIDIA Vera Rubin平台,結合Vera CPU、Rubin GPU和Quantum-X800 InfiniBand網絡。Vera CPU在早期測試中展現出卓越性能,例如在URSA工作負載上比Crossroads x86超級計算機的CPU快7倍,在熱傳導模擬工具Branson上快3倍以上。Mission系統預計2027年投入運行,將取代Crossroads處理機密國家安全工作負載;Vision系統將為基礎科學研究提供服務。

來源NVIDIA Blog作者: Chris Porter

洛斯阿拉莫斯國家實驗室(LANL)正在與HPE和NVIDIA合作,打造三台新的超級計算機——Mission、Vision和Veritas,這些系統將採用NVIDIA Vera CPU,以加速科學發現並開闢智能體AI在科學領域的新應用。

這些超級計算機將基於HPE Cray Supercomputing GX5000架構和NVIDIA Vera Rubin平台,融合NVIDIA Vera CPU、NVIDIA Rubin GPU和NVIDIA Quantum-X800 InfiniBand網絡。根據規劃,Mission將包含NVIDIA Vera Rubin GPU節點和2,300個獨立的NVIDIA Vera CPU(採用HPE Cray GX240刀片)。Veritas則配備約1,150個獨立NVIDIA Vera CPU,用於補充Vera Rubin節點,並與Mission和Vision一同服務於實驗室指導的研究與發展計劃,加速科學領域的智能體AI。

研究人員正在通過AI智能體為科學增添新工具,這些智能體能夠提出假設、選擇工具、啓動模擬、分析輸出並優化下一步。LANL在URSA(通用研究與科學智能體)上的公開工作——運行於Venado,並即將應用於Mission和Vision——正是這一方向的具體體現:一個模塊化、反饋驅動的AI框架,旨在幫助科學家構思假設、規劃實驗、運行模擬和分析結果。

LANL的測試顯示,Vera CPU在URSA工作負載上的性能是Crossroads x86超級計算機中CPU的7倍。在Branson(一個開源蒙特卡洛熱傳導模擬工具)的早期測試中,Vera CPU的性能也超過Crossroads x86 CPU的3倍以上。這些成果得益於Vera的定製Olympus核心、LPDDR5內存和快速片上結構。單個Vera CPU比單路x86 CPU性能提升3倍以上,每核心內存帶寬提升4倍,每節點內存容量提升6倍,從而為LANL提供更快的科學計算結果。

實驗室的所有超級計算機均由硬件架構師、系統軟件開發者、領域科學家、計算機科學家和應用數學家共同設計,確保系統根據真實科學工作負載而非抽象基準來塑造。

Mission預計於2027年投入運行,將成為國家核安全局先進模擬與計算項目的第五套先進技術系統,並取代Crossroads處理機密國家安全工作負載。Vision同樣計劃於2027年上線,將為基礎科學研究提供資源,包括材料科學、核科學、能源建模、生物醫學研究和AI,讓更多科學家在進入更高風險工作之前能夠測試方法、訓練模型和探索想法。

這項工作延續了LANL與NVIDIA在CPU領域超過十年的深度合作,從Grace到Vera,通過極端協同設計滿足LANL的模擬工作負載需求。三台新超級計算機基於Venado——2024年安裝在洛斯阿拉莫斯的HPE Cray EX超級計算機,採用NVIDIA GH200 Grace Hopper超級芯片和NVIDIA Grace CPU超級芯片。

瞭解更多關於NVIDIA Vera CPU的信息。