NVIDIA Vera CPU為洛斯阿拉莫斯國家實驗室開啟智慧科學AI之路
洛斯阿拉莫斯國家實驗室(LANL)將採用NVIDIA Vera CPU構建三臺新超級計算機,旨在加速科學發現並實現智慧體AI。這些系統基於HPE Cray GX5000架構和NVIDIA Vera Rubin平臺,結合Vera CPU、Rubin GPU和Quantum-X800 InfiniBand網路。Vera CPU在早期測試中展現出卓越效能,例如在URSA工作負載上比Crossroads x86超級計算機的CPU快7倍,在熱傳導模擬工具Branson上快3倍以上。Mission系統預計2027年投入執行,將取代Crossroads處理機密國家安全工作負載;Vision系統將為基礎科學研究提供服務。
洛斯阿拉莫斯國家實驗室(LANL)正在與HPE和NVIDIA合作,打造三臺新的超級計算機——Mission、Vision和Veritas,這些系統將採用NVIDIA Vera CPU,以加速科學發現並開闢智慧體AI在科學領域的新應用。
這些超級計算機將基於HPE Cray Supercomputing GX5000架構和NVIDIA Vera Rubin平臺,融合NVIDIA Vera CPU、NVIDIA Rubin GPU和NVIDIA Quantum-X800 InfiniBand網路。根據規劃,Mission將包含NVIDIA Vera Rubin GPU節點和2,300個獨立的NVIDIA Vera CPU(採用HPE Cray GX240刀片)。Veritas則配備約1,150個獨立NVIDIA Vera CPU,用於補充Vera Rubin節點,並與Mission和Vision一同服務於實驗室指導的研究與發展計劃,加速科學領域的智慧體AI。
研究人員正在透過AI智慧體為科學增添新工具,這些智慧體能夠提出假設、選擇工具、啟動模擬、分析輸出並最佳化下一步。LANL在URSA(通用研究與科學智慧體)上的公開工作——執行於Venado,並即將應用於Mission和Vision——正是這一方向的具體體現:一個模組化、反饋驅動的AI框架,旨在幫助科學家構思假設、規劃實驗、執行模擬和分析結果。
LANL的測試顯示,Vera CPU在URSA工作負載上的效能是Crossroads x86超級計算機中CPU的7倍。在Branson(一個開源蒙特卡洛熱傳導模擬工具)的早期測試中,Vera CPU的效能也超過Crossroads x86 CPU的3倍以上。這些成果得益於Vera的定製Olympus核心、LPDDR5記憶體和快速片上結構。單個Vera CPU比單路x86 CPU效能提升3倍以上,每核心記憶體頻寬提升4倍,每節點記憶體容量提升6倍,從而為LANL提供更快的科學計算結果。
實驗室的所有超級計算機均由硬體架構師、系統軟體開發者、領域科學家、電腦科學家和應用數學家共同設計,確保系統根據真實科學工作負載而非抽象基準來塑造。
Mission預計於2027年投入執行,將成為國家核安全域性先進模擬與計算專案的第五套先進技術系統,並取代Crossroads處理機密國家安全工作負載。Vision同樣計劃於2027年上線,將為基礎科學研究提供資源,包括材料科學、核科學、能源建模、生物醫學研究和AI,讓更多科學家在進入更高風險工作之前能夠測試方法、訓練模型和探索想法。
這項工作延續了LANL與NVIDIA在CPU領域超過十年的深度合作,從Grace到Vera,透過極端協同設計滿足LANL的模擬工作負載需求。三臺新超級計算機基於Venado——2024年安裝在洛斯阿拉莫斯的HPE Cray EX超級計算機,採用NVIDIA GH200 Grace Hopper超級晶片和NVIDIA Grace CPU超級晶片。
瞭解更多關於NVIDIA Vera CPU的資訊。