輝達與微軟合作打造統一堆疊,實現從Windows裝置到雲端與本地的智慧體AI部署
在Microsoft Build大會上,輝達與微軟宣佈擴充套件合作,推出面向Windows的RTX Spark和DGX Station、加速Microsoft Fabric、在Microsoft Foundry上提供NVIDIA開放模型、在GitHub Copilot中整合NVIDIA OpenShell安全執行時,以及下一代NVIDIA驅動的AI工廠。
在Microsoft Build大會上,輝達創始人兼CEO黃仁勳透過直播連線,與微軟CEO薩提亞·納德拉共同宣佈了雙方在智慧體AI領域的深度合作。此次合作涵蓋從Windows裝置到雲端再到本地的完整堆疊,旨在為開發者提供構建和部署智慧體AI的全套解決方案。
面向Windows的RTX Spark和DGX Station for Windows是本次合作的重點之一。RTX Spark是一款專為個人智慧體設計的Windows PC,擁有1 petaflop的AI效能、高達128GB的統一記憶體和全天續航,支援CUDA、RTX、DLSS和TensorRT等輝達技術。該產品將於今年秋季由微軟Surface、華碩、戴爾、惠普、聯想和微星推出。DGX Station for Windows則是功能更強大的桌面級AI超級計算機,採用NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip,提供748GB一致記憶體和20 petaflops FP4效能,可執行高達1萬億引數的模型。這兩款產品均執行NVIDIA OpenShell安全執行時,為自主智慧體提供安全保障。
在雲端方面,NVIDIA的開放模型組合現已在Microsoft Foundry上可用。其中,NVIDIA Nemotron 3 Ultra是一款新的開放前沿推理模型,專為長時間執行的智慧體設計,涵蓋編碼、研究和企業工作流。該模型本月已在Foundry託管計算上推出。此外,NVIDIA Cosmos 3作為首個完全開放的物理AI全模態模型,以及NVIDIA Earth-2 AI天氣模型也已整合到微軟平臺。開發者還可以使用NVIDIA Agent Toolkit和NemoClaw藍圖在Foundry上構建生產級智慧體。
在資料層,NVIDIA加速計算已內建於Microsoft Fabric Data Warehouse。根據微軟內部基準測試,對於高併發工作負載,SQL執行速度比僅使用CPU的基線快6倍,比另外三家領先雲資料倉儲提供商快7倍。這使得企業資料層能夠跟上持續查詢和推理的AI智慧體。
物理AI方面,微軟正在將NVIDIA的開源物理AI技能和工具與Azure及其物理AI工具鏈整合。開發者可以透過Cosmos 3的混合變換器架構,模擬、訓練和部署包括機器人、自動駕駛汽車和工業系統在內的自主系統。
對於本地部署,Microsoft正在將Foundry Local on Azure Local帶到NVIDIA RTX PRO 6000 Blackwell Server Edition平臺。搭配NVIDIA Nemotron開放模型家族,企業可以在本地、混合或主權環境中執行高效能AI工作負載,而無需犧牲效能或治理能力。
在安全方面,NVIDIA OpenShell現已整合到GitHub Copilot中。每個智慧體在自己的沙盒容器中獨立執行,每次出站呼叫都會在到達檔案、網路或憑據之前根據策略進行評估。該工具為開源,採用Apache 2.0許可證,模型無關,可跨本地、混合和雲環境使用。
最後,微軟的Fairwater Wisconsin AI工廠已提前啟用,執行數十萬個NVIDIA Grace Blackwell系統,並與喬治亞州的類似工廠相連,形成可擴充套件的分散式AI系統。此外,微軟已驗證了NVIDIA Vera Rubin平臺,該平臺無需改造即可與Blackwell共存,每兆瓦推理吞吐量提升高達10倍,智慧體代幣成本降低一個數量級。內建的NVIDIA機密計算保護模型和資料,而NVIDIA Dynamo推理框架則將效能優勢擴充套件到軟體層面。