英偉達與微軟合作打造統一堆棧,實現從Windows設備到雲端與本地的智能體AI部署
在Microsoft Build大會上,英偉達與微軟宣佈擴展合作,推出面向Windows的RTX Spark和DGX Station、加速Microsoft Fabric、在Microsoft Foundry上提供NVIDIA開放模型、在GitHub Copilot中集成NVIDIA OpenShell安全運行時,以及下一代NVIDIA驅動的AI工廠。
在Microsoft Build大會上,英偉達創始人兼CEO黃仁勳通過直播連線,與微軟CEO薩提亞·納德拉共同宣佈了雙方在智能體AI領域的深度合作。此次合作涵蓋從Windows設備到雲端再到本地的完整堆棧,旨在為開發者提供構建和部署智能體AI的全套解決方案。
面向Windows的RTX Spark和DGX Station for Windows是本次合作的重點之一。RTX Spark是一款專為個人智能體設計的Windows PC,擁有1 petaflop的AI性能、高達128GB的統一內存和全天續航,支持CUDA、RTX、DLSS和TensorRT等英偉達技術。該產品將於今年秋季由微軟Surface、華碩、戴爾、惠普、聯想和微星推出。DGX Station for Windows則是功能更強大的桌面級AI超級計算機,採用NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip,提供748GB一致內存和20 petaflops FP4性能,可運行高達1萬億參數的模型。這兩款產品均運行NVIDIA OpenShell安全運行時,為自主智能體提供安全保障。
在雲端方面,NVIDIA的開放模型組合現已在Microsoft Foundry上可用。其中,NVIDIA Nemotron 3 Ultra是一款新的開放前沿推理模型,專為長時間運行的智能體設計,涵蓋編碼、研究和企業工作流。該模型本月已在Foundry託管計算上推出。此外,NVIDIA Cosmos 3作為首個完全開放的物理AI全模態模型,以及NVIDIA Earth-2 AI天氣模型也已集成到微軟平台。開發者還可以使用NVIDIA Agent Toolkit和NemoClaw藍圖在Foundry上構建生產級智能體。
在數據層,NVIDIA加速計算已內置於Microsoft Fabric Data Warehouse。根據微軟內部基準測試,對於高併發工作負載,SQL執行速度比僅使用CPU的基線快6倍,比另外三家領先雲數據倉庫提供商快7倍。這使得企業數據層能夠跟上持續查詢和推理的AI智能體。
物理AI方面,微軟正在將NVIDIA的開源物理AI技能和工具與Azure及其物理AI工具鏈集成。開發者可以通過Cosmos 3的混合變換器架構,模擬、訓練和部署包括機器人、自動駕駛汽車和工業系統在內的自主系統。
對於本地部署,Microsoft正在將Foundry Local on Azure Local帶到NVIDIA RTX PRO 6000 Blackwell Server Edition平台。搭配NVIDIA Nemotron開放模型家族,企業可以在本地、混合或主權環境中運行高性能AI工作負載,而無需犧牲性能或治理能力。
在安全方面,NVIDIA OpenShell現已集成到GitHub Copilot中。每個智能體在自己的沙盒容器中獨立運行,每次出站調用都會在到達文件、網絡或憑據之前根據策略進行評估。該工具為開源,採用Apache 2.0許可證,模型無關,可跨本地、混合和雲環境使用。
最後,微軟的Fairwater Wisconsin AI工廠已提前啓用,運行數十萬個NVIDIA Grace Blackwell系統,並與喬治亞州的類似工廠相連,形成可擴展的分佈式AI系統。此外,微軟已驗證了NVIDIA Vera Rubin平台,該平台無需改造即可與Blackwell共存,每兆瓦推理吞吐量提升高達10倍,智能體代幣成本降低一個數量級。內置的NVIDIA機密計算保護模型和數據,而NVIDIA Dynamo推理框架則將性能優勢擴展到軟件層面。