英伟达与微软合作打造统一堆栈,实现从Windows设备到云端与本地的智能体AI部署
在Microsoft Build大会上,英伟达与微软宣布扩展合作,推出面向Windows的RTX Spark和DGX Station、加速Microsoft Fabric、在Microsoft Foundry上提供NVIDIA开放模型、在GitHub Copilot中集成NVIDIA OpenShell安全运行时,以及下一代NVIDIA驱动的AI工厂。
在Microsoft Build大会上,英伟达创始人兼CEO黄仁勋通过直播连线,与微软CEO萨提亚·纳德拉共同宣布了双方在智能体AI领域的深度合作。此次合作涵盖从Windows设备到云端再到本地的完整堆栈,旨在为开发者提供构建和部署智能体AI的全套解决方案。
面向Windows的RTX Spark和DGX Station for Windows是本次合作的重点之一。RTX Spark是一款专为个人智能体设计的Windows PC,拥有1 petaflop的AI性能、高达128GB的统一内存和全天续航,支持CUDA、RTX、DLSS和TensorRT等英伟达技术。该产品将于今年秋季由微软Surface、华硕、戴尔、惠普、联想和微星推出。DGX Station for Windows则是功能更强大的桌面级AI超级计算机,采用NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip,提供748GB一致内存和20 petaflops FP4性能,可运行高达1万亿参数的模型。这两款产品均运行NVIDIA OpenShell安全运行时,为自主智能体提供安全保障。
在云端方面,NVIDIA的开放模型组合现已在Microsoft Foundry上可用。其中,NVIDIA Nemotron 3 Ultra是一款新的开放前沿推理模型,专为长时间运行的智能体设计,涵盖编码、研究和企业工作流。该模型本月已在Foundry托管计算上推出。此外,NVIDIA Cosmos 3作为首个完全开放的物理AI全模态模型,以及NVIDIA Earth-2 AI天气模型也已集成到微软平台。开发者还可以使用NVIDIA Agent Toolkit和NemoClaw蓝图在Foundry上构建生产级智能体。
在数据层,NVIDIA加速计算已内置于Microsoft Fabric Data Warehouse。根据微软内部基准测试,对于高并发工作负载,SQL执行速度比仅使用CPU的基线快6倍,比另外三家领先云数据仓库提供商快7倍。这使得企业数据层能够跟上持续查询和推理的AI智能体。
物理AI方面,微软正在将NVIDIA的开源物理AI技能和工具与Azure及其物理AI工具链集成。开发者可以通过Cosmos 3的混合变换器架构,模拟、训练和部署包括机器人、自动驾驶汽车和工业系统在内的自主系统。
对于本地部署,Microsoft正在将Foundry Local on Azure Local带到NVIDIA RTX PRO 6000 Blackwell Server Edition平台。搭配NVIDIA Nemotron开放模型家族,企业可以在本地、混合或主权环境中运行高性能AI工作负载,而无需牺牲性能或治理能力。
在安全方面,NVIDIA OpenShell现已集成到GitHub Copilot中。每个智能体在自己的沙盒容器中独立运行,每次出站调用都会在到达文件、网络或凭据之前根据策略进行评估。该工具为开源,采用Apache 2.0许可证,模型无关,可跨本地、混合和云环境使用。
最后,微软的Fairwater Wisconsin AI工厂已提前启用,运行数十万个NVIDIA Grace Blackwell系统,并与乔治亚州的类似工厂相连,形成可扩展的分布式AI系统。此外,微软已验证了NVIDIA Vera Rubin平台,该平台无需改造即可与Blackwell共存,每兆瓦推理吞吐量提升高达10倍,智能体代币成本降低一个数量级。内置的NVIDIA机密计算保护模型和数据,而NVIDIA Dynamo推理框架则将性能优势扩展到软件层面。