2026-06-03 03:00 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

英伟达与微软合作打造统一堆栈，实现从Windows设备到云端与本地的智能体AI部署

在Microsoft Build大会上，英伟达与微软宣布扩展合作，推出面向Windows的RTX Spark和DGX Station、加速Microsoft Fabric、在Microsoft Foundry上提供NVIDIA开放模型、在GitHub Copilot中集成NVIDIA OpenShell安全运行时，以及下一代NVIDIA驱动的AI工厂。

来源NVIDIA Blog作者: Dave Salvator

在Microsoft Build大会上，英伟达创始人兼CEO黄仁勋通过直播连线，与微软CEO萨提亚·纳德拉共同宣布了双方在智能体AI领域的深度合作。此次合作涵盖从Windows设备到云端再到本地的完整堆栈，旨在为开发者提供构建和部署智能体AI的全套解决方案。

面向Windows的RTX Spark和DGX Station for Windows是本次合作的重点之一。RTX Spark是一款专为个人智能体设计的Windows PC，拥有1 petaflop的AI性能、高达128GB的统一内存和全天续航，支持CUDA、RTX、DLSS和TensorRT等英伟达技术。该产品将于今年秋季由微软Surface、华硕、戴尔、惠普、联想和微星推出。DGX Station for Windows则是功能更强大的桌面级AI超级计算机，采用NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip，提供748GB一致内存和20 petaflops FP4性能，可运行高达1万亿参数的模型。这两款产品均运行NVIDIA OpenShell安全运行时，为自主智能体提供安全保障。

在云端方面，NVIDIA的开放模型组合现已在Microsoft Foundry上可用。其中，NVIDIA Nemotron 3 Ultra是一款新的开放前沿推理模型，专为长时间运行的智能体设计，涵盖编码、研究和企业工作流。该模型本月已在Foundry托管计算上推出。此外，NVIDIA Cosmos 3作为首个完全开放的物理AI全模态模型，以及NVIDIA Earth-2 AI天气模型也已集成到微软平台。开发者还可以使用NVIDIA Agent Toolkit和NemoClaw蓝图在Foundry上构建生产级智能体。

在数据层，NVIDIA加速计算已内置于Microsoft Fabric Data Warehouse。根据微软内部基准测试，对于高并发工作负载，SQL执行速度比仅使用CPU的基线快6倍，比另外三家领先云数据仓库提供商快7倍。这使得企业数据层能够跟上持续查询和推理的AI智能体。

物理AI方面，微软正在将NVIDIA的开源物理AI技能和工具与Azure及其物理AI工具链集成。开发者可以通过Cosmos 3的混合变换器架构，模拟、训练和部署包括机器人、自动驾驶汽车和工业系统在内的自主系统。

对于本地部署，Microsoft正在将Foundry Local on Azure Local带到NVIDIA RTX PRO 6000 Blackwell Server Edition平台。搭配NVIDIA Nemotron开放模型家族，企业可以在本地、混合或主权环境中运行高性能AI工作负载，而无需牺牲性能或治理能力。

在安全方面，NVIDIA OpenShell现已集成到GitHub Copilot中。每个智能体在自己的沙盒容器中独立运行，每次出站调用都会在到达文件、网络或凭据之前根据策略进行评估。该工具为开源，采用Apache 2.0许可证，模型无关，可跨本地、混合和云环境使用。

最后，微软的Fairwater Wisconsin AI工厂已提前启用，运行数十万个NVIDIA Grace Blackwell系统，并与乔治亚州的类似工厂相连，形成可扩展的分布式AI系统。此外，微软已验证了NVIDIA Vera Rubin平台，该平台无需改造即可与Blackwell共存，每兆瓦推理吞吐量提升高达10倍，智能体代币成本降低一个数量级。内置的NVIDIA机密计算保护模型和数据，而NVIDIA Dynamo推理框架则将性能优势扩展到软件层面。