NVIDIA、マイクロソフトと協業し、Windowsデバイスからクラウド、ローカルまでエージェント型AI展開のための統合スタックを提供
Microsoft BuildでNVIDIAとマイクロソフトは、Windowsデバイス、Azureクラウド、ローカル展開向けにエージェント型AIを提供する拡張パートナーシップを発表。RTX SparkとDGX Station for Windows、Microsoft Foundry上のNVIDIAオープンモデル、GitHub CopilotへのOpenShell統合など。
Microsoft Buildで、NVIDIAの創業者兼CEOであるジェンスン・フアン氏が台北からライブストリームで参加し、マイクロソフトのCEOサティア・ナデラ氏と共に、エージェント型AIの展開に向けた拡大パートナーシップを発表しました。この協業は、Windowsデバイス、Azureクラウド、そしてローカル環境をカバーする統一スタックを提供します。
まず、Windows向けのRTX SparkとDGX Station for Windowsが発表されました。RTX Sparkは、パーソナルエージェント専用に設計された世界初のWindows PCで、1ペタフロップスのAI性能、最大128GBのユニファイドメモリ、終日駆動のバッテリー寿命を備え、CUDA、RTX、DLSS、TensorRTなどのNVIDIA技術を活用します。今秋、マイクロソフトSurface、ASUS、Dell、HP、Lenovo、MSIから発売されます。DGX Station for Windowsは、より強力なデスクトップAIスーパーコンピュータで、NVIDIA GB300 Grace Blackwell Ultra Desktop Superchipを搭載し、最大748GBのコヒーレントメモリと20ペタフロップスのFP4性能を提供、最大1兆パラメータのフロンティアモデルを実行可能です。第4四半期にASUS、Dell、GIGABYTE、HP、MSI、Supermicroから発売予定です。
クラウド面では、NVIDIAのオープンモデルがMicrosoft Foundryで利用可能になりました。NVIDIA Nemotron 3 Ultraは、コーディング、研究、エンタープライズワークフロー向けの長時間実行エージェントのための新しいオープン推論モデルで、今月中にFoundryのマネージドコンピューティングで提供されます。また、NVIDIA Cosmos 3(物理AI向けの初の完全オープン全モダリティモデル)やNVIDIA Earth-2 AI気象モデルも統合されています。開発者はNVIDIA Agent ToolkitやNemoClawブループリントを使用して、Foundry上でプロダクションエージェントを構築できます。
データレイヤーでは、NVIDIAアクセラレーテッドコンピューティングがMicrosoft Fabric Data Warehouseに組み込まれました。マイクロソフトの内部ベンチマークでは、高同時実行ワークロードにおいて、CPUベースライン比で最大6倍、他の主要クラウドデータウェアハウス比で最大7倍のSQL実行速度を達成しています。
物理AIでは、マイクロソフトがNVIDIAのオープンソース物理AIスキルとツールをAzureとその物理AIツールチェーンに統合し、Cosmos 3のミクスチャー・オブ・トランスフォーマーアーキテクチャを使用して、ロボット、自動運転車、産業システムなどの自律システムをシミュレーション、トレーニング、展開できる統一プラットフォームを提供します。
ローカル展開では、MicrosoftがFoundry Local on Azure LocalをNVIDIA RTX PRO 6000 Blackwell Server Editionプラットフォームに導入。NVIDIA Nemotronモデルファミリーと組み合わせることで、企業はオンプレミス、ハイブリッド、または主権環境で高性能AIワークロードを実行できます。
セキュリティ面では、NVIDIA OpenShellがGitHub Copilotに統合されました。各エージェントは独自のサンドボックスコンテナで分離され、すべてのアウトバウンドコールはファイル、ネットワーク、クレデンシャルに到達する前にポリシーに基づいて評価されます。OpenShellはApache 2.0ライセンスのオープンソースで、モデルに依存せず、オンプレミス、ハイブリッド、クラウド環境に対応します。
最後に、マイクロソフトのFairwater Wisconsin AI工場が予定より早く稼働し、数十万のNVIDIA Grace Blackwellシステムを単一のAI工場として運用。ジョージア州の同様の工場と接続され、スケーラブルで分散型のAIシステムを提供します。また、マイクロソフトはNVIDIA Vera Rubinプラットフォームを検証済みで、これはBlackwellと併用可能で、メガワットあたりの推論スループットを最大10倍向上させ、エージェントトークンコストを一桁削減します。内蔵のNVIDIA機密コンピューティングがモデルとデータを保護し、NVIDIA Dynamo推論フレームワークがソフトウェア面でのメリットを拡張します。