マイクロソフト、クラウドコストなしでLLMを実行するSurface RTX Spark Dev Boxを発表
マイクロソフトはBuild 2026で、NvidiaのBlackwellアーキテクチャ採用RTX Sparkプロセッサと128GBユニファイドメモリを搭載したコンパクトデスクトップ「Surface RTX Spark Dev Box」を発表。1 petaflopのAI演算能力を提供し、開発者は1200億パラメータ以上のモデルをローカルで実行可能。クラウドAPIのトークン単位の課金モデルに挑戦する。
マイクロソフトは月曜日、Build 2026でSurface RTX Spark Dev Boxを発表しました。これは、ソフトウェア開発者がクラウドコンピューティング費用を支払うことなく、自分の机の上で大規模AIモデルを実行できるように設計されたコンパクトなデスクトップコンピュータです。この動きは、ChatGPTが3年半前に開始されて以来、AI業界の経済を定義してきたトークン単位の課金モデルに直接挑戦するものです。
このデバイスは、Nvidiaの新しいBlackwellアーキテクチャを採用したRTX Sparkプロセッサと128ギガバイトのユニファイドメモリを小型フォームファクタのシャーシに詰め込み、Nvidiaが評価する1 petaflopのAI演算能力を実現しています。実際には、開発者はクラウドにAPIコールを一切送信せずに、1200億パラメータを超えるAIモデルをロード、実行、操作できます。
マイクロソフトのWindowsおよびデバイス担当エグゼクティブバイスプレジデントであるPavan Davuluri氏は、イベント前の記者説明会で次のように述べました。「これらのクラスのデバイスは、約1000億パラメータのモデルを実行できるようになると考えています。」彼は、モデルサイズだけが重要ではないと強調しました。「モデルサイズは一つの要素ですが、モデルが効果的であるためには、十分なコンテキストを持てる必要があります。なぜなら、より大きなモデルにはより大きなコンテキストを与える必要があるからです。」10万トークンのコンテキストでは、キーバリューキャッシュだけで40~50ギガバイトのメモリを消費する可能性があると指摘し、それこそがマイクロソフトとNvidiaがCPUとGPUで動的に共有される128ギガバイトのユニファイドメモリプールを中心にデバイスを設計した理由です。
Surface RTX Spark Dev Boxの発表は、AIハードウェアにおける大きな進歩を示し、高性能AIコンピューティングを開発者のデスクトップにもたらし、クラウドサービスへの依存とレイテンシを低減します。AIアプリケーション開発、モデル微調整、ローカル推論などのシナリオにおいて、このデバイスは効率的で経済的な選択肢を提供します。AIモデルの規模が拡大し続ける中、ローカル実行能力の重要性が増しており、本デバイスはその需要に応えるものです。