微軟推出Surface RTX Spark Dev Box,無需雲成本即可執行大語言模型
微軟在Build 2026大會上釋出了Surface RTX Spark Dev Box,一款緊湊型桌面電腦,配備Nvidia Blackwell架構RTX Spark處理器和128GB統一記憶體,提供1 petaflop AI算力,讓開發者可在本地載入和執行超過1200億引數的大模型,無需支付雲API費用。此舉直接挑戰了自ChatGPT推出以來主導AI行業經濟的按token付費模式。
微軟在週一於Build 2026大會上釋出了Surface RTX Spark Dev Box,這是一款緊湊型桌面電腦,專門為軟體開發者設計,使他們能夠在本地執行大型AI模型,而無需支付雲端計算費用。這一舉措直接挑戰了自三年前ChatGPT推出以來主導AI行業經濟的按token付費模式。
該裝置搭載了Nvidia最新Blackwell架構的RTX Spark處理器,並配備了128GB統一記憶體,採用小型機箱設計,提供Nvidia評級為1 petaflop的AI算力。實際上,這意味著開發者可以載入、執行並與超過1200億引數的AI模型進行互動,而無需向雲端傳送任何API呼叫。
微軟Windows和裝置執行副總裁Pavan Davuluri在活動前的新聞釋出會上表示:“我們認為這類裝置將能夠執行大約1000億引數的模型。”他強調,模型大小隻是其中的一部分,“模型大小是一回事,但要使模型有效,它需要能夠擁有足夠的上下文,因為更大的模型需要更大的上下文。”他指出,在10萬token的上下文下,僅鍵值快取就可能消耗40到50GB的記憶體——這正是微軟和Nvidia圍繞128GB統一記憶體池設計該裝置的原因,該記憶體池在CPU和GPU之間動態共享。
Surface RTX Spark Dev Box的釋出標誌著AI硬體領域的一大進步,它將高效能AI計算帶到了開發者的桌面上,降低了依賴雲服務的成本和延遲。對於AI應用開發、模型微調和本地推理等場景,該裝置提供了一個高效且經濟的選擇。隨著AI模型的規模不斷增長,本地執行能力變得愈發重要,而這款裝置正是對這一需求的回應。