AI News HubLIVE
站内改写1 分鐘閱讀

微軟推出Surface RTX Spark Dev Box,無需雲成本即可運行大語言模型

微軟在Build 2026大會上發佈了Surface RTX Spark Dev Box,一款緊湊型桌面電腦,配備Nvidia Blackwell架構RTX Spark處理器和128GB統一內存,提供1 petaflop AI算力,讓開發者可在本地加載和運行超過1200億參數的大模型,無需支付雲API費用。此舉直接挑戰了自ChatGPT推出以來主導AI行業經濟的按token付費模式。

來源Hacker News AI作者: theanonymousone

微軟在週一於Build 2026大會上發佈了Surface RTX Spark Dev Box,這是一款緊湊型桌面電腦,專門為軟件開發者設計,使他們能夠在本地運行大型AI模型,而無需支付雲計算費用。這一舉措直接挑戰了自三年前ChatGPT推出以來主導AI行業經濟的按token付費模式。

該設備搭載了Nvidia最新Blackwell架構的RTX Spark處理器,並配備了128GB統一內存,採用小型機箱設計,提供Nvidia評級為1 petaflop的AI算力。實際上,這意味着開發者可以加載、運行並與超過1200億參數的AI模型進行交互,而無需向雲端發送任何API調用。

微軟Windows和設備執行副總裁Pavan Davuluri在活動前的新聞發佈會上表示:“我們認為這類設備將能夠運行大約1000億參數的模型。”他強調,模型大小隻是其中的一部分,“模型大小是一回事,但要使模型有效,它需要能夠擁有足夠的上下文,因為更大的模型需要更大的上下文。”他指出,在10萬token的上下文下,僅鍵值緩存就可能消耗40到50GB的內存——這正是微軟和Nvidia圍繞128GB統一內存池設計該設備的原因,該內存池在CPU和GPU之間動態共享。

Surface RTX Spark Dev Box的發佈標誌着AI硬件領域的一大進步,它將高性能AI計算帶到了開發者的桌面上,降低了依賴雲服務的成本和延遲。對於AI應用開發、模型微調和本地推理等場景,該設備提供了一個高效且經濟的選擇。隨着AI模型的規模不斷增長,本地運行能力變得愈發重要,而這款設備正是對這一需求的回應。