AI News HubLIVE
站内改写1 分钟阅读

微软推出Surface RTX Spark Dev Box,无需云成本即可运行大语言模型

微软在Build 2026大会上发布了Surface RTX Spark Dev Box,一款紧凑型桌面电脑,配备Nvidia Blackwell架构RTX Spark处理器和128GB统一内存,提供1 petaflop AI算力,让开发者可在本地加载和运行超过1200亿参数的大模型,无需支付云API费用。此举直接挑战了自ChatGPT推出以来主导AI行业经济的按token付费模式。

来源Hacker News AI作者: theanonymousone

微软在周一于Build 2026大会上发布了Surface RTX Spark Dev Box,这是一款紧凑型桌面电脑,专门为软件开发者设计,使他们能够在本地运行大型AI模型,而无需支付云计算费用。这一举措直接挑战了自三年前ChatGPT推出以来主导AI行业经济的按token付费模式。

该设备搭载了Nvidia最新Blackwell架构的RTX Spark处理器,并配备了128GB统一内存,采用小型机箱设计,提供Nvidia评级为1 petaflop的AI算力。实际上,这意味着开发者可以加载、运行并与超过1200亿参数的AI模型进行交互,而无需向云端发送任何API调用。

微软Windows和设备执行副总裁Pavan Davuluri在活动前的新闻发布会上表示:“我们认为这类设备将能够运行大约1000亿参数的模型。”他强调,模型大小只是其中的一部分,“模型大小是一回事,但要使模型有效,它需要能够拥有足够的上下文,因为更大的模型需要更大的上下文。”他指出,在10万token的上下文下,仅键值缓存就可能消耗40到50GB的内存——这正是微软和Nvidia围绕128GB统一内存池设计该设备的原因,该内存池在CPU和GPU之间动态共享。

Surface RTX Spark Dev Box的发布标志着AI硬件领域的一大进步,它将高性能AI计算带到了开发者的桌面上,降低了依赖云服务的成本和延迟。对于AI应用开发、模型微调和本地推理等场景,该设备提供了一个高效且经济的选择。随着AI模型的规模不断增长,本地运行能力变得愈发重要,而这款设备正是对这一需求的回应。