NVIDIA 全面提升 RTX PC 和 DGX Spark 的本地 AI 智能体能力
NVIDIA 在 COMPUTEX 台北 GTC 上发布了 RTX Spark——专为个人智能体打造的新型 Windows PC,并带来一系列更新,将本地智能体扩展至整个 RTX 和 DGX 生态系统。RTX Spark 拥有 1 petaflop AI 算力和 128GB 统一内存,支持安全、私密的本地运行。NVIDIA 与微软合作,通过新的 Windows 安全基元与 OpenShell 运行时,为智能体提供身份、策略和隐私保护。同时,llama.cpp 和 vLLM 等开源项目获得性能优化,推理速度提升最高 2.6 倍。Adobe 也将为 RTX Spark 重新架构 Premiere 和 Photoshop,提供更快的 AI 加速创作体验。
个人智能体正迅速流行起来,像 OpenClaw 和 Hermes 这样的开源项目在 GitHub 上的 AI 开发者社区中获得了广泛采用。这些智能体能够适应个人偏好和工作流程,与应用程序交互、生成内容、自动化重复流程并管理多步骤任务,所有操作均在设备本地运行。
在 COMPUTEX 台北 GTC 上,NVIDIA 发布了 NVIDIA RTX Spark——一款专为个人智能体打造的新型 Windows PC,同时宣布了一系列更新,将本地智能体扩展至更广泛的 NVIDIA RTX 和 DGX 生态系统。安全、私密地运行智能体需要足够强大的硬件。RTX Spark 拥有 1 petaflop 的 AI 算力和 128GB 的统一内存,能够满足本地智能体的计算需求,提供一种全新的计算机类型,使其从工具转变为合作伙伴。这款设备专为 AI、创作和游戏设计,将 NVIDIA 30 年的技术创新融入轻薄的 Windows 笔记本和超高效台式机中,同时支持全天续航。
NVIDIA 与 Windows 的合作从个人扩展到企业解决方案。同期发布的还有 NVIDIA DGX Station for Windows,这是面向专业人士的终极 AI 桌面超级计算机,将数据中心级的 GPU 和 CPU 集成到桌面系统,并配备 Windows 以提供可管理性、安全性和兼容性。
其他发布亮点包括:NVIDIA OpenShell 运行时即将登陆 Windows,它基于微软新的智能体安全基元构建,为开发者提供了一个易于部署的安全本地智能体包。Hermes Agent 和 OpenClaw 也将把 OpenShell 和微软安全基元集成到其新的 Windows 应用程序中。NVIDIA NemoClaw 蓝图扩展至整个本地 AI 产品线(GeForce RTX、RTX PRO、RTX 和 DGX Spark、DGX Station),并提供了新的简化安装程序和对 Hermes Agent 的支持。
在性能方面,llama.cpp 和 vLLM 通过多 token 预测实现了顶级智能体模型的 2 倍推理性能提升,同时 llama.cpp 和 ComfyUI 获得了新的多 GPU 优化。H Company 发布了计算机使用工具,包括新模型和即将推出的桌面智能体框架,针对 RTX 和 DGX PC 进行了优化。Adobe 正在重新架构其 Photoshop 和 Premiere 应用,Blender 加入了 NVIDIA DLSS 4.5 光线重建,NVIDIA 还发布了 RTX Video Frame Generation,这些更新将于今年秋季随 RTX Spark 一同到来。
NVIDIA Broadcast 2.2 更新带来了 Studio Voice 功能优化和 Elgato Stream Deck 支持,NVIDIA Project G-Assist 也增加了 Stream Deck 集成。
本地智能体 AI:在 Windows RTX PC 上实现个人、私密且快速的应用
智能体的广泛采用一直受限于无法在用户主 PC 上安全、私密地运行智能体。NVIDIA 和微软正合作解决这一挑战,为本地智能体提供可靠的 Windows 平台。合作始于坚实的基础——新的 Windows 安全基元和 NVIDIA OpenShell 运行时,确保智能体在用户完全控制下安全运行。新的 Windows 基元提供了身份、隔离、策略和端到端安全能力,用于原生构建和运行智能体。NVIDIA OpenShell 提供了额外的策略功能,让用户定义智能体可以做什么和不可以做什么,能够根据用户隐私策略智能地将查询路由到本地模型,并能模糊化发送到云端模型的查询中的个人信息。这一强大的安全和隐私层正被 Hermes Agent 和 OpenClaw 等领先的智能体开发者所采用。
为本地设备上的智能体提供动力需要既安全又高效的硬件。RTX Spark 拥有高达 1 petaflop 的 AI 算力和 128GB 统一内存,满足本地智能体的处理需求。NVIDIA 还在加速这些智能体所依赖的本地开放模型生态系统。NVIDIA 与 llama.cpp 社区合作,实现了多 token 预测(MTP)等特性和优化,这是一种推测解码技术,由较小的草稿模型一次提出多个 token,目标模型在单次传递中验证。结合其他优化,在 Qwen 3.6 和 3.5 27B 上实现了 2 倍性能,在 Qwen 3.6 和 3.5 35B 上实现了 1.6 倍性能提升。这些更新已通过 llama.cpp webUI 和 LM Studio 提供。
对于使用多 GPU 设置的 AI 爱好者,NVIDIA 与开源社区合作增强了两款最流行的本地 AI 工具:llama.cpp 增加了张量并行,在两张同等 GPU 上内存提升 2 倍,计算性能提升 1.8 倍;ComfyUI 获得了新的无分类器引导方法,在两张同等 GPU 上性能提升 2 倍,并可选择将模型链拆分到不同 GPU 以利用组合内存。
NVIDIA 还与 H Company 合作扩展智能体能力。H Company 的计算机使用框架让智能体能够通过观看屏幕、操作鼠标和键盘来导航 PC,即使在没有 API 的应用中也能像用户一样操作,即将在 RTX 和 DGX PC 上推出并支持本地模型。NVIDIA 与 H Company 合作量化了其最先进的 Holo Computer Use 模型,并加速其框架——在 NVIDIA GPU 上实现 2 倍加速,同时内存消耗降低 35%。模型现已可下载,Holo Desktop 应用即将推出。
Linux 上的智能体优化
对于需要始终可访问的本地智能体的开发者,NVIDIA DGX Spark 是为需要 Linux 环境的开发者打造的最强大的个人智能体 AI 计算机,它统一了大内存、快速计算和 NVIDIA CUDA 生态系统的兼容性。本月发布的 DGX Spark 操作系统版本带来了最简化的开箱即用体验,包括精简的 NemoClaw 安装程序,以及更快的顶级智能体模型推理。NemoClaw 现已适用于 Linux 和 Windows Subsystem for Linux 上的所有 NVIDIA RTX 和 DGX PC。NVIDIA 与 vLLM 合作优化了智能体的推理,包括 vLLM 中的优化以及针对 Qwen 3.6 35B 的新 NVFP4 检查点。这些更新使 DGX Spark 的性能比此前来自 Unsloth 的 NVFP4 检查点提升了 2.6 倍,并包括内核改进、混合精度以及 CUDA Graph 对 MTP 的支持。
与 Adobe 合作带来强大的创作体验
NVIDIA 正与 Adobe 合作重新架构 Adobe Premiere 和 Photoshop 以适应 RTX Spark。由 Firefly 驱动的 Photoshop 生成式填充和 Premiere 生成式扩展是数百个加速工具中的代表,提供创作力量、精确性和控制。RTX Spark 进一步扩展了这些能力,在创作工作流程中实现高达 2 倍更快的 AI、编辑、色彩和效果。Adobe Premiere 将采用新的视频管线,利用 RTX Spark 的统一内存、Blackwell GPU 和 TensorRT 软件,实现实时编辑和色彩校正、GPU 加速 AI 性能以及更高效的复杂时间线渲染。此外,Adobe 的 Substance 3D Painter 和 Stager 将在 RTX Spark 上原生运行,带来更流畅、更快速的 3D 纹理和场景创作工作流程。Adobe 还将进一步扩展 Premiere 和 Photoshop,允许用户通过 Windows 智能体进行创作、编辑和设计,为创作者提供协作式合作伙伴以加速工作流程。
面向创作者的新工具和应用更新
新的 NVIDIA 平台更新和合作伙伴应用优化正在整个 RTX 生态系统中推出,部分今日上线,其他将于今年秋季随 RTX Spark 到来。NVIDIA Broadcast 2.2 将 Studio Voice(一种让任何麦克风听起来像录音室品质的 AI 功能)从测试版毕业,即日起可用。Studio Voice 现可在 GeForce RTX 3060 及以上 GPU 上运行,性能得到改进。该应用还增加了 Elgato Stream Deck 集成和可配置的键盘快捷键。Project G-Assist 也通过 Elgato MCP Server 增加了 Stream Deck 支持。此外,Blender Cycles 正在集成 DLSS 4.5 光线重建作为新的降噪器,将路径追踪视口转变为交互式实时查看器,让 3D 艺术家在查看接近最终渲染质量的同时导航场景。该更新将于今年秋季随 Blender 5.3 和 RTX Spark 一起发布。同样随 RTX Spark 发布的还有 RTX Video Frame Generation,这是一种新的 AI 效果,可将视频帧率实时加倍或四倍,非常适合提升 AI 模型通常生成的 15-20 fps 输出。它作为 Python 轮子和 ComfyUI 节点提供,让 AI 艺术家快速生成低 fps 视频,然后插值到流畅的播放速率。
#ICYMI:RTX AI Garage 的最新动态
有关 RTX Spark 的完整公告,请阅读 NVIDIA RTX Spark 发布详情,包括超级芯片、NVIDIA 与 Windows 在智能体方面的合作,以及合作伙伴的笔记本电脑和小型台式机。ASUS ProArt 创作者笔记本现预装 Black Forest Labs 的 FLUX.2 Klein 4B 模型,通过 MuseTree 应用提供,采用 NVFP4 格式和 NVIDIA TensorRT for RTX SDK 优化,实现高达 2.5 倍加速和 560% 内存缩减,开箱即可本地生成图像。NVIDIA AI for Media SDK 发布了更新,包括新的 LipSync NIM 微服务(针对法语、德语和西班牙语优化),以及 Active Speaker Detection NIM 微服务的多摄像头支持。查看最新的 RTX AI Garage 博文,了解 Hermes Agent 和 RTX PC 及 DGX Spark 上的自我改进 AI。