2026-06-01 12:30 UTC+8站内改写4 分钟阅读更新: 2026-06-30 21:03 UTC+8

NVIDIA 全面提升 RTX PC 和 DGX Spark 的本地 AI 智能体能力

NVIDIA 在 COMPUTEX 台北 GTC 上发布了 RTX Spark——专为个人智能体打造的新型 Windows PC，并带来一系列更新，将本地智能体扩展至整个 RTX 和 DGX 生态系统。RTX Spark 拥有 1 petaflop AI 算力和 128GB 统一内存，支持安全、私密的本地运行。NVIDIA 与微软合作，通过新的 Windows 安全基元与 OpenShell 运行时，为智能体提供身份、策略和隐私保护。同时，llama.cpp 和 vLLM 等开源项目获得性能优化，推理速度提升最高 2.6 倍。Adobe 也将为 RTX Spark 重新架构 Premiere 和 Photoshop，提供更快的 AI 加速创作体验。

来源NVIDIA Blog作者: Gerardo Delgado

文章情报

工程师进阶

要点

NVIDIA 发布 RTX Spark，一款专为个人 AI 智能体设计的 Windows PC，提供 1 petaflop AI 算力和 128GB 统一内存。
NVIDIA 与微软合作，通过 Windows 安全基元和 OpenShell 运行时，实现安全、私密的本地智能体运行。
llama.cpp 和 vLLM 获得多 token 预测等优化，在 NVIDIA 硬件上实现 2 倍以上推理性能提升。
Adobe 将为 RTX Spark 重新架构 Premiere 和 Photoshop，并整合 AI 智能体支持，提升创作效率。

为什么重要

这条新闻值得关注，因为NVIDIA 发布 RTX Spark，一款专为个人 AI 智能体设计的 Windows PC，提供 1 petaflop AI 算力和 128GB 统一内存。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

本面板由 AI 生成，经人工审核。

个人智能体正迅速流行起来，像 OpenClaw 和 Hermes 这样的开源项目在 GitHub 上的 AI 开发者社区中获得了广泛采用。这些智能体能够适应个人偏好和工作流程，与应用程序交互、生成内容、自动化重复流程并管理多步骤任务，所有操作均在设备本地运行。

在 COMPUTEX 台北 GTC 上，NVIDIA 发布了 NVIDIA RTX Spark——一款专为个人智能体打造的新型 Windows PC，同时宣布了一系列更新，将本地智能体扩展至更广泛的 NVIDIA RTX 和 DGX 生态系统。安全、私密地运行智能体需要足够强大的硬件。RTX Spark 拥有 1 petaflop 的 AI 算力和 128GB 的统一内存，能够满足本地智能体的计算需求，提供一种全新的计算机类型，使其从工具转变为合作伙伴。这款设备专为 AI、创作和游戏设计，将 NVIDIA 30 年的技术创新融入轻薄的 Windows 笔记本和超高效台式机中，同时支持全天续航。

NVIDIA 与 Windows 的合作从个人扩展到企业解决方案。同期发布的还有 NVIDIA DGX Station for Windows，这是面向专业人士的终极 AI 桌面超级计算机，将数据中心级的 GPU 和 CPU 集成到桌面系统，并配备 Windows 以提供可管理性、安全性和兼容性。

其他发布亮点包括：NVIDIA OpenShell 运行时即将登陆 Windows，它基于微软新的智能体安全基元构建，为开发者提供了一个易于部署的安全本地智能体包。Hermes Agent 和 OpenClaw 也将把 OpenShell 和微软安全基元集成到其新的 Windows 应用程序中。NVIDIA NemoClaw 蓝图扩展至整个本地 AI 产品线（GeForce RTX、RTX PRO、RTX 和 DGX Spark、DGX Station），并提供了新的简化安装程序和对 Hermes Agent 的支持。

在性能方面，llama.cpp 和 vLLM 通过多 token 预测实现了顶级智能体模型的 2 倍推理性能提升，同时 llama.cpp 和 ComfyUI 获得了新的多 GPU 优化。H Company 发布了计算机使用工具，包括新模型和即将推出的桌面智能体框架，针对 RTX 和 DGX PC 进行了优化。Adobe 正在重新架构其 Photoshop 和 Premiere 应用，Blender 加入了 NVIDIA DLSS 4.5 光线重建，NVIDIA 还发布了 RTX Video Frame Generation，这些更新将于今年秋季随 RTX Spark 一同到来。

NVIDIA Broadcast 2.2 更新带来了 Studio Voice 功能优化和 Elgato Stream Deck 支持，NVIDIA Project G-Assist 也增加了 Stream Deck 集成。

本地智能体 AI：在 Windows RTX PC 上实现个人、私密且快速的应用

智能体的广泛采用一直受限于无法在用户主 PC 上安全、私密地运行智能体。NVIDIA 和微软正合作解决这一挑战，为本地智能体提供可靠的 Windows 平台。合作始于坚实的基础——新的 Windows 安全基元和 NVIDIA OpenShell 运行时，确保智能体在用户完全控制下安全运行。新的 Windows 基元提供了身份、隔离、策略和端到端安全能力，用于原生构建和运行智能体。NVIDIA OpenShell 提供了额外的策略功能，让用户定义智能体可以做什么和不可以做什么，能够根据用户隐私策略智能地将查询路由到本地模型，并能模糊化发送到云端模型的查询中的个人信息。这一强大的安全和隐私层正被 Hermes Agent 和 OpenClaw 等领先的智能体开发者所采用。

为本地设备上的智能体提供动力需要既安全又高效的硬件。RTX Spark 拥有高达 1 petaflop 的 AI 算力和 128GB 统一内存，满足本地智能体的处理需求。NVIDIA 还在加速这些智能体所依赖的本地开放模型生态系统。NVIDIA 与 llama.cpp 社区合作，实现了多 token 预测（MTP）等特性和优化，这是一种推测解码技术，由较小的草稿模型一次提出多个 token，目标模型在单次传递中验证。结合其他优化，在 Qwen 3.6 和 3.5 27B 上实现了 2 倍性能，在 Qwen 3.6 和 3.5 35B 上实现了 1.6 倍性能提升。这些更新已通过 llama.cpp webUI 和 LM Studio 提供。

对于使用多 GPU 设置的 AI 爱好者，NVIDIA 与开源社区合作增强了两款最流行的本地 AI 工具：llama.cpp 增加了张量并行，在两张同等 GPU 上内存提升 2 倍，计算性能提升 1.8 倍；ComfyUI 获得了新的无分类器引导方法，在两张同等 GPU 上性能提升 2 倍，并可选择将模型链拆分到不同 GPU 以利用组合内存。

NVIDIA 还与 H Company 合作扩展智能体能力。H Company 的计算机使用框架让智能体能够通过观看屏幕、操作鼠标和键盘来导航 PC，即使在没有 API 的应用中也能像用户一样操作，即将在 RTX 和 DGX PC 上推出并支持本地模型。NVIDIA 与 H Company 合作量化了其最先进的 Holo Computer Use 模型，并加速其框架——在 NVIDIA GPU 上实现 2 倍加速，同时内存消耗降低 35%。模型现已可下载，Holo Desktop 应用即将推出。

Linux 上的智能体优化

对于需要始终可访问的本地智能体的开发者，NVIDIA DGX Spark 是为需要 Linux 环境的开发者打造的最强大的个人智能体 AI 计算机，它统一了大内存、快速计算和 NVIDIA CUDA 生态系统的兼容性。本月发布的 DGX Spark 操作系统版本带来了最简化的开箱即用体验，包括精简的 NemoClaw 安装程序，以及更快的顶级智能体模型推理。NemoClaw 现已适用于 Linux 和 Windows Subsystem for Linux 上的所有 NVIDIA RTX 和 DGX PC。NVIDIA 与 vLLM 合作优化了智能体的推理，包括 vLLM 中的优化以及针对 Qwen 3.6 35B 的新 NVFP4 检查点。这些更新使 DGX Spark 的性能比此前来自 Unsloth 的 NVFP4 检查点提升了 2.6 倍，并包括内核改进、混合精度以及 CUDA Graph 对 MTP 的支持。

与 Adobe 合作带来强大的创作体验

NVIDIA 正与 Adobe 合作重新架构 Adobe Premiere 和 Photoshop 以适应 RTX Spark。由 Firefly 驱动的 Photoshop 生成式填充和 Premiere 生成式扩展是数百个加速工具中的代表，提供创作力量、精确性和控制。RTX Spark 进一步扩展了这些能力，在创作工作流程中实现高达 2 倍更快的 AI、编辑、色彩和效果。Adobe Premiere 将采用新的视频管线，利用 RTX Spark 的统一内存、Blackwell GPU 和 TensorRT 软件，实现实时编辑和色彩校正、GPU 加速 AI 性能以及更高效的复杂时间线渲染。此外，Adobe 的 Substance 3D Painter 和 Stager 将在 RTX Spark 上原生运行，带来更流畅、更快速的 3D 纹理和场景创作工作流程。Adobe 还将进一步扩展 Premiere 和 Photoshop，允许用户通过 Windows 智能体进行创作、编辑和设计，为创作者提供协作式合作伙伴以加速工作流程。

面向创作者的新工具和应用更新

新的 NVIDIA 平台更新和合作伙伴应用优化正在整个 RTX 生态系统中推出，部分今日上线，其他将于今年秋季随 RTX Spark 到来。NVIDIA Broadcast 2.2 将 Studio Voice（一种让任何麦克风听起来像录音室品质的 AI 功能）从测试版毕业，即日起可用。Studio Voice 现可在 GeForce RTX 3060 及以上 GPU 上运行，性能得到改进。该应用还增加了 Elgato Stream Deck 集成和可配置的键盘快捷键。Project G-Assist 也通过 Elgato MCP Server 增加了 Stream Deck 支持。此外，Blender Cycles 正在集成 DLSS 4.5 光线重建作为新的降噪器，将路径追踪视口转变为交互式实时查看器，让 3D 艺术家在查看接近最终渲染质量的同时导航场景。该更新将于今年秋季随 Blender 5.3 和 RTX Spark 一起发布。同样随 RTX Spark 发布的还有 RTX Video Frame Generation，这是一种新的 AI 效果，可将视频帧率实时加倍或四倍，非常适合提升 AI 模型通常生成的 15-20 fps 输出。它作为 Python 轮子和 ComfyUI 节点提供，让 AI 艺术家快速生成低 fps 视频，然后插值到流畅的播放速率。

#ICYMI：RTX AI Garage 的最新动态

有关 RTX Spark 的完整公告，请阅读 NVIDIA RTX Spark 发布详情，包括超级芯片、NVIDIA 与 Windows 在智能体方面的合作，以及合作伙伴的笔记本电脑和小型台式机。ASUS ProArt 创作者笔记本现预装 Black Forest Labs 的 FLUX.2 Klein 4B 模型，通过 MuseTree 应用提供，采用 NVFP4 格式和 NVIDIA TensorRT for RTX SDK 优化，实现高达 2.5 倍加速和 560% 内存缩减，开箱即可本地生成图像。NVIDIA AI for Media SDK 发布了更新，包括新的 LipSync NIM 微服务（针对法语、德语和西班牙语优化），以及 Active Speaker Detection NIM 微服务的多摄像头支持。查看最新的 RTX AI Garage 博文，了解 Hermes Agent 和 RTX PC 及 DGX Spark 上的自我改进 AI。