AI News HubLIVE
站内改写4 分鐘閱讀

NVIDIA 全面提升 RTX PC 和 DGX Spark 的本地 AI 智能體能力

NVIDIA 在 COMPUTEX 台北 GTC 上發佈了 RTX Spark——專為個人智能體打造的新型 Windows PC,並帶來一系列更新,將本地智能體擴展至整個 RTX 和 DGX 生態系統。RTX Spark 擁有 1 petaflop AI 算力和 128GB 統一內存,支持安全、私密的本地運行。NVIDIA 與微軟合作,通過新的 Windows 安全基元與 OpenShell 運行時,為智能體提供身份、策略和隱私保護。同時,llama.cpp 和 vLLM 等開源項目獲得性能優化,推理速度提升最高 2.6 倍。Adobe 也將為 RTX Spark 重新架構 Premiere 和 Photoshop,提供更快的 AI 加速創作體驗。

來源NVIDIA Blog作者: Gerardo Delgado

個人智能體正迅速流行起來,像 OpenClaw 和 Hermes 這樣的開源項目在 GitHub 上的 AI 開發者社區中獲得了廣泛採用。這些智能體能夠適應個人偏好和工作流程,與應用程序交互、生成內容、自動化重複流程並管理多步驟任務,所有操作均在設備本地運行。

在 COMPUTEX 台北 GTC 上,NVIDIA 發佈了 NVIDIA RTX Spark——一款專為個人智能體打造的新型 Windows PC,同時宣佈了一系列更新,將本地智能體擴展至更廣泛的 NVIDIA RTX 和 DGX 生態系統。安全、私密地運行智能體需要足夠強大的硬件。RTX Spark 擁有 1 petaflop 的 AI 算力和 128GB 的統一內存,能夠滿足本地智能體的計算需求,提供一種全新的計算機類型,使其從工具轉變為合作伙伴。這款設備專為 AI、創作和遊戲設計,將 NVIDIA 30 年的技術創新融入輕薄的 Windows 筆記本和超高效台式機中,同時支持全天續航。

NVIDIA 與 Windows 的合作從個人擴展到企業解決方案。同期發佈的還有 NVIDIA DGX Station for Windows,這是面向專業人士的終極 AI 桌面超級計算機,將數據中心級的 GPU 和 CPU 集成到桌面系統,並配備 Windows 以提供可管理性、安全性和兼容性。

其他發佈亮點包括:NVIDIA OpenShell 運行時即將登陸 Windows,它基於微軟新的智能體安全基元構建,為開發者提供了一個易於部署的安全本地智能體包。Hermes Agent 和 OpenClaw 也將把 OpenShell 和微軟安全基元集成到其新的 Windows 應用程序中。NVIDIA NemoClaw 藍圖擴展至整個本地 AI 產品線(GeForce RTX、RTX PRO、RTX 和 DGX Spark、DGX Station),並提供了新的簡化安裝程序和對 Hermes Agent 的支持。

在性能方面,llama.cpp 和 vLLM 通過多 token 預測實現了頂級智能體模型的 2 倍推理性能提升,同時 llama.cpp 和 ComfyUI 獲得了新的多 GPU 優化。H Company 發佈了計算機使用工具,包括新模型和即將推出的桌面智能體框架,針對 RTX 和 DGX PC 進行了優化。Adobe 正在重新架構其 Photoshop 和 Premiere 應用,Blender 加入了 NVIDIA DLSS 4.5 光線重建,NVIDIA 還發布了 RTX Video Frame Generation,這些更新將於今年秋季隨 RTX Spark 一同到來。

NVIDIA Broadcast 2.2 更新帶來了 Studio Voice 功能優化和 Elgato Stream Deck 支持,NVIDIA Project G-Assist 也增加了 Stream Deck 集成。

本地智能體 AI:在 Windows RTX PC 上實現個人、私密且快速的應用

智能體的廣泛採用一直受限於無法在用户主 PC 上安全、私密地運行智能體。NVIDIA 和微軟正合作解決這一挑戰,為本地智能體提供可靠的 Windows 平台。合作始於堅實的基礎——新的 Windows 安全基元和 NVIDIA OpenShell 運行時,確保智能體在用户完全控制下安全運行。新的 Windows 基元提供了身份、隔離、策略和端到端安全能力,用於原生構建和運行智能體。NVIDIA OpenShell 提供了額外的策略功能,讓用户定義智能體可以做什麼和不可以做什麼,能夠根據用户隱私策略智能地將查詢路由到本地模型,並能模糊化發送到雲端模型的查詢中的個人信息。這一強大的安全和隱私層正被 Hermes Agent 和 OpenClaw 等領先的智能體開發者所採用。

為本地設備上的智能體提供動力需要既安全又高效的硬件。RTX Spark 擁有高達 1 petaflop 的 AI 算力和 128GB 統一內存,滿足本地智能體的處理需求。NVIDIA 還在加速這些智能體所依賴的本地開放模型生態系統。NVIDIA 與 llama.cpp 社區合作,實現了多 token 預測(MTP)等特性和優化,這是一種推測解碼技術,由較小的草稿模型一次提出多個 token,目標模型在單次傳遞中驗證。結合其他優化,在 Qwen 3.6 和 3.5 27B 上實現了 2 倍性能,在 Qwen 3.6 和 3.5 35B 上實現了 1.6 倍性能提升。這些更新已通過 llama.cpp webUI 和 LM Studio 提供。

對於使用多 GPU 設置的 AI 愛好者,NVIDIA 與開源社區合作增強了兩款最流行的本地 AI 工具:llama.cpp 增加了張量並行,在兩張同等 GPU 上內存提升 2 倍,計算性能提升 1.8 倍;ComfyUI 獲得了新的無分類器引導方法,在兩張同等 GPU 上性能提升 2 倍,並可選擇將模型鏈拆分到不同 GPU 以利用組合內存。

NVIDIA 還與 H Company 合作擴展智能體能力。H Company 的計算機使用框架讓智能體能夠通過觀看屏幕、操作鼠標和鍵盤來導航 PC,即使在沒有 API 的應用中也能像用户一樣操作,即將在 RTX 和 DGX PC 上推出並支持本地模型。NVIDIA 與 H Company 合作量化了其最先進的 Holo Computer Use 模型,並加速其框架——在 NVIDIA GPU 上實現 2 倍加速,同時內存消耗降低 35%。模型現已可下載,Holo Desktop 應用即將推出。

Linux 上的智能體優化

對於需要始終可訪問的本地智能體的開發者,NVIDIA DGX Spark 是為需要 Linux 環境的開發者打造的最強大的個人智能體 AI 計算機,它統一了大內存、快速計算和 NVIDIA CUDA 生態系統的兼容性。本月發佈的 DGX Spark 操作系統版本帶來了最簡化的開箱即用體驗,包括精簡的 NemoClaw 安裝程序,以及更快的頂級智能體模型推理。NemoClaw 現已適用於 Linux 和 Windows Subsystem for Linux 上的所有 NVIDIA RTX 和 DGX PC。NVIDIA 與 vLLM 合作優化了智能體的推理,包括 vLLM 中的優化以及針對 Qwen 3.6 35B 的新 NVFP4 檢查點。這些更新使 DGX Spark 的性能比此前來自 Unsloth 的 NVFP4 檢查點提升了 2.6 倍,幷包括內核改進、混合精度以及 CUDA Graph 對 MTP 的支持。

與 Adobe 合作帶來強大的創作體驗

NVIDIA 正與 Adobe 合作重新架構 Adobe Premiere 和 Photoshop 以適應 RTX Spark。由 Firefly 驅動的 Photoshop 生成式填充和 Premiere 生成式擴展是數百個加速工具中的代表,提供創作力量、精確性和控制。RTX Spark 進一步擴展了這些能力,在創作工作流程中實現高達 2 倍更快的 AI、編輯、色彩和效果。Adobe Premiere 將採用新的視頻管線,利用 RTX Spark 的統一內存、Blackwell GPU 和 TensorRT 軟件,實現實時編輯和色彩校正、GPU 加速 AI 性能以及更高效的複雜時間線渲染。此外,Adobe 的 Substance 3D Painter 和 Stager 將在 RTX Spark 上原生運行,帶來更流暢、更快速的 3D 紋理和場景創作工作流程。Adobe 還將進一步擴展 Premiere 和 Photoshop,允許用户通過 Windows 智能體進行創作、編輯和設計,為創作者提供協作式合作伙伴以加速工作流程。

面向創作者的新工具和應用更新

新的 NVIDIA 平台更新和合作夥伴應用優化正在整個 RTX 生態系統中推出,部分今日上線,其他將於今年秋季隨 RTX Spark 到來。NVIDIA Broadcast 2.2 將 Studio Voice(一種讓任何麥克風聽起來像錄音室品質的 AI 功能)從測試版畢業,即日起可用。Studio Voice 現可在 GeForce RTX 3060 及以上 GPU 上運行,性能得到改進。該應用還增加了 Elgato Stream Deck 集成和可配置的鍵盤快捷鍵。Project G-Assist 也通過 Elgato MCP Server 增加了 Stream Deck 支持。此外,Blender Cycles 正在集成 DLSS 4.5 光線重建作為新的降噪器,將路徑追蹤視口轉變為交互式實時查看器,讓 3D 藝術家在查看接近最終渲染質量的同時導航場景。該更新將於今年秋季隨 Blender 5.3 和 RTX Spark 一起發佈。同樣隨 RTX Spark 發佈的還有 RTX Video Frame Generation,這是一種新的 AI 效果,可將視頻幀率實時加倍或四倍,非常適合提升 AI 模型通常生成的 15-20 fps 輸出。它作為 Python 輪子和 ComfyUI 節點提供,讓 AI 藝術家快速生成低 fps 視頻,然後插值到流暢的播放速率。

#ICYMI:RTX AI Garage 的最新動態

有關 RTX Spark 的完整公告,請閲讀 NVIDIA RTX Spark 發佈詳情,包括超級芯片、NVIDIA 與 Windows 在智能體方面的合作,以及合作伙伴的筆記本電腦和小型台式機。ASUS ProArt 創作者筆記本現預裝 Black Forest Labs 的 FLUX.2 Klein 4B 模型,通過 MuseTree 應用提供,採用 NVFP4 格式和 NVIDIA TensorRT for RTX SDK 優化,實現高達 2.5 倍加速和 560% 內存縮減,開箱即可本地生成圖像。NVIDIA AI for Media SDK 發佈了更新,包括新的 LipSync NIM 微服務(針對法語、德語和西班牙語優化),以及 Active Speaker Detection NIM 微服務的多攝像頭支持。查看最新的 RTX AI Garage 博文,瞭解 Hermes Agent 和 RTX PC 及 DGX Spark 上的自我改進 AI。