AI News HubLIVE
站内改写5 分鐘閱讀

NVIDIA 全面提升 RTX PC 和 DGX Spark 的本地 AI 智慧體能力

NVIDIA 在 COMPUTEX 臺北 GTC 上釋出了 RTX Spark——專為個人智慧體打造的新型 Windows PC,並帶來一系列更新,將本地智慧體擴充套件至整個 RTX 和 DGX 生態系統。RTX Spark 擁有 1 petaflop AI 算力和 128GB 統一記憶體,支援安全、私密的本地執行。NVIDIA 與微軟合作,透過新的 Windows 安全基元與 OpenShell 執行時,為智慧體提供身份、策略和隱私保護。同時,llama.cpp 和 vLLM 等開源專案獲得效能最佳化,推理速度提升最高 2.6 倍。Adobe 也將為 RTX Spark 重新架構 Premiere 和 Photoshop,提供更快的 AI 加速創作體驗。

來源NVIDIA Blog作者: Gerardo Delgado

個人智慧體正迅速流行起來,像 OpenClaw 和 Hermes 這樣的開源專案在 GitHub 上的 AI 開發者社群中獲得了廣泛採用。這些智慧體能夠適應個人偏好和工作流程,與應用程式互動、生成內容、自動化重複流程並管理多步驟任務,所有操作均在裝置本地執行。

在 COMPUTEX 臺北 GTC 上,NVIDIA 釋出了 NVIDIA RTX Spark——一款專為個人智慧體打造的新型 Windows PC,同時宣佈了一系列更新,將本地智慧體擴充套件至更廣泛的 NVIDIA RTX 和 DGX 生態系統。安全、私密地執行智慧體需要足夠強大的硬體。RTX Spark 擁有 1 petaflop 的 AI 算力和 128GB 的統一記憶體,能夠滿足本地智慧體的計算需求,提供一種全新的計算機型別,使其從工具轉變為合作伙伴。這款裝置專為 AI、創作和遊戲設計,將 NVIDIA 30 年的技術創新融入輕薄的 Windows 筆記本和超高效桌上型電腦中,同時支援全天續航。

NVIDIA 與 Windows 的合作從個人擴充套件到企業解決方案。同期釋出的還有 NVIDIA DGX Station for Windows,這是面向專業人士的終極 AI 桌面超級計算機,將資料中心級的 GPU 和 CPU 整合到桌面系統,並配備 Windows 以提供可管理性、安全性和相容性。

其他釋出亮點包括:NVIDIA OpenShell 執行時即將登陸 Windows,它基於微軟新的智慧體安全基元構建,為開發者提供了一個易於部署的安全本地智慧體包。Hermes Agent 和 OpenClaw 也將把 OpenShell 和微軟安全基元整合到其新的 Windows 應用程式中。NVIDIA NemoClaw 藍圖擴充套件至整個本地 AI 產品線(GeForce RTX、RTX PRO、RTX 和 DGX Spark、DGX Station),並提供了新的簡化安裝程式和對 Hermes Agent 的支援。

在效能方面,llama.cpp 和 vLLM 透過多 token 預測實現了頂級智慧體模型的 2 倍推理效能提升,同時 llama.cpp 和 ComfyUI 獲得了新的多 GPU 最佳化。H Company 釋出了計算機使用工具,包括新模型和即將推出的桌面智慧體框架,針對 RTX 和 DGX PC 進行了最佳化。Adobe 正在重新架構其 Photoshop 和 Premiere 應用,Blender 加入了 NVIDIA DLSS 4.5 光線重建,NVIDIA 還發布了 RTX Video Frame Generation,這些更新將於今年秋季隨 RTX Spark 一同到來。

NVIDIA Broadcast 2.2 更新帶來了 Studio Voice 功能最佳化和 Elgato Stream Deck 支援,NVIDIA Project G-Assist 也增加了 Stream Deck 整合。

本地智慧體 AI:在 Windows RTX PC 上實現個人、私密且快速的應用

智慧體的廣泛採用一直受限於無法在使用者主 PC 上安全、私密地執行智慧體。NVIDIA 和微軟正合作解決這一挑戰,為本地智慧體提供可靠的 Windows 平臺。合作始於堅實的基礎——新的 Windows 安全基元和 NVIDIA OpenShell 執行時,確保智慧體在使用者完全控制下安全執行。新的 Windows 基元提供了身份、隔離、策略和端到端安全能力,用於原生構建和執行智慧體。NVIDIA OpenShell 提供了額外的策略功能,讓使用者定義智慧體可以做什麼和不可以做什麼,能夠根據使用者隱私策略智慧地將查詢路由到本地模型,並能模糊化傳送到雲端模型的查詢中的個人資訊。這一強大的安全和隱私層正被 Hermes Agent 和 OpenClaw 等領先的智慧體開發者所採用。

為本地裝置上的智慧體提供動力需要既安全又高效的硬體。RTX Spark 擁有高達 1 petaflop 的 AI 算力和 128GB 統一記憶體,滿足本地智慧體的處理需求。NVIDIA 還在加速這些智慧體所依賴的本地開放模型生態系統。NVIDIA 與 llama.cpp 社群合作,實現了多 token 預測(MTP)等特性和最佳化,這是一種推測解碼技術,由較小的草稿模型一次提出多個 token,目標模型在單次傳遞中驗證。結合其他最佳化,在 Qwen 3.6 和 3.5 27B 上實現了 2 倍效能,在 Qwen 3.6 和 3.5 35B 上實現了 1.6 倍效能提升。這些更新已透過 llama.cpp webUI 和 LM Studio 提供。

對於使用多 GPU 設定的 AI 愛好者,NVIDIA 與開源社群合作增強了兩款最流行的本地 AI 工具:llama.cpp 增加了張量並行,在兩張同等 GPU 上記憶體提升 2 倍,計算效能提升 1.8 倍;ComfyUI 獲得了新的無分類器引導方法,在兩張同等 GPU 上效能提升 2 倍,並可選擇將模型鏈拆分到不同 GPU 以利用組合記憶體。

NVIDIA 還與 H Company 合作擴充套件智慧體能力。H Company 的計算機使用框架讓智慧體能夠透過觀看螢幕、操作滑鼠和鍵盤來導航 PC,即使在沒有 API 的應用中也能像使用者一樣操作,即將在 RTX 和 DGX PC 上推出並支援本地模型。NVIDIA 與 H Company 合作量化了其最先進的 Holo Computer Use 模型,並加速其框架——在 NVIDIA GPU 上實現 2 倍加速,同時記憶體消耗降低 35%。模型現已可下載,Holo Desktop 應用即將推出。

Linux 上的智慧體最佳化

對於需要始終可訪問的本地智慧體的開發者,NVIDIA DGX Spark 是為需要 Linux 環境的開發者打造的最強大的個人智慧體 AI 計算機,它統一了大記憶體、快速計算和 NVIDIA CUDA 生態系統的相容性。本月釋出的 DGX Spark 作業系統版本帶來了最簡化的開箱即用體驗,包括精簡的 NemoClaw 安裝程式,以及更快的頂級智慧體模型推理。NemoClaw 現已適用於 Linux 和 Windows Subsystem for Linux 上的所有 NVIDIA RTX 和 DGX PC。NVIDIA 與 vLLM 合作最佳化了智慧體的推理,包括 vLLM 中的最佳化以及針對 Qwen 3.6 35B 的新 NVFP4 檢查點。這些更新使 DGX Spark 的效能比此前來自 Unsloth 的 NVFP4 檢查點提升了 2.6 倍,幷包括核心改進、混合精度以及 CUDA Graph 對 MTP 的支援。

與 Adobe 合作帶來強大的創作體驗

NVIDIA 正與 Adobe 合作重新架構 Adobe Premiere 和 Photoshop 以適應 RTX Spark。由 Firefly 驅動的 Photoshop 生成式填充和 Premiere 生成式擴充套件是數百個加速工具中的代表,提供創作力量、精確性和控制。RTX Spark 進一步擴充套件了這些能力,在創作工作流程中實現高達 2 倍更快的 AI、編輯、色彩和效果。Adobe Premiere 將採用新的影片管線,利用 RTX Spark 的統一記憶體、Blackwell GPU 和 TensorRT 軟體,實現即時編輯和色彩校正、GPU 加速 AI 效能以及更高效的複雜時間線渲染。此外,Adobe 的 Substance 3D Painter 和 Stager 將在 RTX Spark 上原生執行,帶來更流暢、更快速的 3D 紋理和場景創作工作流程。Adobe 還將進一步擴充套件 Premiere 和 Photoshop,允許使用者透過 Windows 智慧體進行創作、編輯和設計,為創作者提供協作式合作伙伴以加速工作流程。

面向創作者的新工具和應用更新

新的 NVIDIA 平臺更新和合作夥伴應用最佳化正在整個 RTX 生態系統中推出,部分今日上線,其他將於今年秋季隨 RTX Spark 到來。NVIDIA Broadcast 2.2 將 Studio Voice(一種讓任何麥克風聽起來像錄音室品質的 AI 功能)從測試版畢業,即日起可用。Studio Voice 現可在 GeForce RTX 3060 及以上 GPU 上執行,效能得到改進。該應用還增加了 Elgato Stream Deck 整合和可配置的鍵盤快捷鍵。Project G-Assist 也透過 Elgato MCP Server 增加了 Stream Deck 支援。此外,Blender Cycles 正在整合 DLSS 4.5 光線重建作為新的降噪器,將路徑追蹤視口轉變為互動式即時檢視器,讓 3D 藝術家在檢視接近最終渲染質量的同時導航場景。該更新將於今年秋季隨 Blender 5.3 和 RTX Spark 一起釋出。同樣隨 RTX Spark 釋出的還有 RTX Video Frame Generation,這是一種新的 AI 效果,可將影片幀率即時加倍或四倍,非常適合提升 AI 模型通常生成的 15-20 fps 輸出。它作為 Python 輪子和 ComfyUI 節點提供,讓 AI 藝術家快速生成低 fps 影片,然後插值到流暢的播放速率。

#ICYMI:RTX AI Garage 的最新動態

有關 RTX Spark 的完整公告,請閱讀 NVIDIA RTX Spark 釋出詳情,包括超級晶片、NVIDIA 與 Windows 在智慧體方面的合作,以及合作伙伴的筆記型電腦和小型桌上型電腦。ASUS ProArt 創作者筆記本現預裝 Black Forest Labs 的 FLUX.2 Klein 4B 模型,透過 MuseTree 應用提供,採用 NVFP4 格式和 NVIDIA TensorRT for RTX SDK 最佳化,實現高達 2.5 倍加速和 560% 記憶體縮減,開箱即可本地生成影像。NVIDIA AI for Media SDK 釋出了更新,包括新的 LipSync NIM 微服務(針對法語、德語和西班牙語最佳化),以及 Active Speaker Detection NIM 微服務的多攝像頭支援。檢視最新的 RTX AI Garage 博文,瞭解 Hermes Agent 和 RTX PC 及 DGX Spark 上的自我改進 AI。