2026-05-13站内改写

Hermes 解鎖自我改進的AI代理，由NVIDIA RTX PC和DGX Spark驅動

Hermes Agent 是一個開源的AI代理框架，由Nous Research開發，具有自我改進和可靠性的特點，已在GitHub上獲得超過14萬顆星。該框架與模型無關，最佳化用於本地執行，特別適合NVIDIA RTX PC和DGX Spark硬體。同時，阿里巴巴的Qwen 3.6模型（27B和35B引數）在效能上超越前代大型模型，是執行Hermes的理想選擇。

文章情報

工程師進階

要點

Hermes Agent 在不到三個月內獲得14萬GitHub星，成為OpenRouter上使用最多的代理
具備自我進化技能、獨立子代理、可靠性設計和一致更優結果四大特點
Qwen 3.6 35B模型僅需20GB記憶體即可超越120B引數模型，27B模型匹配400B模型效能
NVIDIA DGX Spark 是全天候執行代理工作負載的理想計算平臺

為什麼重要

這條新聞值得關注，因為Hermes Agent 在不到三個月內獲得14萬GitHub星，成為OpenRouter上使用最多的代理。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

代理型AI正在改變使用者完成工作的方式。繼OpenClaw成功之後，開源社群正積極擁抱新的代理框架。最新的是Hermes Agent，它在不到三個月內獲得了超過14萬GitHub星，並且截至上週，根據OpenRouter的資料，它是全球使用最多的代理。

Hermes由Nous Research開發，專為可靠性和自我改進而設計——這兩點歷來是代理框架難以實現的。它設計為與提供商和模型無關，並針對始終線上的本地使用進行了最佳化，這使得NVIDIA RTX PC、NVIDIA RTX PRO工作站和NVIDIA DGX Spark成為全天候全速執行的理想硬體。

阿里巴巴的Qwen 3.6系列高效能、開源權重的大型語言模型（LLM）非常適合執行像Hermes這樣的本地代理。Qwen 3.6 27B和35B引數模型在效能上超越了前一代的120B和400B引數模型，並在NVIDIA RTX和DGX Spark上加速執行。

Hermes：加速的本地AI代理能力與其他流行代理一樣，Hermes整合訊息應用，可訪問本地檔案和應用程式，並24/7執行。但其四個突出能力使其與眾不同：

**自我進化技能**：Hermes編寫並完善自身技能。每次遇到複雜任務或收到反饋時，它會將學習內容儲存為技能，從而隨時間適應和改進。
**獨立子代理**：Hermes將子代理視為短期、隔離的工作者，專門處理子任務——具有集中的上下文和工具集。這保持了任務組織的整潔，最小化了代理的混亂，並允許Hermes在較小的上下文視窗中執行，非常適合本地模型。
**可靠性設計**：Nous Research策劃並壓力測試了Hermes附帶的所有技能、工具和外掛。結果是：Hermes在300億引數類本地模型上也能穩定執行，而大多數其他代理框架則需要持續除錯。
**相同模型，更好結果**：使用相同模型在不同框架上的開發者比較顯示，Hermes始終獲得更強結果。區別在於框架：Hermes是一個活躍的編排層，而非薄包裝器，支援持久的裝置端代理而非逐任務執行。

Hermes代理和底層LLM都設計為本地執行——這意味著硬體質量直接決定使用者體驗質量。NVIDIA RTX GPU正是為此類工作負載而構建。

Qwen 3.6：資料中心級智慧，本地化最新的Qwen 3.6模型基於廣受好評的Qwen 3.5系列，為本地AI代理帶來了又一大飛躍。新的Qwen 3.6 35B模型在約20GB記憶體上執行，同時超越了需要70GB以上記憶體的120B引數模型。此外，Qwen 3.6 27B是一種新的密集模型，具有更多活躍引數——匹配Qwen 3.5 397B等400B引數模型的精度，而體積僅為其十六分之一。在高階RTX GPU上執行，為模型提供了快速體驗所需的計算能力。

這些模型非常適合像Hermes這樣的本地代理，而NVIDIA GPU和DGX Spark是執行它們的最快方式。NVIDIA Tensor Core加速AI推理，提供更高吞吐量和更低延遲——使Hermes能在幾秒鐘內完成多步驟任務或完善自身技能，而非幾分鐘。

DGX Spark：始終線上的代理計算機像Hermes這樣的代理旨在持續執行——響應請求、計劃多步驟任務、自主執行和自我改進。NVIDIA DGX Spark是理想的伴侶——一臺緊湊、高效的獨立機器，專為持續的、全天候的代理工作流而構建。憑藉128GB統一記憶體和1 petaflop AI效能，NVIDIA DGX Spark可以全天候執行120B引數混合專家模型。而新的Qwen 3.6 35B模型以更小的體積提供同等智慧——執行更快，併為使用者提供同時執行多個工作負載的能力。

要最大化效能和易用性，請閱讀Hermes DGX Spark手冊。此外，註冊即將到來的NVIDIA“Build It Yourself”代理AI系列實踐課程，學習如何使用NemoClaw和OpenShell構建自主AI代理。

NVIDIA DGX Spark現已可從NVIDIA製造合作伙伴處訂購——請訪問市場。

在NVIDIA硬體上開始使用Hermes 在NVIDIA硬體上本地執行Hermes非常簡單。

訪問Hermes GitHub倉庫開始使用，並將其與首選本地模型和執行時搭配。透過llama.cpp、LM Studio或Ollama執行Hermes搭配Qwen 3.6。Hermes Agent開箱即支援LM Studio和Ollama，是本地代理的最簡單路徑。

無論是探索個人代理前沿的本地AI愛好者，還是為其工作流構建本地工具的開發人員，Hermes在NVIDIA硬體上提供了獨特且可靠的基礎。

敬請關注RTX AI Garage關於針對NVIDIA RTX硬體最佳化的最新開源模型和代理的更多更新。

#ICYMl：RTX AI Garage最新動態

NVIDIA RTX PRO GPU使用llama.cpp執行Qwen 3.6模型時，令牌生成速度提升高達3倍。獲得本地AI所需的即時響應能力，代理可以處理多步驟任務並完善其技能，保持工作流無縫。

Google的Gemma 4 26B和31B模型現已作為NVFP4檢查點提供，可在NVIDIA Blackwell GPU上獲得更快的效能。將NVFP4檢查點與Google的新多令牌預測草稿器配對，可在相同輸出質量下獲得高達3倍的推理加速，使前沿級推理能夠在NVIDIA GPU上本地執行。

同樣於4月釋出的Mistral Medium 3.5版本包括與llama.cpp和Ollama的相容性更新，使使用者能夠在NVIDIA RTX PRO和DGX Spark系統上執行。

NVIDIA最近推出了NVIDIA NemoClaw，這是一個開源棧，透過提高安全性和支援本地模型來最佳化NVIDIA裝置上的OpenClaw體驗。NemoClaw現在支援Windows Subsystem for Linux (WSL2)，為Microsoft平臺上的愛好者和開發者帶來支援。請按照這份逐步手冊開始使用NemoClaw on DGX Spark。

在Facebook、Instagram、TikTok和X上關注NVIDIA AI PC，並透過訂閱RTX AI PC新聞稿保持資訊更新。

在LinkedIn和X上關注NVIDIA Workstation。

參見關於軟體產品資訊的通知。