AI News HubLIVE
站内改写

Hermes 解鎖自我改進的AI代理,由NVIDIA RTX PC和DGX Spark驅動

Hermes Agent 是一個開源的AI代理框架,由Nous Research開發,具有自我改進和可靠性的特點,已在GitHub上獲得超過14萬顆星。該框架與模型無關,最佳化用於本地執行,特別適合NVIDIA RTX PC和DGX Spark硬體。同時,阿里巴巴的Qwen 3.6模型(27B和35B引數)在效能上超越前代大型模型,是執行Hermes的理想選擇。

文章情報

工程師進階

要點

  • Hermes Agent 在不到三個月內獲得14萬GitHub星,成為OpenRouter上使用最多的代理
  • 具備自我進化技能、獨立子代理、可靠性設計和一致更優結果四大特點
  • Qwen 3.6 35B模型僅需20GB記憶體即可超越120B引數模型,27B模型匹配400B模型效能
  • NVIDIA DGX Spark 是全天候執行代理工作負載的理想計算平臺

為什麼重要

這條新聞值得關注,因為Hermes Agent 在不到三個月內獲得14萬GitHub星,成為OpenRouter上使用最多的代理。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

代理型AI正在改變使用者完成工作的方式。繼OpenClaw成功之後,開源社群正積極擁抱新的代理框架。最新的是Hermes Agent,它在不到三個月內獲得了超過14萬GitHub星,並且截至上週,根據OpenRouter的資料,它是全球使用最多的代理。

Hermes由Nous Research開發,專為可靠性和自我改進而設計——這兩點歷來是代理框架難以實現的。它設計為與提供商和模型無關,並針對始終線上的本地使用進行了最佳化,這使得NVIDIA RTX PC、NVIDIA RTX PRO工作站和NVIDIA DGX Spark成為全天候全速執行的理想硬體。

阿里巴巴的Qwen 3.6系列高效能、開源權重的大型語言模型(LLM)非常適合執行像Hermes這樣的本地代理。Qwen 3.6 27B和35B引數模型在效能上超越了前一代的120B和400B引數模型,並在NVIDIA RTX和DGX Spark上加速執行。

Hermes:加速的本地AI代理能力 與其他流行代理一樣,Hermes整合訊息應用,可訪問本地檔案和應用程式,並24/7執行。但其四個突出能力使其與眾不同:

  • **自我進化技能**:Hermes編寫並完善自身技能。每次遇到複雜任務或收到反饋時,它會將學習內容儲存為技能,從而隨時間適應和改進。
  • **獨立子代理**:Hermes將子代理視為短期、隔離的工作者,專門處理子任務——具有集中的上下文和工具集。這保持了任務組織的整潔,最小化了代理的混亂,並允許Hermes在較小的上下文視窗中執行,非常適合本地模型。
  • **可靠性設計**:Nous Research策劃並壓力測試了Hermes附帶的所有技能、工具和外掛。結果是:Hermes在300億引數類本地模型上也能穩定執行,而大多數其他代理框架則需要持續除錯。
  • **相同模型,更好結果**:使用相同模型在不同框架上的開發者比較顯示,Hermes始終獲得更強結果。區別在於框架:Hermes是一個活躍的編排層,而非薄包裝器,支援持久的裝置端代理而非逐任務執行。

Hermes代理和底層LLM都設計為本地執行——這意味著硬體質量直接決定使用者體驗質量。NVIDIA RTX GPU正是為此類工作負載而構建。

Qwen 3.6:資料中心級智慧,本地化 最新的Qwen 3.6模型基於廣受好評的Qwen 3.5系列,為本地AI代理帶來了又一大飛躍。新的Qwen 3.6 35B模型在約20GB記憶體上執行,同時超越了需要70GB以上記憶體的120B引數模型。此外,Qwen 3.6 27B是一種新的密集模型,具有更多活躍引數——匹配Qwen 3.5 397B等400B引數模型的精度,而體積僅為其十六分之一。在高階RTX GPU上執行,為模型提供了快速體驗所需的計算能力。

這些模型非常適合像Hermes這樣的本地代理,而NVIDIA GPU和DGX Spark是執行它們的最快方式。NVIDIA Tensor Core加速AI推理,提供更高吞吐量和更低延遲——使Hermes能在幾秒鐘內完成多步驟任務或完善自身技能,而非幾分鐘。

DGX Spark:始終線上的代理計算機 像Hermes這樣的代理旨在持續執行——響應請求、計劃多步驟任務、自主執行和自我改進。NVIDIA DGX Spark是理想的伴侶——一臺緊湊、高效的獨立機器,專為持續的、全天候的代理工作流而構建。憑藉128GB統一記憶體和1 petaflop AI效能,NVIDIA DGX Spark可以全天候執行120B引數混合專家模型。而新的Qwen 3.6 35B模型以更小的體積提供同等智慧——執行更快,併為使用者提供同時執行多個工作負載的能力。

要最大化效能和易用性,請閱讀Hermes DGX Spark手冊。此外,註冊即將到來的NVIDIA“Build It Yourself”代理AI系列實踐課程,學習如何使用NemoClaw和OpenShell構建自主AI代理。

NVIDIA DGX Spark現已可從NVIDIA製造合作伙伴處訂購——請訪問市場。

在NVIDIA硬體上開始使用Hermes 在NVIDIA硬體上本地執行Hermes非常簡單。

訪問Hermes GitHub倉庫開始使用,並將其與首選本地模型和執行時搭配。透過llama.cpp、LM Studio或Ollama執行Hermes搭配Qwen 3.6。Hermes Agent開箱即支援LM Studio和Ollama,是本地代理的最簡單路徑。

無論是探索個人代理前沿的本地AI愛好者,還是為其工作流構建本地工具的開發人員,Hermes在NVIDIA硬體上提供了獨特且可靠的基礎。

敬請關注RTX AI Garage關於針對NVIDIA RTX硬體最佳化的最新開源模型和代理的更多更新。

#ICYMl:RTX AI Garage最新動態

NVIDIA RTX PRO GPU使用llama.cpp執行Qwen 3.6模型時,令牌生成速度提升高達3倍。獲得本地AI所需的即時響應能力,代理可以處理多步驟任務並完善其技能,保持工作流無縫。

Google的Gemma 4 26B和31B模型現已作為NVFP4檢查點提供,可在NVIDIA Blackwell GPU上獲得更快的效能。將NVFP4檢查點與Google的新多令牌預測草稿器配對,可在相同輸出質量下獲得高達3倍的推理加速,使前沿級推理能夠在NVIDIA GPU上本地執行。

同樣於4月釋出的Mistral Medium 3.5版本包括與llama.cpp和Ollama的相容性更新,使使用者能夠在NVIDIA RTX PRO和DGX Spark系統上執行。

NVIDIA最近推出了NVIDIA NemoClaw,這是一個開源棧,透過提高安全性和支援本地模型來最佳化NVIDIA裝置上的OpenClaw體驗。NemoClaw現在支援Windows Subsystem for Linux (WSL2),為Microsoft平臺上的愛好者和開發者帶來支援。請按照這份逐步手冊開始使用NemoClaw on DGX Spark。

在Facebook、Instagram、TikTok和X上關注NVIDIA AI PC,並透過訂閱RTX AI PC新聞稿保持資訊更新。

在LinkedIn和X上關注NVIDIA Workstation。

參見關於軟體產品資訊的通知。