Nous Research 釋出 Hermes Desktop:Hermes Agent v0.15.2 的原生跨平臺前端,支援流式工具輸出
Nous Research 公開預覽了 Hermes Desktop,這是一款適用於 macOS、Windows 和 Linux 的原生應用,為開源 Hermes Agent 提供圖形介面。它共享 CLI 和閘道器的同一代理核心、配置、API 金鑰、會話、技能和記憶體,無需終端即可使用,具有流式響應、預覽面板、檔案瀏覽器、語音輸入輸出和設定介面。
Nous Research 近日釋出了 Hermes Desktop 的公開預覽版。這是一款面向 macOS、Windows 和 Linux 的原生應用程式,為開源 Hermes Agent 提供了圖形使用者介面。此前,使用者只能透過命令列介面(CLI)和訊息閘道器來執行 Hermes。當前版本基於 Hermes Agent v0.15.2。
根據 Nous Research 的文件,Hermes Desktop 複用了同一代理核心,並與 CLI 及閘道器共享配置、API 金鑰、會話、技能和記憶體。這意味著桌面應用並非分支,而是同一代理的另一種互動介面。會話可以在不同表面之間無縫切換——例如,在桌面端開始的對話可以在 CLI 或 TUI 中繼續,反之亦然,因為狀態不會重複。
Hermes Agent 是一個自主 AI 代理,不同於繫結在編輯器中的程式設計助手。它能夠執行任務、呼叫工具,並在會話間保持狀態。該代理採用“計劃-行動-觀察”迴圈模式執行。Hermes Desktop 則是在這一核心之上構建的圖形介面,無需終端即可使用。其視窗顯示流式響應和即時的工具活動,右側面板可預覽網頁、檔案和工具輸出。此外,還整合了檔案瀏覽器、語音輸入輸出以及設定介面。
Hermes 的核心特性之一是“閉環學習”。完成複雜任務後,代理會編寫可複用的技能,這些技能在後續使用中會自我改進。記憶是持久化的,並由代理自主管理,定期提示儲存知識。跨會話召回透過 FTS5 會話搜尋和 LLM 摘要實現。使用者建模則採用 Honcho 辯證使用者建模。長期使用後,更多的上下文被保留和複用。技能遵循 agentskills.io 開放標準。
在連線性方面,Hermes 可透過單一閘道器執行在多個訊息平臺上,包括 Telegram、Discord、Slack、WhatsApp、Signal、電子郵件和 CLI。使用者可以在一個平臺上啟動任務,然後在另一個平臺上繼續。排程功能支援自然語言設定報告、備份和簡報,這些任務透過內建的 cron 排程器在後臺無人值守執行。委派功能可以生成獨立的子代理,每個子代理擁有自己的對話和終端,負責處理特定任務。Python RPC 指令碼將多步驟管道壓縮為零上下文成本的輪次。
執行環境被沙盒化。Hermes 支援五種後端:本地、Docker、SSH、Singularity 和 Modal。容器強化和名稱空間隔離限制了執行程序的可見和可操作範圍。內建工具包括網頁搜尋、瀏覽器自動化、視覺、影像生成、文本轉語音和多模型推理。此外,透過 MCP(模型上下文協議)可連線外部工具。
Hermes 與任何提供商相容,因此 API 金鑰是可選的。Nous Portal 則透過單一訂閱打包了多個 API 金鑰,提供免費、Plus、Super 和 Ultra 等級別,付費層級包含月額度、300 多個模型以及內建工具使用。工具閘道器將多個工具路由到一個賬戶下,例如網頁搜尋使用 Firecrawl,影像生成使用 FAL,文本轉語音使用 OpenAI,雲瀏覽器使用 Browser Use。
Hermes Desktop 的公開預覽版現階段可能還有一些粗糙之處,但其原生安裝程式消除了大多數使用者對終端的需求。流式輸出和預覽使得工具呼叫更易審查。持久記憶和自我改進技能減少了重複指令。模型無關的設計避免了對單一提供商的鎖定。MIT 許可證允許審計、自託管和修改。然而,自主記憶和排程可能引發監督和審查問題,Linux 桌面仍需透過終端安裝,廣泛的能力也可能導致初學者學習曲線較陡。
總之,Hermes Desktop 為開源 AI 代理領域帶來了一款功能豐富的圖形化工具,其跨平臺支援和共享核心的設計值得關注。