Nous Research 發佈 Hermes Desktop:Hermes Agent v0.15.2 的原生跨平台前端,支持流式工具輸出
Nous Research 公開預覽了 Hermes Desktop,這是一款適用於 macOS、Windows 和 Linux 的原生應用,為開源 Hermes Agent 提供圖形界面。它共享 CLI 和網關的同一代理核心、配置、API 密鑰、會話、技能和內存,無需終端即可使用,具有流式響應、預覽面板、文件瀏覽器、語音輸入輸出和設置界面。
Nous Research 近日發佈了 Hermes Desktop 的公開預覽版。這是一款面向 macOS、Windows 和 Linux 的原生應用程序,為開源 Hermes Agent 提供了圖形用户界面。此前,用户只能通過命令行界面(CLI)和消息網關來運行 Hermes。當前版本基於 Hermes Agent v0.15.2。
根據 Nous Research 的文檔,Hermes Desktop 複用了同一代理核心,並與 CLI 及網關共享配置、API 密鑰、會話、技能和內存。這意味着桌面應用並非分支,而是同一代理的另一種交互界面。會話可以在不同表面之間無縫切換——例如,在桌面端開始的對話可以在 CLI 或 TUI 中繼續,反之亦然,因為狀態不會重複。
Hermes Agent 是一個自主 AI 代理,不同於綁定在編輯器中的編程助手。它能夠執行任務、調用工具,並在會話間保持狀態。該代理採用“計劃-行動-觀察”循環模式運行。Hermes Desktop 則是在這一核心之上構建的圖形界面,無需終端即可使用。其窗口顯示流式響應和實時的工具活動,右側面板可預覽網頁、文件和工具輸出。此外,還集成了文件瀏覽器、語音輸入輸出以及設置界面。
Hermes 的核心特性之一是“閉環學習”。完成複雜任務後,代理會編寫可複用的技能,這些技能在後續使用中會自我改進。記憶是持久化的,並由代理自主管理,定期提示保存知識。跨會話召回通過 FTS5 會話搜索和 LLM 摘要實現。用户建模則採用 Honcho 辯證用户建模。長期使用後,更多的上下文被保留和複用。技能遵循 agentskills.io 開放標準。
在連接性方面,Hermes 可通過單一網關運行在多個消息平台上,包括 Telegram、Discord、Slack、WhatsApp、Signal、電子郵件和 CLI。用户可以在一個平台上啓動任務,然後在另一個平台上繼續。調度功能支持自然語言設置報告、備份和簡報,這些任務通過內置的 cron 調度器在後台無人值守運行。委派功能可以生成獨立的子代理,每個子代理擁有自己的對話和終端,負責處理特定任務。Python RPC 腳本將多步驟管道壓縮為零上下文成本的輪次。
執行環境被沙盒化。Hermes 支持五種後端:本地、Docker、SSH、Singularity 和 Modal。容器強化和命名空間隔離限制了運行進程的可見和可操作範圍。內置工具包括網頁搜索、瀏覽器自動化、視覺、圖像生成、文本轉語音和多模型推理。此外,通過 MCP(模型上下文協議)可連接外部工具。
Hermes 與任何提供商兼容,因此 API 密鑰是可選的。Nous Portal 則通過單一訂閲打包了多個 API 密鑰,提供免費、Plus、Super 和 Ultra 等級別,付費層級包含月額度、300 多個模型以及內置工具使用。工具網關將多個工具路由到一個賬户下,例如網頁搜索使用 Firecrawl,圖像生成使用 FAL,文本轉語音使用 OpenAI,雲瀏覽器使用 Browser Use。
Hermes Desktop 的公開預覽版現階段可能還有一些粗糙之處,但其原生安裝程序消除了大多數用户對終端的需求。流式輸出和預覽使得工具調用更易審查。持久記憶和自我改進技能減少了重複指令。模型無關的設計避免了對單一提供商的鎖定。MIT 許可證允許審計、自託管和修改。然而,自主記憶和調度可能引發監督和審查問題,Linux 桌面仍需通過終端安裝,廣泛的能力也可能導致初學者學習曲線較陡。
總之,Hermes Desktop 為開源 AI 代理領域帶來了一款功能豐富的圖形化工具,其跨平台支持和共享核心的設計值得關注。