2026-06-03 17:38 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

Nous Research 发布 Hermes Desktop：Hermes Agent v0.15.2 的原生跨平台前端，支持流式工具输出

Nous Research 公开预览了 Hermes Desktop，这是一款适用于 macOS、Windows 和 Linux 的原生应用，为开源 Hermes Agent 提供图形界面。它共享 CLI 和网关的同一代理核心、配置、API 密钥、会话、技能和内存，无需终端即可使用，具有流式响应、预览面板、文件浏览器、语音输入输出和设置界面。

来源MarkTechPost作者: Michal Sutter

Nous Research 近日发布了 Hermes Desktop 的公开预览版。这是一款面向 macOS、Windows 和 Linux 的原生应用程序，为开源 Hermes Agent 提供了图形用户界面。此前，用户只能通过命令行界面（CLI）和消息网关来运行 Hermes。当前版本基于 Hermes Agent v0.15.2。

根据 Nous Research 的文档，Hermes Desktop 复用了同一代理核心，并与 CLI 及网关共享配置、API 密钥、会话、技能和内存。这意味着桌面应用并非分支，而是同一代理的另一种交互界面。会话可以在不同表面之间无缝切换——例如，在桌面端开始的对话可以在 CLI 或 TUI 中继续，反之亦然，因为状态不会重复。

Hermes Agent 是一个自主 AI 代理，不同于绑定在编辑器中的编程助手。它能够执行任务、调用工具，并在会话间保持状态。该代理采用“计划-行动-观察”循环模式运行。Hermes Desktop 则是在这一核心之上构建的图形界面，无需终端即可使用。其窗口显示流式响应和实时的工具活动，右侧面板可预览网页、文件和工具输出。此外，还集成了文件浏览器、语音输入输出以及设置界面。

Hermes 的核心特性之一是“闭环学习”。完成复杂任务后，代理会编写可复用的技能，这些技能在后续使用中会自我改进。记忆是持久化的，并由代理自主管理，定期提示保存知识。跨会话召回通过 FTS5 会话搜索和 LLM 摘要实现。用户建模则采用 Honcho 辩证用户建模。长期使用后，更多的上下文被保留和复用。技能遵循 agentskills.io 开放标准。

在连接性方面，Hermes 可通过单一网关运行在多个消息平台上，包括 Telegram、Discord、Slack、WhatsApp、Signal、电子邮件和 CLI。用户可以在一个平台上启动任务，然后在另一个平台上继续。调度功能支持自然语言设置报告、备份和简报，这些任务通过内置的 cron 调度器在后台无人值守运行。委派功能可以生成独立的子代理，每个子代理拥有自己的对话和终端，负责处理特定任务。Python RPC 脚本将多步骤管道压缩为零上下文成本的轮次。

执行环境被沙盒化。Hermes 支持五种后端：本地、Docker、SSH、Singularity 和 Modal。容器强化和命名空间隔离限制了运行进程的可见和可操作范围。内置工具包括网页搜索、浏览器自动化、视觉、图像生成、文本转语音和多模型推理。此外，通过 MCP（模型上下文协议）可连接外部工具。

Hermes 与任何提供商兼容，因此 API 密钥是可选的。Nous Portal 则通过单一订阅打包了多个 API 密钥，提供免费、Plus、Super 和 Ultra 等级别，付费层级包含月额度、300 多个模型以及内置工具使用。工具网关将多个工具路由到一个账户下，例如网页搜索使用 Firecrawl，图像生成使用 FAL，文本转语音使用 OpenAI，云浏览器使用 Browser Use。

Hermes Desktop 的公开预览版现阶段可能还有一些粗糙之处，但其原生安装程序消除了大多数用户对终端的需求。流式输出和预览使得工具调用更易审查。持久记忆和自我改进技能减少了重复指令。模型无关的设计避免了对单一提供商的锁定。MIT 许可证允许审计、自托管和修改。然而，自主记忆和调度可能引发监督和审查问题，Linux 桌面仍需通过终端安装，广泛的能力也可能导致初学者学习曲线较陡。

总之，Hermes Desktop 为开源 AI 代理领域带来了一款功能丰富的图形化工具，其跨平台支持和共享核心的设计值得关注。