AI News HubLIVE
站内改写2 分钟阅读

Nous Research 发布 Hermes Desktop:Hermes Agent v0.15.2 的原生跨平台前端,支持流式工具输出

Nous Research 公开预览了 Hermes Desktop,这是一款适用于 macOS、Windows 和 Linux 的原生应用,为开源 Hermes Agent 提供图形界面。它共享 CLI 和网关的同一代理核心、配置、API 密钥、会话、技能和内存,无需终端即可使用,具有流式响应、预览面板、文件浏览器、语音输入输出和设置界面。

来源MarkTechPost作者: Michal Sutter

Nous Research 近日发布了 Hermes Desktop 的公开预览版。这是一款面向 macOS、Windows 和 Linux 的原生应用程序,为开源 Hermes Agent 提供了图形用户界面。此前,用户只能通过命令行界面(CLI)和消息网关来运行 Hermes。当前版本基于 Hermes Agent v0.15.2。

根据 Nous Research 的文档,Hermes Desktop 复用了同一代理核心,并与 CLI 及网关共享配置、API 密钥、会话、技能和内存。这意味着桌面应用并非分支,而是同一代理的另一种交互界面。会话可以在不同表面之间无缝切换——例如,在桌面端开始的对话可以在 CLI 或 TUI 中继续,反之亦然,因为状态不会重复。

Hermes Agent 是一个自主 AI 代理,不同于绑定在编辑器中的编程助手。它能够执行任务、调用工具,并在会话间保持状态。该代理采用“计划-行动-观察”循环模式运行。Hermes Desktop 则是在这一核心之上构建的图形界面,无需终端即可使用。其窗口显示流式响应和实时的工具活动,右侧面板可预览网页、文件和工具输出。此外,还集成了文件浏览器、语音输入输出以及设置界面。

Hermes 的核心特性之一是“闭环学习”。完成复杂任务后,代理会编写可复用的技能,这些技能在后续使用中会自我改进。记忆是持久化的,并由代理自主管理,定期提示保存知识。跨会话召回通过 FTS5 会话搜索和 LLM 摘要实现。用户建模则采用 Honcho 辩证用户建模。长期使用后,更多的上下文被保留和复用。技能遵循 agentskills.io 开放标准。

在连接性方面,Hermes 可通过单一网关运行在多个消息平台上,包括 Telegram、Discord、Slack、WhatsApp、Signal、电子邮件和 CLI。用户可以在一个平台上启动任务,然后在另一个平台上继续。调度功能支持自然语言设置报告、备份和简报,这些任务通过内置的 cron 调度器在后台无人值守运行。委派功能可以生成独立的子代理,每个子代理拥有自己的对话和终端,负责处理特定任务。Python RPC 脚本将多步骤管道压缩为零上下文成本的轮次。

执行环境被沙盒化。Hermes 支持五种后端:本地、Docker、SSH、Singularity 和 Modal。容器强化和命名空间隔离限制了运行进程的可见和可操作范围。内置工具包括网页搜索、浏览器自动化、视觉、图像生成、文本转语音和多模型推理。此外,通过 MCP(模型上下文协议)可连接外部工具。

Hermes 与任何提供商兼容,因此 API 密钥是可选的。Nous Portal 则通过单一订阅打包了多个 API 密钥,提供免费、Plus、Super 和 Ultra 等级别,付费层级包含月额度、300 多个模型以及内置工具使用。工具网关将多个工具路由到一个账户下,例如网页搜索使用 Firecrawl,图像生成使用 FAL,文本转语音使用 OpenAI,云浏览器使用 Browser Use。

Hermes Desktop 的公开预览版现阶段可能还有一些粗糙之处,但其原生安装程序消除了大多数用户对终端的需求。流式输出和预览使得工具调用更易审查。持久记忆和自我改进技能减少了重复指令。模型无关的设计避免了对单一提供商的锁定。MIT 许可证允许审计、自托管和修改。然而,自主记忆和调度可能引发监督和审查问题,Linux 桌面仍需通过终端安装,广泛的能力也可能导致初学者学习曲线较陡。

总之,Hermes Desktop 为开源 AI 代理领域带来了一款功能丰富的图形化工具,其跨平台支持和共享核心的设计值得关注。