2026-05-13站内改写

Hermes 解锁自我改进的AI代理，由NVIDIA RTX PC和DGX Spark驱动

Hermes Agent 是一个开源的AI代理框架，由Nous Research开发，具有自我改进和可靠性的特点，已在GitHub上获得超过14万颗星。该框架与模型无关，优化用于本地运行，特别适合NVIDIA RTX PC和DGX Spark硬件。同时，阿里巴巴的Qwen 3.6模型（27B和35B参数）在性能上超越前代大型模型，是运行Hermes的理想选择。

文章情报

工程师进阶

要点

Hermes Agent 在不到三个月内获得14万GitHub星，成为OpenRouter上使用最多的代理
具备自我进化技能、独立子代理、可靠性设计和一致更优结果四大特点
Qwen 3.6 35B模型仅需20GB内存即可超越120B参数模型，27B模型匹配400B模型性能
NVIDIA DGX Spark 是全天候运行代理工作负载的理想计算平台

为什么重要

这条新闻值得关注，因为Hermes Agent 在不到三个月内获得14万GitHub星，成为OpenRouter上使用最多的代理。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

代理型AI正在改变用户完成工作的方式。继OpenClaw成功之后，开源社区正积极拥抱新的代理框架。最新的是Hermes Agent，它在不到三个月内获得了超过14万GitHub星，并且截至上周，根据OpenRouter的数据，它是全球使用最多的代理。

Hermes由Nous Research开发，专为可靠性和自我改进而设计——这两点历来是代理框架难以实现的。它设计为与提供商和模型无关，并针对始终在线的本地使用进行了优化，这使得NVIDIA RTX PC、NVIDIA RTX PRO工作站和NVIDIA DGX Spark成为全天候全速运行的理想硬件。

阿里巴巴的Qwen 3.6系列高性能、开源权重的大型语言模型（LLM）非常适合运行像Hermes这样的本地代理。Qwen 3.6 27B和35B参数模型在性能上超越了前一代的120B和400B参数模型，并在NVIDIA RTX和DGX Spark上加速运行。

Hermes：加速的本地AI代理能力与其他流行代理一样，Hermes集成消息应用，可访问本地文件和应用程序，并24/7运行。但其四个突出能力使其与众不同：

**自我进化技能**：Hermes编写并完善自身技能。每次遇到复杂任务或收到反馈时，它会将学习内容保存为技能，从而随时间适应和改进。
**独立子代理**：Hermes将子代理视为短期、隔离的工作者，专门处理子任务——具有集中的上下文和工具集。这保持了任务组织的整洁，最小化了代理的混乱，并允许Hermes在较小的上下文窗口中运行，非常适合本地模型。
**可靠性设计**：Nous Research策划并压力测试了Hermes附带的所有技能、工具和插件。结果是：Hermes在300亿参数类本地模型上也能稳定运行，而大多数其他代理框架则需要持续调试。
**相同模型，更好结果**：使用相同模型在不同框架上的开发者比较显示，Hermes始终获得更强结果。区别在于框架：Hermes是一个活跃的编排层，而非薄包装器，支持持久的设备端代理而非逐任务执行。

Hermes代理和底层LLM都设计为本地运行——这意味着硬件质量直接决定用户体验质量。NVIDIA RTX GPU正是为此类工作负载而构建。

Qwen 3.6：数据中心级智能，本地化最新的Qwen 3.6模型基于广受好评的Qwen 3.5系列，为本地AI代理带来了又一大飞跃。新的Qwen 3.6 35B模型在约20GB内存上运行，同时超越了需要70GB以上内存的120B参数模型。此外，Qwen 3.6 27B是一种新的密集模型，具有更多活跃参数——匹配Qwen 3.5 397B等400B参数模型的精度，而体积仅为其十六分之一。在高端RTX GPU上运行，为模型提供了快速体验所需的计算能力。

这些模型非常适合像Hermes这样的本地代理，而NVIDIA GPU和DGX Spark是运行它们的最快方式。NVIDIA Tensor Core加速AI推理，提供更高吞吐量和更低延迟——使Hermes能在几秒钟内完成多步骤任务或完善自身技能，而非几分钟。

DGX Spark：始终在线的代理计算机像Hermes这样的代理旨在持续运行——响应请求、计划多步骤任务、自主执行和自我改进。NVIDIA DGX Spark是理想的伴侣——一台紧凑、高效的独立机器，专为持续的、全天候的代理工作流而构建。凭借128GB统一内存和1 petaflop AI性能，NVIDIA DGX Spark可以全天候运行120B参数混合专家模型。而新的Qwen 3.6 35B模型以更小的体积提供同等智能——运行更快，并为用户提供同时运行多个工作负载的能力。

要最大化性能和易用性，请阅读Hermes DGX Spark手册。此外，注册即将到来的NVIDIA“Build It Yourself”代理AI系列实践课程，学习如何使用NemoClaw和OpenShell构建自主AI代理。

NVIDIA DGX Spark现已可从NVIDIA制造合作伙伴处订购——请访问市场。

在NVIDIA硬件上开始使用Hermes 在NVIDIA硬件上本地运行Hermes非常简单。

访问Hermes GitHub仓库开始使用，并将其与首选本地模型和运行时搭配。通过llama.cpp、LM Studio或Ollama运行Hermes搭配Qwen 3.6。Hermes Agent开箱即支持LM Studio和Ollama，是本地代理的最简单路径。

无论是探索个人代理前沿的本地AI爱好者，还是为其工作流构建本地工具的开发人员，Hermes在NVIDIA硬件上提供了独特且可靠的基础。

敬请关注RTX AI Garage关于针对NVIDIA RTX硬件优化的最新开源模型和代理的更多更新。

#ICYMl：RTX AI Garage最新动态

NVIDIA RTX PRO GPU使用llama.cpp运行Qwen 3.6模型时，令牌生成速度提升高达3倍。获得本地AI所需的实时响应能力，代理可以处理多步骤任务并完善其技能，保持工作流无缝。

Google的Gemma 4 26B和31B模型现已作为NVFP4检查点提供，可在NVIDIA Blackwell GPU上获得更快的性能。将NVFP4检查点与Google的新多令牌预测草稿器配对，可在相同输出质量下获得高达3倍的推理加速，使前沿级推理能够在NVIDIA GPU上本地运行。

同样于4月发布的Mistral Medium 3.5版本包括与llama.cpp和Ollama的兼容性更新，使用户能够在NVIDIA RTX PRO和DGX Spark系统上运行。

NVIDIA最近推出了NVIDIA NemoClaw，这是一个开源栈，通过提高安全性和支持本地模型来优化NVIDIA设备上的OpenClaw体验。NemoClaw现在支持Windows Subsystem for Linux (WSL2)，为Microsoft平台上的爱好者和开发者带来支持。请按照这份逐步手册开始使用NemoClaw on DGX Spark。

在Facebook、Instagram、TikTok和X上关注NVIDIA AI PC，并通过订阅RTX AI PC新闻稿保持信息更新。

在LinkedIn和X上关注NVIDIA Workstation。

参见关于软件产品信息的通知。