AI News HubLIVE
站内改写

Hermes 解锁自我改进的AI代理,由NVIDIA RTX PC和DGX Spark驱动

Hermes Agent 是一个开源的AI代理框架,由Nous Research开发,具有自我改进和可靠性的特点,已在GitHub上获得超过14万颗星。该框架与模型无关,优化用于本地运行,特别适合NVIDIA RTX PC和DGX Spark硬件。同时,阿里巴巴的Qwen 3.6模型(27B和35B参数)在性能上超越前代大型模型,是运行Hermes的理想选择。

文章情报

工程师进阶

要点

  • Hermes Agent 在不到三个月内获得14万GitHub星,成为OpenRouter上使用最多的代理
  • 具备自我进化技能、独立子代理、可靠性设计和一致更优结果四大特点
  • Qwen 3.6 35B模型仅需20GB内存即可超越120B参数模型,27B模型匹配400B模型性能
  • NVIDIA DGX Spark 是全天候运行代理工作负载的理想计算平台

为什么重要

这条新闻值得关注,因为Hermes Agent 在不到三个月内获得14万GitHub星,成为OpenRouter上使用最多的代理。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

代理型AI正在改变用户完成工作的方式。继OpenClaw成功之后,开源社区正积极拥抱新的代理框架。最新的是Hermes Agent,它在不到三个月内获得了超过14万GitHub星,并且截至上周,根据OpenRouter的数据,它是全球使用最多的代理。

Hermes由Nous Research开发,专为可靠性和自我改进而设计——这两点历来是代理框架难以实现的。它设计为与提供商和模型无关,并针对始终在线的本地使用进行了优化,这使得NVIDIA RTX PC、NVIDIA RTX PRO工作站和NVIDIA DGX Spark成为全天候全速运行的理想硬件。

阿里巴巴的Qwen 3.6系列高性能、开源权重的大型语言模型(LLM)非常适合运行像Hermes这样的本地代理。Qwen 3.6 27B和35B参数模型在性能上超越了前一代的120B和400B参数模型,并在NVIDIA RTX和DGX Spark上加速运行。

Hermes:加速的本地AI代理能力 与其他流行代理一样,Hermes集成消息应用,可访问本地文件和应用程序,并24/7运行。但其四个突出能力使其与众不同:

  • **自我进化技能**:Hermes编写并完善自身技能。每次遇到复杂任务或收到反馈时,它会将学习内容保存为技能,从而随时间适应和改进。
  • **独立子代理**:Hermes将子代理视为短期、隔离的工作者,专门处理子任务——具有集中的上下文和工具集。这保持了任务组织的整洁,最小化了代理的混乱,并允许Hermes在较小的上下文窗口中运行,非常适合本地模型。
  • **可靠性设计**:Nous Research策划并压力测试了Hermes附带的所有技能、工具和插件。结果是:Hermes在300亿参数类本地模型上也能稳定运行,而大多数其他代理框架则需要持续调试。
  • **相同模型,更好结果**:使用相同模型在不同框架上的开发者比较显示,Hermes始终获得更强结果。区别在于框架:Hermes是一个活跃的编排层,而非薄包装器,支持持久的设备端代理而非逐任务执行。

Hermes代理和底层LLM都设计为本地运行——这意味着硬件质量直接决定用户体验质量。NVIDIA RTX GPU正是为此类工作负载而构建。

Qwen 3.6:数据中心级智能,本地化 最新的Qwen 3.6模型基于广受好评的Qwen 3.5系列,为本地AI代理带来了又一大飞跃。新的Qwen 3.6 35B模型在约20GB内存上运行,同时超越了需要70GB以上内存的120B参数模型。此外,Qwen 3.6 27B是一种新的密集模型,具有更多活跃参数——匹配Qwen 3.5 397B等400B参数模型的精度,而体积仅为其十六分之一。在高端RTX GPU上运行,为模型提供了快速体验所需的计算能力。

这些模型非常适合像Hermes这样的本地代理,而NVIDIA GPU和DGX Spark是运行它们的最快方式。NVIDIA Tensor Core加速AI推理,提供更高吞吐量和更低延迟——使Hermes能在几秒钟内完成多步骤任务或完善自身技能,而非几分钟。

DGX Spark:始终在线的代理计算机 像Hermes这样的代理旨在持续运行——响应请求、计划多步骤任务、自主执行和自我改进。NVIDIA DGX Spark是理想的伴侣——一台紧凑、高效的独立机器,专为持续的、全天候的代理工作流而构建。凭借128GB统一内存和1 petaflop AI性能,NVIDIA DGX Spark可以全天候运行120B参数混合专家模型。而新的Qwen 3.6 35B模型以更小的体积提供同等智能——运行更快,并为用户提供同时运行多个工作负载的能力。

要最大化性能和易用性,请阅读Hermes DGX Spark手册。此外,注册即将到来的NVIDIA“Build It Yourself”代理AI系列实践课程,学习如何使用NemoClaw和OpenShell构建自主AI代理。

NVIDIA DGX Spark现已可从NVIDIA制造合作伙伴处订购——请访问市场。

在NVIDIA硬件上开始使用Hermes 在NVIDIA硬件上本地运行Hermes非常简单。

访问Hermes GitHub仓库开始使用,并将其与首选本地模型和运行时搭配。通过llama.cpp、LM Studio或Ollama运行Hermes搭配Qwen 3.6。Hermes Agent开箱即支持LM Studio和Ollama,是本地代理的最简单路径。

无论是探索个人代理前沿的本地AI爱好者,还是为其工作流构建本地工具的开发人员,Hermes在NVIDIA硬件上提供了独特且可靠的基础。

敬请关注RTX AI Garage关于针对NVIDIA RTX硬件优化的最新开源模型和代理的更多更新。

#ICYMl:RTX AI Garage最新动态

NVIDIA RTX PRO GPU使用llama.cpp运行Qwen 3.6模型时,令牌生成速度提升高达3倍。获得本地AI所需的实时响应能力,代理可以处理多步骤任务并完善其技能,保持工作流无缝。

Google的Gemma 4 26B和31B模型现已作为NVFP4检查点提供,可在NVIDIA Blackwell GPU上获得更快的性能。将NVFP4检查点与Google的新多令牌预测草稿器配对,可在相同输出质量下获得高达3倍的推理加速,使前沿级推理能够在NVIDIA GPU上本地运行。

同样于4月发布的Mistral Medium 3.5版本包括与llama.cpp和Ollama的兼容性更新,使用户能够在NVIDIA RTX PRO和DGX Spark系统上运行。

NVIDIA最近推出了NVIDIA NemoClaw,这是一个开源栈,通过提高安全性和支持本地模型来优化NVIDIA设备上的OpenClaw体验。NemoClaw现在支持Windows Subsystem for Linux (WSL2),为Microsoft平台上的爱好者和开发者带来支持。请按照这份逐步手册开始使用NemoClaw on DGX Spark。

在Facebook、Instagram、TikTok和X上关注NVIDIA AI PC,并通过订阅RTX AI PC新闻稿保持信息更新。

在LinkedIn和X上关注NVIDIA Workstation。

参见关于软件产品信息的通知。