Hermesが自己改善型AIエージェントを実現、NVIDIA RTX PCとDGX Sparkを搭載
Hermes Agentは、Nous Researchが開発したオープンソースのAIエージェントフレームワークで、自己改善と信頼性を特徴とし、3ヶ月足らずでGitHubで14万スターを獲得しました。モデルに依存せず、ローカル実行に最適化されており、NVIDIA RTX PCやDGX Sparkに最適です。また、AlibabaのQwen 3.6モデル(27Bおよび35Bパラメータ)は、従来の大型モデルを凌駕する性能を発揮し、Hermesの実行に理想的です。
記事インテリジェンス
要点
- Hermes Agentは3ヶ月未満で14万GitHubスターを獲得、OpenRouterで最も使用されるエージェントに
- 自己進化スキル、隔離されたサブエージェント、信頼性設計、同一モデルでより良い結果の4つの特長
- Qwen 3.6 35Bモデルは20GBメモリで動作し、120Bパラメータモデルを凌駕
- NVIDIA DGX Sparkは128GBメモリと1ペタフロップスのAI性能で常時稼働エージェントをサポート
重要な理由
このニュースが重要なのは、Hermes Agentは3ヶ月未満で14万GitHubスターを獲得、OpenRouterで最も使用されるエージェントにためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
エージェンティックAIはユーザーの作業方法を変えています。OpenClawの成功に続き、コミュニティは新しいオープンソースのエージェントフレームワークを受け入れています。最新のHermes Agentは、3ヶ月足らずで14万以上のGitHubスターを獲得し、先週時点でOpenRouterによると世界で最も使用されているエージェントです。
Nous Researchによって開発されたHermesは、信頼性と自己改善のために設計されています——これらは歴史的にエージェントで達成するのが困難な特性です。プロバイダーやモデルに依存しない設計で、常時ローカル使用に最適化されており、NVIDIA RTX PC、NVIDIA RTX PROワークステーション、NVIDIA DGX Sparkが24時間フルスピードで実行する理想的なハードウェアです。
AlibabaのQwen 3.6シリーズは、高性能でオープンウェイトの大規模言語モデル(LLM)であり、Hermesのようなローカルエージェントの実行に理想的です。Qwen 3.6 27Bおよび35Bパラメータモデルは、前世代の120Bおよび400Bパラメータモデルを上回る性能を発揮し、NVIDIA RTXおよびDGX Spark上で加速されたエージェンティックAIを実現します。
Hermes:ローカルAIエージェントの能力を加速 他の人気エージェントと同様に、Hermesはメッセージングアプリと統合し、ローカルファイルやアプリケーションにアクセスでき、24時間365日動作します。しかし、4つの際立った能力が他と一線を画しています:
- **自己進化スキル**:Hermesは自身のスキルを作成し洗練します。複雑なタスクに遭遇したりフィードバックを受け取るたびに、学習内容をスキルとして保存し、時間の経過とともに適応・改善します。
- **隔離されたサブエージェント**:Hermesはサブエージェントを短期間の隔離されたワーカーとして扱い、サブタスクに専念させます——焦点を絞ったコンテキストとツールセットを持ちます。これによりタスク構成が整理され、エージェントの混乱が最小限に抑えられ、Hermesは小さなコンテキストウィンドウで動作できるため、ローカルモデルに理想的です。
- **信頼性設計**:Nous ResearchはHermesに同梱されるすべてのスキル、ツール、プラグインをキュレーションしストレステストします。結果として、Hermesは300億パラメータクラスのローカルモデルでも安定して動作し、他のほとんどのエージェントフレームワークが必要とする絶え間ないデバッグが不要です。
- **同一モデルでより良い結果**:フレームワーク間で同一モデルを使用した開発者の比較では、Hermesで一貫して強い結果が得られています。違いはフレームワークにあります:Hermesはアクティブなオーケストレーションレイヤーであり、薄いラッパーではなく、タスクごとの実行ではなく持続的なデバイス上のエージェントを可能にします。
Hermesエージェントと基盤となるLLMはどちらもローカル実行向けに構築されています——つまり、ハードウェアの品質がユーザー体験の品質を直接決定します。NVIDIA RTX GPUはこの種のワークロードに特化して設計されています。
Qwen 3.6:データセンター級のインテリジェンスをローカルで 最新のQwen 3.6モデルは、高い評価を得ているQwen 3.5シリーズを基に、ローカルAIエージェント向けにさらなる飛躍をもたらします。新しいQwen 3.6 35Bモデルは約20GBのメモリで動作し、70GB以上のメモリを必要とする120Bパラメータモデルを凌駕します。さらに、Qwen 3.6 27Bは新しい高密度モデルで、より多くのアクティブパラメータを持ち、Qwen 3.5 397Bなどの400Bパラメータモデルの精度に匹敵しながら、サイズは16分の1です。ハイエンドRTX GPU上で実行することで、モデルは高速な体験に必要な計算能力を得られます。
これらのモデルはHermesのようなローカルエージェントに理想的であり、NVIDIA GPUとDGX Sparkはそれらを実行する最速の方法です。NVIDIA Tensor CoreはAI推論を加速し、より高いスループットと低レイテンシを実現——Hermesはマルチステップタスクを数秒で処理したり、自身のスキルを数分ではなく数秒で洗練できます。
DGX Spark:常時稼働のエージェンティックコンピュータ Hermesのようなエージェントは継続的に動作するように設計されています——リクエストに応答し、マルチステップタスクを計画し、自律的に実行し、自己改善します。NVIDIA DGX Sparkは理想的なコンパニオンです——コンパクトで効率的なスタンドアロンマシンで、持続的な終日エージェンティックワークフロー向けに構築されています。
128GBのユニファイドメモリと1ペタフロップスのAI性能により、NVIDIA DGX Sparkは120Bパラメータの混合エキスパートモデルを終日実行できます。そして新しいQwen 3.6 35Bモデルは、よりスリムなフットプリントで同等のインテリジェンスを提供し——より高速に動作し、ユーザーに同時ワークロードを実行する能力を提供します。
パフォーマンスと使いやすさを最大化するには、Hermes DGX Sparkプレイブックをお読みください。さらに、NVIDIAの「Build It Yourself」エージェンティックAIシリーズの今後のハンズオンセッションに登録して、NemoClawとOpenShellを使用した自律AIエージェントの構築方法を学びましょう。
NVIDIA DGX SparkはNVIDIAの製造パートナーから注文可能です——マーケットプレイスをご覧ください。
NVIDIAハードウェアでHermesを使い始める NVIDIAハードウェア上でHermesをローカル実行するのは簡単です。
Hermes GitHubリポジトリにアクセスして始め、好みのローカルモデルとランタイムを組み合わせてください。llama.cpp、LM Studio、またはOllamaを介してHermesをQwen 3.6と一緒に実行します。Hermes AgentはLM StudioとOllamaのサポートを標準で備えており、ローカルエージェントへの最も簡単なパスを提供します。
ローカルAI愛好家がパーソナルエージェントの最前線を探求する場合でも、開発者がワークフローのためのローカルツールを構築する場合でも、NVIDIAハードウェア上のHermesはユニークで能力が高く信頼性のある基盤を提供します。
NVIDIA RTXハードウェア向けに最適化された最新のオープンモデルとエージェントに関するRTX AI Garageからのさらなるアップデートをお楽しみに。
#ICYMI: RTX AI Garageからの最新情報
NVIDIA RTX PRO GPUは、llama.cppでQwen 3.6モデルを実行する際に、トークン生成速度を最大3倍高速化します。ローカルAIに必要なリアルタイム応答性を実現し、エージェントはマルチステップタスクに取り組み、スキルを洗練してワークフローをシームレスに保つことができます。
GoogleのGemma 4 26Bおよび31Bモデルが、NVIDIA Blackwell GPU上でさらに高速なパフォーマンスを実現するNVFP4チェックポイントとして利用可能になりました。NVFP4チェックポイントをGoogleの新しいマルチトークン予測ドラフターと組み合わせると、同一の出力品質で最大3倍の推論高速化が可能になり、フロンティアクラスの推論をNVIDIA GPU上でローカル実行できます。
同じく4月にリリースされたMistral Mediumバージョン3.5には、llama.cppおよびOllamaとの互換性アップデートが含まれており、ユーザーはNVIDIA RTX PROおよびDGX Sparkシステム上で実行できます。
NVIDIAは最近、セキュリティを向上させローカルモデルをサポートすることでNVIDIAデバイス上のOpenClawエクスペリエンスを最適化するオープンソーススタック、NVIDIA NemoClawを発表しました。NemoClawはWindows Subsystem for Linux (WSL2)をサポートするようになり、Microsoftのプラットフォーム上の愛好家や開発者にサポートをもたらします。このステップバイステップのプレイブックでDGX Spark上のNemoClawを使い始めましょう。
Facebook、Instagram、TikTok、XでNVIDIA AI PCをフォローし、RTX AI PCニュースレターを購読して情報を入手してください。
LinkedInとXでNVIDIA Workstationをフォロー。
ソフトウェア製品情報に関する通知をご覧ください。