AI News HubLIVE
サイト内リライト6 分で読了

OpenClawとHermesはエージェントの定義で一致するが、その制御方法で意見が分かれる

OpenClawとHermes Agentは、ゲートウェイを重視するかメモリを重視するかでアプローチが異なる。前者はマイクロソフトやエヌビディアに採用され、後者は開発者に広く使われている。両者の違いは制御層にあり、企業はシナリオに応じて選択する必要がある。

ソースThe New Stack AI著者: Janakiram MSV

マイクロソフトのBuild基調講演で、CEOサティア・ナデラはオペレーティングシステムやアプリからエージェンティックAIへのプラットフォームシフトを説明した。このAIはユーザーが開くのを待たずに動作する。その後、彼はこのシフトを可能にする層を示した。それは、OpenClawというオープンソースのエージェントハーネスであり、マイクロソフトの新しい実行コンテナ内でWindows上でネイティブに動作する。その上に構築されたのが、マイクロソフトの常時稼働エンタープライズエージェントScoutである。公開から1年も経たないハーネスが、ステージ上で管理されたインフラとして登場した。

エヌビディアは3月のGTCカンファレンスでさらに率直に述べ、ジェンスン・フアンはOpenClawを「パーソナルAIのオペレーティングシステム」と呼んだ。このアナロジーは理にかなっている。ハーネスは言語モデルに対して、OSがプロセッサに対して行うのと同じ役割を果たす。モデルは独立して質問に答えることができるが、ハーネスにより継続的に実行し、学習内容を記憶し、ツールを呼び出して行動することが可能になる。

今年、2つのオープンプロジェクトが異なる出発点からこの層を構築した。OpenClawはゲートウェイを中心に構築され、エージェントを人々が既に使用しているチャネルに接続する部分である。Nous ResearchのHermes Agentはメモリを中心に構築され、エージェントが開発者の作業を学習し、改善できるようにする部分である。両者の競争は、どちらが呼び出すモデルではなく、制御層に関するものである。

エージェントハーネスの平易な説明

エージェントハーネスの中核は、モデルを自律的に動作できるシステムに変えるソフトウェアである。タスク間でエージェントを生かし続けるランタイム、メッセージの出入りを運ぶゲートウェイ、セッション間で永続化するメモリを統合する。その上には、エージェントが呼び出すツール、実行するアイデンティティ、拡張可能なスキル、そして触れるものと記録すべきものを決定するポリシーと観測可能性の制御が配置される。Claude CodeやCodexのようなコーディングアシスタントはこの一部しかカバーしておらず、インタラクティブなセッション内で動作し、セッションが終了すると作業コンテキストのほとんどを失う。ハーネスはランタイム、メモリ、ガバナンスを維持し、エージェントが無人で実行できるようにする。

Nous ResearchとOpenClawはこの構造に同意している。彼らはどの部分を主要な制御点として扱うかで異なる。OpenClawはゲートウェイから始めるため、1つのエージェントがWhatsApp、Discord、Slackなどの複数のチャネルで一元的に応答できる。Hermesはメモリから始めるため、1つのエージェントが開発者のコンテキストを数週間にわたって保持し、自身のスキルを洗練できる。

OpenClawのゲートウェイ優先設計

OpenClawは、PDFツールでの以前の仕事で知られる開発者Peter Steinbergerによる独立したオープンソースプロジェクトとして始まり、2025年後半に初期バージョンをリリースし、1月に最終的にOpenClawと命名された。中央ゲートウェイにより、数十のメッセージングチャネルに接続する。パブリックスキルマーケットプレイスClawHubには、エージェントの能力を拡張する数千のコミュニティスキルが含まれている。6月末までにリポジトリは約38万のGitHubスターを獲得したが、スターは可視性を示すものであり、実際の使用を示すものではない。

より重要なのは、誰がそのゲートウェイを採用したかである。Steinbergerは2月にOpenAIに参加し、プロジェクトは独立した財団に移管され、OpenAIは所有者ではなくスポンサーとなった。GTCでエヌビディアはOpenClawをNemoClawでラップし、各エージェントをサンドボックス化し、エージェントの手の届かないところからポリシーを強制する。BuildでマイクロソフトはOpenClawをWindows実行コンテナでネイティブにし、Scoutを出荷した。ScoutはOpenClawゲートウェイ上のエージェントで、独自のEntra IDを持ち、Teams、Outlook、SharePointに接続する。いずれの場合も、プラットフォームベンダーはOpenClawの広さを維持し、元のプロジェクトに欠けていたガバナンスとIDを追加した。

企業にとって、これにより計算が変わる。セキュリティチームは、エージェントがどのフォルダを読み取るか、どのフォルダを非表示にするかをスコープできるようになり、初期のOpenClawデプロイメントを危険にさらしていた広範なアクセス権を付与する必要がなくなる。プラットフォームチームは、スタッフが既に使用しているツールからアクセスできる単一の管理されたエージェントを提供できる。広さがOpenClawの配布を促進し、プラットフォームベンダーが本番環境に必要な制御を提供した。

Hermesのメモリ優先設計

Hermes Agentは別の道を取る。Nous Researchは2月25日にMITライセンスでリリースし、Pythonで記述され、チームが所有するインフラ(VPS、ホームサーバー、ラップトップ)で永続的に実行するように設計されている。

Hermesの決定的な機能は、セッション間の永続メモリである。階層化されたメモリを維持し、困難なタスクの後に新しいスキルを開発し、使用しながらそれらのスキルを洗練する。また、開発者のプロファイルを構築し、各セッションが前回よりも多くのコンテキストで始まるようにする。スキルはagentskills.io標準に従い、特定のエージェントにロックされることなく移植可能である。

その深さは測定可能な使用量に変換された。Hermesは5月中旬までに10万のGitHubスターを超え、月末には約16万に達した。5月10日にはOpenRouterの日次トークンランキングでOpenClawを追い越し、その日の合計は2240億トークンで、前日の1860億から増加し、Hermesが総トークン数で1位になった。6月末までに、OpenRouterのアプリランキングでもHermesが総トークン数で1位になり、22兆を超えた。GitHubスター、トークン量、プラットフォームの承認は異なる種類の採用を測定し、それらが一緒に動くことはめったにない。Nousは移植性もセールスポイントにしており、hermes claw migrateコマンドでOpenClawユーザーの設定、メモリ、スキル、キーを1ステップでインポートできる。

開発者は、コードベース、その慣習、以前の決定を数週間にわたって保持するエージェントを持つことができ、毎朝コンテキストを再構築する必要がない。チームは単一のコマンドでプロバイダー間でエージェントを移行できる。Hermesは数百のモデルにわたってモデルに依存しないからだ。トレードオフは運用面であり、Hermesを実行するチームは、その基盤となるインフラストラクチャを保護および保守する必要もある。

広さ、深さ、そしてそれぞれの適切な場面

この選択は、マネージドクラウドサービスと自己管理インフラの間のよく知られたトレードオフに似ている。マネージドサービスは便利でベンダー管理だが、自己管理インフラは完全な制御と運用責任を提供する。

多くの企業は、ワークロードに応じて両方を実行するだろう。どちらのプロジェクトも単一の機能に限定されていない。OpenClawにはメモリとスキルが含まれ、Hermesは20以上のチャネルで通信できるため、違いは排他性ではなく強調点にある。以下の表は一般的なケースをマッピングしているが、両方とも完成品ではなく、出現しつつあるプラットフォームであることに注意。

  • 監査とポリシー制御が必要な規制対象企業:NemoClawまたはMicrosoft Scout下のOpenClawが最適。ガバナンスとIDはエヌビディアまたはマイクロソフトによってエージェントにラップされているが、両方とも初期段階であり、購入者をスタックに縛り付ける。
  • 自分の作業を学習し、移植性を維持するエージェントを望む開発者:Hermesが最適。永続メモリと自己改善スキルが設計の中心であり、コストは自身のインフラストラクチャを実行すること。
  • 多くのチャットプラットフォームでユーザーにリーチするチーム:OpenClawが最適。ゲートウェイと大規模なスキルマーケットプレイスは、ライバルが一致できない範囲をカバーするが、スキルの品質はさまざまであり、サプライチェーンリスクは現実的。
  • 単一プロバイダーのクラウドに標準化する組織:Microsoft 365内のScoutが最も深い統合を提供し、外部への移植性は最も低い。

実際のデプロイメントは単一のアプローチに標準化されない。エヌビディアのNemoClawブループリントは、HermesエージェントをOpenShellでOpenClawと同様に簡単に実行する。ガバナンス層は、単一のエージェントプロジェクトを選択するのではなく、複数のエージェントプロジェクトの下に位置するように構築されている。

ハーネス層が重要な理由

エンタープライズバイヤーは、エージェントが本番システムに触れる前に、2つの質問に慎重になるべきだ。最初の質問は説明責任である。エージェントがセッション間で自身のメモリとスキルを書き換えることができる場合(Hermesが行うように)、チームは行動の変化を説明できる人と、その変化がどこに記録されているかを知る必要がある。2つ目の質問は所有権に関するものである。ガバナンスとIDがプラットフォームベンダーから提供される場合(NemoClawやScoutのように)、ポリシーエンジンとIDはそのベンダーに属し、エージェントを実行するチームには属さない。

プラットフォームベンダーの賞品はランタイム層であり、これは単一の基盤モデルよりも長持ちする。エヌビディアとマイクロソフトは、顧客が選択するエージェントの周りにガバナンス、ID、観測可能性を配置するために競争している。これがNemoClawがOpenClawと並んでHermesをサポートする理由である。

セキュリティも同じ論理の一部である。OpenClawのスキルマーケットプレイスの監査では、スキャンしたスキルの中で341の悪意のあるエントリがフラグされ、セキュリティ企業は今年初めに数万の露出したインスタンスを報告した。管理されたランタイムが閉鎖することを意図したギャップである。

次に来るもの

エージェント市場は、モデル選択からランタイム、ガバナンス、メモリ層へと移行している。OpenClawは、広範なゲートウェイと大規模なスキルエコシステムが、開発者を引き付け、OpenAI、エヌビディア、マイクロソフトを引き込むことができることを示した。Hermesは、永続メモリと自己改善スキルが、同じプラットフォームのバックアップなしに大量の日常使用を促進できることを示した。広さと深さが別々のプロジェクトに留まるかどうかは既に不確かであり、NemoClawは単一の制御セットの下で実行され、HermesはOpenClawのセットアップをインポートできるからだ。

次のフェーズは所有権に焦点を当てる。エンタープライズは、エージェントが蓄積するメモリを誰が制御するか、呼び出すツールを誰が統治するか、そしてそれを生かし続けるランタイムを誰が所有するかを知る必要がある。開発者の1年分の習慣を学習したエージェントは、単に多くのアプリケーションに接続するものよりも高いスイッチングコストを生み出す。メモリはチャネルのリーチよりも耐久性のあるロックインの形態になりつつあり、それがプラットフォームベンダーが両方のプロジェクトの下に定着するにつれて、ランタイム、ガバナンス、メモリ層で競争する理由である。