AI News HubLIVE
站内改写3 分で読了

Nous Research、Hermes Desktopを公開:Hermes Agent v0.15.2向けネイティブクロスプラットフォームフロントエンド、ストリーミングツール出力対応

Nous ResearchはHermes Desktopのパブリックプレビューをリリースしました。これはmacOS、Windows、Linux向けのネイティブアプリケーションで、オープンソースのHermes Agentにグラフィカルインターフェースを提供します。CLIやゲートウェイと同じエージェントコア、設定、APIキー、セッション、スキル、メモリを共有し、ターミナル不要でストリーミング応答、プレビューペイン、ファイルブラウザ、音声入出力、設定UIを備えています。

ソースMarkTechPost著者: Michal Sutter

Nous Researchは、Hermes Desktopのパブリックプレビューを公開しました。これは、macOS、Windows、Linux向けのネイティブアプリケーションであり、オープンソースのHermes Agentにグラフィカルインターフェースを提供します。これまでユーザーはCLIやメッセージゲートウェイを介してHermesを実行していましたが、現在のビルドはHermes Agent v0.15.2に基づいています。

Nous Researchのドキュメントによると、Hermes Desktopは同じエージェントコアを再利用し、CLIやゲートウェイと設定、APIキー、セッション、スキル、メモリを共有します。デスクトップアプリはフォークではなく、同一エージェントの別のインターフェースです。セッションは異なるサーフェス間でシームレスに切り替え可能で、デスクトップで開始した会話をCLIやTUIで続けることができ、その逆も可能です。状態が重複しないためです。

Hermes Agentは自律型AIエージェントであり、エディターに紐付いたコーディングアシスタントではありません。タスクの実行、ツールの呼び出し、セッション間での状態保持を行います。エージェントは「計画・行動・観察」のループで動作します。Hermes Desktopはその同じエージェントコア上に構築されたGUIで、ターミナル不要で使用できます。ウィンドウにはストリーミング応答とライブツールアクティビティが表示され、右側のペインではWebページ、ファイル、ツール出力をプレビューできます。また、ファイルブラウザ、音声入出力、設定UIも含まれています。

Hermesの核となる機能の一つは「クローズド学習ループ」です。複雑なタスクの後、エージェントは再利用可能なスキルを書き、そのスキルは後の使用で自己改善します。メモリは永続的でエージェントが管理し、定期的に知識保存を促します。セッション間のリコールにはFTS5セッション検索とLLM要約を使用します。ユーザーモデリングはHonchoの弁証法的ユーザーモデリングを採用しています。長期使用により、より多くのコンテキストが保持され再利用されます。スキルはagentskills.ioのオープンスタンダードに従っています。

接続面では、Hermesは単一のゲートウェイから複数のメッセージングプラットフォームで動作します。デスクトップではTelegram、Discord、Slack、WhatsApp、Signal、Email、CLIがリストされています。あるプラットフォームでタスクを開始し、別のプラットフォームで続行できます。スケジューリングは自然言語でレポート、バックアップ、ブリーフィングを設定でき、組み込みのcronスケジューラで無人実行されます。委任機能は独立したサブエージェントを生成し、それぞれが独自の会話とターミナルを持ち、特定のタスクを処理します。Python RPCスクリプトはマルチステップパイプラインをゼロコンテキストコストのターンに圧縮します。

実行環境はサンドボックス化されています。Hermesは5つのバックエンド(ローカル、Docker、SSH、Singularity、Modal)をサポートします。コンテナ強化と名前空間分離により、実行中のプロセスが見たり操作したりできる範囲が制限されます。組み込みツールにはWeb検索、ブラウザ自動化、ビジョン、画像生成、テキスト読み上げ、マルチモデル推論が含まれます。また、MCP(Model Context Protocol)を介して外部ツールと接続することもできます。

Hermesは任意のプロバイダーと互換性があるため、APIキーはオプションです。Nous Portalは代わりにそれらを1つのサブスクリプションにまとめています。PortalのティアはFree、Plus、Super、Ultraで、有料ティアには月間クレジット、300以上のモデルへのアクセス、組み込みツール使用が含まれます。ツールゲートウェイは複数のツールを1つのアカウントにルーティングします。Web検索にはFirecrawl、画像生成にはFAL、テキスト読み上げにはOpenAI、クラウドブラウザにはBrowser Useを使用します。

Hermes Desktopのパブリックプレビューは現時点では荒削りな部分があるかもしれませんが、ネイティブインストーラによりほとんどのユーザーがターミナルを必要としなくなりました。ストリーミング出力とプレビューによりツールコールの検査が容易になります。永続メモリと自己改善スキルは繰り返しの指示を減らします。モデルに依存しない設計は単一プロバイダーへのロックインを回避します。MITライセンスにより監査、セルフホスティング、修正が可能です。しかしながら、自律的なメモリとスケジューリングは監視とレビューの問題を引き起こす可能性があり、Linuxデスクトップは依然としてターミナルからのインストールが必要であり、広範な機能は初心者にとって学習曲線を急にしています。

結論として、Hermes DesktopはオープンソースAIエージェント分野に豊富な機能を備えたグラフィカルツールをもたらし、そのクロスプラットフォーム対応と共有コアの設計は注目に値します。