Show HN: AgentArk – オープンソースのセルフホストAIエージェントOS
AgentArkは、AIエージェントのライフサイクル全体を管理するセルフホストランタイムです。セキュリティ境界、コンテキスト蒸留、自己進化などの機能を備え、複数のLLMをサポートし、データプライバシーを確保します。現在ベータ版で、本番環境での使用は推奨されません。
AgentArkは、AIエージェントの完全なライフサイクルを管理するためのオープンソースのセルフホストランタイムです。従来のAIエージェントとは異なり、AgentArk自体はエージェントではなく、エージェントのための「箱舟」です。つまり、エージェントを安全に格納し、その行動を監視・制御するセキュリティレイヤーを提供し、すべての操作を監査可能にします。ユーザーはエージェントを構築、デプロイ、監視でき、リアルタイムアプリ、スケジュール自動化、条件付きウォッチャーとして展開できます。
AgentArkのアーキテクチャは多層的で、コマンド層、メモリ層、自動化層、エージェント層、アプリ層、統合層、デバイス層、セキュリティ層、進化層から構成されます。セキュリティ層は特に重要で、外部とのやり取りはすべて承認ゲートを通過し、エージェントはDocker境界内で実行され、ホストファイルシステムへのアクセスはデフォルトで制限されています。Sentinelモジュールはアクション追跡、障害分類、ドリフト検出を提供し、ArkDistillはツール出力を圧縮してノイズを削減し、通常60〜90%の出力削減を実現します。Reflect機能を使えば、日次、週次、月次のアクティビティを視覚的に俯瞰できます。
自己進化機能も重要です。受け入れられた作業、ユーザーの修正、ツールの結果がローカルメモリ、プロンプト、ルーティング戦略にフィードバックされ、システムが個人のワークフローに適応していきます。例えば、返信を短く修正し続けると、エージェントはデフォルトで簡潔な回答を学習します。特定のツールパスが成功し続けると、そのパスがより選択されやすくなります。
AgentArkはDocker上で動作し、イメージサイズは約3.1GB、アイドル時500MB、負荷時約1GBのRAMを消費します。Ollama、Anthropic、OpenAI、Gemini、Groqなど複数のLLMをサポートし、モデルプロバイダを指定するだけで利用可能で、追加のサブスクリプションは不要です。すべてのデータ、シークレット、統合トークンはローカルボリュームに保存され、AES-256-GCMで暗号化されます。
統合層はGmail、Calendar、Telegram、WhatsApp、Slack、webhooks、API、MCPサーバー、カスタムパックをサポートします。デバイス層ではコンパニオンデバイスのペアリングとスコープ付き許可が可能です。進化層はMemory、Reflect、Sentinel、Evolve、Pulseが連携して動作します。ユーザーは自然言語でエージェントを構築でき、例えば「毎朝9時に天気概要を送って」「受信箱の緊急メールを監視して」といった指示が可能です。エージェントは返信だけでなく、設定の保存、フォローアップのスケジュール、ブリーフの配信、下書きの作成、更新の監視、統合の接続、タスクの永続化などを行います。
インストールは簡単で、curlまたはPowerShellコマンド一つでデプロイ可能です。起動後、http://localhost:8990にアクセスしてWeb UIを使用します。低メモリシステム(2-4GB RAM)向けのオーバーライドも用意されています。自動バックアップはPulse機能が管理し、14日ごとにチェックし、システムがアイドル状態のときに作成します。
重要な注意点:AgentArkは現在ベータ版であり、本番環境での使用は推奨されません。ワークスペース内でファイルを誤って上書きする可能性があります。Docker境界がホストファイルシステムを保護しますが、コンテナにマウントしたものは対象となります。承認を有効にし、データのバックアップを取り、結果を検証してください。プロジェクトは一人の開発者(@debankadas)によってメンテナンスされており、バグや粗い部分が予想されるため、問題が発生した場合は報告をお願いします。
AgentArkはMITとApache 2.0のデュアルライセンスで、完全にオープンソースで監査可能です。すべての操作に監査証跡があり、ユーザーはエージェントの行動をいつでも確認できます。このOSはユーザーのワークスタイルに適応し、使用を重ねるごとにパーソナライズされていきます。