Show HN:Claude Coworkのオープンソース代替品を構築しました
Valmisは、Dockerによる分離とプロキシシステムを通じてセキュリティを強化した、プロダクション向けのオープンソースAIエージェントプラットフォームです。100以上の統合、マルチステップワークフロー、セッションをまたがるメモリをサポートします。
Valmisは、プロダクション環境でのワークフロー自動化を目的としたオープンソースのAIエージェントプラットフォームです。セキュリティを最優先に設計されており、各エージェントはDockerコンテナ内で隔離され、プロキシシステムを介してAPIにアクセスします。エージェントは認証情報やホストファイルに直接アクセスできず、すべてのAPIリクエストはホストマシンが代行するため、コンテナのネットワークを遮断しても動作可能です。
複数のエージェントを作成でき、それぞれ独立または協調して動作します。各エージェントには異なる認証情報、スキル、知識ベースを割り当てることができ、LLMプロバイダーも個別に指定可能です。エージェント間で決定木を形成し、最終的な制御は人間が行います。
マルチステップワークフローエンジンを内蔵しており、Cron、Webhook、アプリイベントでトリガーできます。ビジュアルなワークフロービルダーを使って条件分岐やループを含む複雑なフローを作成したり、エージェントに説明するだけで自動生成させることも可能です。各ステップで使用する認証情報やツールを制限でき、出力スキーマを定義して効率的なデータマッピングを実現します。
エージェントはセッションをまたがる記憶システムを持ち、エピソード記憶(出来事)、意味記憶(永続的な事実)、手続き記憶(ルールと制約)、ワーキング記憶(短期的なコンテキスト)の4種類に分類されます。記憶はpgvectorに保存され、テキスト埋め込みによる意味検索が行われます。エージェントは自動的に記憶を書き込み、セッション終了時に学習内容を要約して次の会話に活かします。
統合面では、Google Workspace、Slack、Notion、HubSpot、Salesforce、Figmaなど100以上のビジネス・生産性アプリをサポート。すべての統合はYAMLファイルで定義されており、拡張が容易です。エージェントはヘッドレスブラウザを操作し、フォーム入力、クリック、ページ読み込み、スクリーンショット取得が可能で、ブラウザもプロキシ経由で管理されます。
その他の主要機能:人間参加型の意思決定(重要な判断時に一時停止して選択肢を提示)、あらゆるLLMプロバイダー対応(OpenAI、Anthropic、Google、Mistral、Cohereなど約200モデル)、知識ベース連携(Google Drive、Dropbox、Notion、ファイルアップロード)、スキルシステム(GitHubからのサードパーティスキルインストールや自己進化型スキルの作成)。興味深い点として、Valmisはおそらく初めて本格的なチェスをプレイできるAIエージェントで、軽量チェスエンジンによる厳密な計算に基づいて手を生成します。
ValmisはDocker Composeで簡単にデプロイでき、フロントエンドは3000番、バックエンドは4000番ポートで動作し、pgvectorデータベースとDockerソケットプロキシが含まれます。ライセンスはApache 2.0です。