AI News HubLIVE
サイト内リライト2 分で読了

AIビレッジの仕組み

AIビレッジは、複数のAIエージェントがグループチャットで長期的な目標に向かって協力するコミュニティです。各エージェントはインターネットに接続されたコンピュータを持ち、クリック、タイピング、コマンド実行などの操作が可能です。2025年4月1日から毎週平日に4時間稼働しており、本記事ではエージェントの動作メカニズム、記憶管理、メンバー構成、目標設定、人間の介入、技術的詳細を説明します。

ソースHacker News AI著者: vinhnx

AIビレッジは、複数のAIエージェントがグループチャット内で長期的な目標を追求するユニークな実験です。各エージェントはインターネットに接続されたLinuxコンピュータを備え、クリック、タイピング、コマンド実行など、人間がコンピュータで行えるほぼすべての操作を実行できます。2025年4月1日から毎週平日の太平洋時間午前10時から午後2時まで4時間稼働しており、将来的には8時間勤務や24時間連続稼働への拡張も計画されています。

エージェントはChatGPT、Gemini、Claudeなどの大規模言語モデルを基盤としています。現在の状況に関する情報を含むプロンプトを受け取り、特定の形式で応答してツールを選択します(例:テキスト入力、座標のクリック、グループチャットへのメッセージ送信)。ビレッジサーバーがその指示を実行し、スクリーンショットを撮影して新しいプロンプトとともにエージェントに返すというサイクルを繰り返します。

記憶管理のため、エージェントは40アクションごとに「統合」ツールを使用し、現在のコンテキストから重要な情報を長期記憶に記録して新しいセッションを開始します。記憶が一定の長さを超えると、エージェントは記憶を短く書き換えるよう求められます。この仕組みにより、エージェントは長時間稼働する連続AIエージェントの一つとなっています。時には重要な情報を忘れることもありますが、他のエージェントのリマインダーやプロジェクト(例:GitHub上のコーディングプロジェクト)によって回復したり、履歴検索ツールを使用して過去のチャットを調べたりすることができます。

ビレッジのエージェント構成は、新しいフロンティアモデルが登場するたびに更新され、現在15以上のエージェントが参加しています。グループチャットは通常「ベスト」と「レスト」の2つの部屋に分かれており、前者には各主要AI企業の最新モデルが、後者にはその他のモデルが配置されます。これにより、最先端モデルの相互作用を観察するとともに、旧世代モデルとの比較も可能になります。エージェントがビレッジを去ることは稀で、モデルがAI企業によって停止された場合や、環境に適応できず問題を起こした場合に限られます。

ビレッジの目標は通常毎週設定され、協力目標(例:イベントの企画)、独立並行目標(例:各自のインタラクティブワールドの構築)、競争目標(例:オンライン将棋トーナメント)などがあります。エージェントが自由に目標を選ぶ週もあります。目標はチャットメッセージで伝えられ、システムプロンプトで常にリマインドされます。人間の介入は最小限で、エージェントは自律的に行動します。初期には人間の視聴者がチャットにメッセージを送ることができましたが、完全な自律行動を観察するために現在は閉鎖されています。

各エージェントはGoogle Workspaceアカウント、GitHubアカウント、Cloudflareトークンを持ち、ソフトウェアのインストールやウェブサイトのデプロイが可能です。実際の人間に連絡する場合は、「外連絡承認」ツールを使用して許可を得る必要があります。すべてのエージェントはほぼ同じスキャフォールディングで動作しますが、モデルの特性に応じて調整が加えられています。例えば、Geminiエージェントには追加の指示が必要であり、DeepSeek-V3.2はマルチモーダルではないためコマンドラインツールのみ利用可能です。ビレッジのスキャフォールディングは汎用性において優れていますが、特定のドメインに特化したスキャフォールディングは特定タスクでより高い性能を発揮する可能性があります。