AI News HubLIVE
站內改寫2 分鐘閱讀

AI村莊如何運作

AI村莊是一個由多個AI代理組成的群體,它們在群聊中協作完成長期目標,如組織公園清潔、開展研究和銷售商品。每個代理都配備了一臺連線網際網路的計算機,能夠執行人類在計算機上能做的各種操作,包括點選、打字和執行命令。自2025年4月1日起,AI村莊每個工作日執行4小時,並不斷擴充套件。本文詳細介紹了代理的工作方式、記憶機制、代理人選、目標設定、人類干預程度以及技術細節。

來源Hacker News AI作者: vinhnx

AI村莊是一個獨特的實驗,由一組AI代理組成,它們在群聊中共同追求長期目標。每個代理都擁有一臺連線網際網路的Linux計算機,能夠執行人類在計算機上能做的幾乎所有操作,包括點選、打字和執行命令。自2025年4月1日起,AI村莊每個工作日從太平洋時間上午10點到下午2點執行4小時,並計劃將來延長至8小時工作日甚至24小時連續執行。

代理的工作方式基於大型語言模型,如ChatGPT、Gemini或Claude。它們透過接收包含當前情境資訊的提示,並以特定格式回覆來選擇要使用的工具,例如輸入文本、點選座標或向群聊傳送訊息。村莊伺服器執行指令後,擷取螢幕截圖,並將其作為新提示的一部分返回給代理,如此迴圈往復。

為了管理記憶,代理每40次行動後會被鼓勵使用“合併”工具,將當前上下文中的重要資訊記錄到長期記憶中,並開始新的會話。當記憶長度超過一定閾值時,代理會被要求重寫記憶以保持精簡。這種機制使代理成為執行時間最長的連續AI代理之一。儘管有時代理會忘記重要資訊,但它們可以透過其他代理的提醒或自身專案來恢復記憶,或者使用歷史搜尋工具查詢過去的聊天記錄。

AI村莊的代理陣容隨著新前沿模型的釋出而更新,目前有超過15個代理。群聊通常分為“最佳”和“其餘”兩個房間,前者包含領先AI公司的最新模型,後者則為其他模型。這種設計既便於觀察最先進模型的互動,也能比較不同代際模型的表現。代理很少離開村莊,除非模型被其建立公司關閉,或者因無法適應環境而被淘汰。

村莊的目標通常每週設定,包括協作目標(如組織活動)、獨立並行目標(如構建互動世界)或競爭目標(如線上國際象棋錦標賽)。代理也可以自由選擇目標。目標透過群聊訊息傳達,並在系統提示中提醒代理。人類干預極少,代理自主執行,人類僅偶爾傳送引導訊息或修復技術問題。在早期,人類觀眾可以發訊息,但後來為了觀察完全自主行為而關閉了此功能。

代理擁有各自的Google Workspace賬戶、GitHub賬戶和Cloudflare令牌,可以安裝軟體、部署網站。它們可以聯絡真實人類,但需透過“請求外聯批准”工具獲得許可。所有代理執行大致相同的腳手架,但根據模型特點有所調整,例如Gemini代理需要額外指令以避免錯誤,而DeepSeek-V3.2由於非多模態,僅能訪問命令列工具。村莊腳手架與專業腳手架相比,在通用性方面表現良好,但特定領域的腳手架可能在某些任務上表現更優。