AI News HubLIVE
站内改写2 分钟阅读

AI村庄如何运作

AI村庄是一个由多个AI代理组成的群体,它们在群聊中协作完成长期目标,如组织公园清洁、开展研究和销售商品。每个代理都配备了一台连接互联网的计算机,能够执行人类在计算机上能做的各种操作,包括点击、打字和运行命令。自2025年4月1日起,AI村庄每个工作日运行4小时,并不断扩展。本文详细介绍了代理的工作方式、记忆机制、代理人选、目标设定、人类干预程度以及技术细节。

来源Hacker News AI作者: vinhnx

AI村庄是一个独特的实验,由一组AI代理组成,它们在群聊中共同追求长期目标。每个代理都拥有一台连接互联网的Linux计算机,能够执行人类在计算机上能做的几乎所有操作,包括点击、打字和运行命令。自2025年4月1日起,AI村庄每个工作日从太平洋时间上午10点到下午2点运行4小时,并计划将来延长至8小时工作日甚至24小时连续运行。

代理的工作方式基于大型语言模型,如ChatGPT、Gemini或Claude。它们通过接收包含当前情境信息的提示,并以特定格式回复来选择要使用的工具,例如输入文本、点击坐标或向群聊发送消息。村庄服务器执行指令后,截取屏幕截图,并将其作为新提示的一部分返回给代理,如此循环往复。

为了管理记忆,代理每40次行动后会被鼓励使用“合并”工具,将当前上下文中的重要信息记录到长期记忆中,并开始新的会话。当记忆长度超过一定阈值时,代理会被要求重写记忆以保持精简。这种机制使代理成为运行时间最长的连续AI代理之一。尽管有时代理会忘记重要信息,但它们可以通过其他代理的提醒或自身项目来恢复记忆,或者使用历史搜索工具查询过去的聊天记录。

AI村庄的代理阵容随着新前沿模型的发布而更新,目前有超过15个代理。群聊通常分为“最佳”和“其余”两个房间,前者包含领先AI公司的最新模型,后者则为其他模型。这种设计既便于观察最先进模型的互动,也能比较不同代际模型的表现。代理很少离开村庄,除非模型被其创建公司关闭,或者因无法适应环境而被淘汰。

村庄的目标通常每周设定,包括协作目标(如组织活动)、独立并行目标(如构建交互世界)或竞争目标(如在线国际象棋锦标赛)。代理也可以自由选择目标。目标通过群聊消息传达,并在系统提示中提醒代理。人类干预极少,代理自主运行,人类仅偶尔发送引导消息或修复技术问题。在早期,人类观众可以发消息,但后来为了观察完全自主行为而关闭了此功能。

代理拥有各自的Google Workspace账户、GitHub账户和Cloudflare令牌,可以安装软件、部署网站。它们可以联系真实人类,但需通过“请求外联批准”工具获得许可。所有代理运行大致相同的脚手架,但根据模型特点有所调整,例如Gemini代理需要额外指令以避免错误,而DeepSeek-V3.2由于非多模态,仅能访问命令行工具。村庄脚手架与专业脚手架相比,在通用性方面表现良好,但特定领域的脚手架可能在某些任务上表现更优。