2026-07-02 07:52 UTC+8站内改写2 分钟阅读更新: 2026-07-02 09:47 UTC+8

自动研究：自我改进代理背后的反馈循环

Introspection公司联合创始人Roland Gavrilescu在AI Engineer World's Fair上阐述了自动研究的概念，即构建“外循环”让代理通过反馈信号、评估和人类输入来维护和改进主系统。他介绍了代理“配方”、内外循环分工，以及人类在软件工厂中的核心地位。

来源Latent Space作者: Richard MacManus

在最近的AI Engineer World's Fair上，Introspection公司的联合创始人兼CEO Roland Gavrilescu详细介绍了自动研究（autoresearch）这一概念。自动研究指的是构建一个“外循环”，使代理能够通过反馈信号、评估和人类输入来维护和改进主系统。Gavrilescu此前在xAI从事代理基础设施和云代理工作，并与联合创始人Julian Bright共同创立了Introspection，旨在为部署这些自我改进系统提供基础设施。

Gavrilescu在演讲中提出了三个关键模式。首先，“循环即产品”——从模型到工具再到循环的转变，关键在于定义正确的反馈机制，使代理能够承担更多工作而不产生劣质输出。其次，循环生成的内容需要被跟踪，他引入了“代理配方”的概念。配方类似于数据配方，它描述了代理如何与不同模型协作、使用的评估方法、创建的人类判断标准以及失败后新评估的引入。配方捕捉了整个决策过程，包括失败和错误，使得系统可以在不依赖单一供应商的情况下迭代。第三，系统应同时追求更好和更便宜，逐步将前沿模型的能力蒸馏到定制化的自有系统中。

Gavrilescu将系统分为内循环和外循环。内循环是主系统与用户交互并执行工作，而自动研究更关注外循环，即研究和维护主系统的另一个系统。外循环的设计需要确保在合理的token消耗下解决正确的问题。他将开源框架Pi比作代理工具中的Linux，而Introspection则类似Red Hat，提供企业级的管理和扩展能力。

在生产环境中，可靠性和成本控制是关键。Introspection专注于提供管理基础设施，帮助企业在保持安全和控制成本的同时运行代理循环。人类在循环中扮演重要角色，尤其是在初期。代理可以通过“询问人类”工具学习人类偏好，随着时间推移积累知识，逐渐变得更加自主。Gavrilescu类比新员工入职：初期需要大量询问，随后独立决策。

当前，Introspection主要面向垂直SaaS公司的软件工程师。代理的工作环境基于Git，Git作为审计日志记录所有变更。未来计划支持产品经理等角色。他认为，设计循环本质上是设计软件工厂，但其自主程度需逐步提升。初期应将人类作为核心组件，从人类身上提取隐性知识和流程，而不是一开始就追求完全自动化。

对于希望尝试自动研究的工程师，Gavrilescu建议首先投资于信号——明确想让代理响应的内容，并过滤掉低价值反馈。其次要控制成本，避免意外的token消耗。最后，跟踪前沿研究，理解研究实验室如何使用数据配方，并将其应用到自己的产品中。最终目标是让产品组织变成微型研究实验室，代理则充当微型研究员。