智能体‘牵引系统’解剖:模型如何变身自主工作引擎
了解代理牵引系统如何将AI模型转变为自主工作引擎。探索核心组件:文件系统、沙箱和记忆。
文章情报
要点
- 分解复杂目标:规划工具使代理能够分解任务、跟踪进度并根据学习情况调整。
- 并行委派工作:为独立的子任务生成子代理,每个代理具有隔离的上下文。
为什么重要
这条新闻值得关注,因为分解复杂目标:规划工具使代理能够分解任务、跟踪进度并根据学习情况调整。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
代理架构的核心公式是“代理 = 模型 + 牵引系统”。牵引系统是指除模型本身之外的每一行代码、配置和执行逻辑。原始模型并非代理,但当牵引系统赋予其状态、工具执行、反馈循环和可强制执行约束时,它便成为了代理。
牵引系统包含系统提示、工具与技能、MCP(模型上下文协议)及其描述、捆绑的基础设施(如文件系统、沙箱、浏览器)、编排逻辑(子代理生成、交接、模型路由)以及用于确定性执行的钩子/中间件(压缩、延续、代码检查)。这种划分迫使我们从模型智能的角度来设计系统。
**文件系统:持久存储与上下文管理** 文件系统是牵引系统最基础的原始要素。它赋予代理一个工作空间来读取数据、代码和文档,使工作可以增量添加和卸载,无需将所有内容存储在上下文中。代理可以存储中间输出,维护跨会话的状态。文件系统还是自然的协作表面,多个代理和人类可以通过共享文件进行协调。Git为文件系统添加了版本控制,使代理能够跟踪工作、回滚错误和分支实验。
**Bash与代码:通用工具** 当前主要的代理执行模式是ReAct循环:模型推理、通过工具调用采取行动、观察结果并重复。但牵引系统只能执行它拥有逻辑的工具。Bash+代码执行使模型能够自主设计自己的工具,而不受限于预先配置的固定工具集。这成为了自主问题解决的默认通用策略。
**沙箱:安全执行与验证** 沙箱为代理提供安全的操作环境。牵引系统连接沙箱来运行代码、检查文件、安装依赖并完成任务。这创建了安全、隔离的代码执行。沙箱还通过按需创建环境、分派到多个任务并在完成后拆除来实现规模扩展。好的环境配有默认的工具,如语言运行时、包管理器、Git、浏览器和测试运行器,使代理能够自我验证。
**记忆与搜索:持续学习** 模型除了权重和当前上下文外没有额外知识。牵引系统通过文件系统支持记忆文件标准(如AGENTS.md),在代理启动时注入上下文。代理编辑该文件后,牵引系统将更新的文件加载到上下文中,实现持续学习。对于知识截止日期后的信息,网络搜索和MCP工具(如Context7)帮助代理访问最新数据。
**对抗上下文腐烂** 上下文腐烂指随着上下文窗口填满,模型推理能力下降。牵引系统通过压缩智能地卸载和总结现有上下文,使代理能继续工作。工具调用卸载将大工具输出的头尾保留,完整输出存储在文件系统中。技能通过渐进式披露解决上下文初始加载过多工具的问题。
**长时程自主执行** 长时程工作需要持久状态、规划、观察和验证。文件系统和Git跨会话跟踪工作。Ralph循环通过钩子拦截模型退出尝试,在干净的上下文中重新注入原始提示,迫使代理继续工作。规划和自我验证通过良好的提示和文件系统中的计划文件实现。钩子可运行预定义测试套件,失败时循环回模型。
**牵引系统的未来** 模型训练与牵引系统设计正日益耦合。现代代理产品(如Claude Code和Codex)在训练后阶段将模型与牵引系统循环结合,帮助模型改进牵引系统设计师认为应原生实现的动作。