AI News HubLIVE
站内改写1 分钟阅读

跟踪AI代理在代码开发中的谱系和状态的逻辑方法

本文探讨了在代理式软件开发中,如何系统性地跟踪AI代理的决策历史、配置和生成代码的谱系。作者提出建立“代理仓库”以实现可观测性和规模化,并讨论了Git在存储代理数据方面的局限性。

来源Hacker News AI作者: davenportjw

在代理式软件开发中,跟踪AI代理的谱系和状态对于理解和改进代理行为至关重要。传统的Git提交历史只记录了文件变更,但缺乏代理的决策过程信息。作者Jason Davenport认为,我们需要一种系统来管理代理的知识,包括其做出的决策、如何做出这些决策以及代理的组成。

对于编码代理,我们应至少跟踪每个提交的Git提交SHA、代理的版本或标识符,以及代理会话的日志。然而,Git对有效载荷大小有限制,日志可能快速增长。一种解决方案是强制在提交中添加代理元数据,以便后续查找代理组件。此外,还需要考虑代理构建系统的可观测性,代码只是系统的当前“计划”,我们还需要“实际运行”版本,以便代理更好地理解其行为对最终系统的影响。

作者提出了一个从代理到代码再到部署的谱系系统,类似于数据管理中的行级谱系。通过留下足够多的标识符,如容器元数据中的提交SHA或PR中的代理SHA,我们可以将系统的各个阶段联系起来。对于大规模代理开发,这需要专门的系统记录,即“代理仓库”。代理仓库是一个数据仓库,用于管理代理及其创建的工件,可以从技能、MCPs、Git钩子、云观测套件等源收集元数据和事务数据。通过将数据集中,我们可以应用转换来构建针对特定提交SHA或代理的谱系,从而理解代理行为的下游影响,并据此调整代理技能或微调模型。

虽然对于原型阶段,将代理信息打包到代码仓库中很简单,但随规模扩大,这种方法会遇到问题。不同代理可能需要共享代码库的共通知时,同时保留特定于自身的信息。因此,需要设计一个如文中逻辑架构的系统来规划。作者已开始使用会话日志技能实现本地化系统,并建议学习数据工程基础,因为管理代理状态正成为规模化的最大瓶颈之一。