配置智能体AI编码工具:一项探索性研究
本研究系统分析了Claude Code、GitHub Copilot、Cursor、Gemini和Codex等五种智能体AI编码工具的配置机制,通过对2853个GitHub仓库的实证研究,发现上下文文件(尤其是AGENTS$.md)是最普遍的配置方式,而高级机制如技能和子代理采用率较低,且不同工具间形成了差异化的配置实践。
近年来,智能体AI编码工具在软件开发自动化中扮演着越来越重要的角色。这些工具能够自主完成代码生成、调试、重构等任务,而开发者可以通过版本控制的仓库级工件(如Markdown和JSON文件)来配置它们的行为。然而,关于这些配置机制的实际使用情况及其演变趋势,此前一直缺乏系统性的研究。
一项发表于2026年AIware会议(第三届ACM/IEEE国际AI驱动软件大会)的新研究填补了这一空白。由Matthias Galster等六位学者组成的团队,对Claude Code、GitHub Copilot、Cursor、Gemini和Codex五种主流智能体AI编码工具进行了深入分析。他们首先从官方文档和社区实践中归纳出八种配置机制,范围从静态上下文提供(如Markdown文件中的提示指令)到动态可执行脚本,再到与外部服务的集成。随后,通过对2853个GitHub仓库的大规模实证调研,评估了这些机制的实际采用率和使用模式。
研究结果揭示了几个关键发现。首先,上下文文件(Context Files)是目前最主流的配置方式,并且往往成为仓库中唯一的配置机制。特别值得注意的是,一个名为AGENTS$.md的文件正在迅速崛起,成为跨工具互操作的通用标准,这意味着开发者可以编写一次配置文件,就能在不同工具间共享使用。其次,更高级的配置机制——如技能(Skills)和子代理(Subagents)——采用率仍然很低。技能主要依赖于静态文本指令,而不是可执行的脚本代码,这大大限制了其灵活性和自动化潜力。子代理的采用则更为罕见,仅有极少数仓库尝试使用。
第三,不同工具之间正在形成差异化的配置习惯。Claude Code的用户采用了最广泛的配置机制组合,涵盖了从简单的上下文文件到复杂的技能定义;而其他工具的用户则倾向于简化配置,往往只使用上下文文件一种方式。这些发现为开发者社区提供了一个宝贵的实证基准,帮助我们理解当前智能体工具的配置现状。研究者指出,AGENTS$.md文件可以作为一个自然的起点,未来需要更多的纵向研究和控制实验,来揭示配置策略如何随工具演进而变化,以及它们如何最终影响智能体的实际性能。
该论文共有10页,包含7张图表和3个表格,目前已在arXiv上发布,并经过四次修订(最新版本v4于2026年5月8日提交)。