前沿团队如何重塑AI原生开发
前沿团队不仅利用AI加速编码,更从根本上重新设计软件构建方式,实现了4.5倍乃至超过10倍的生产力提升。本文通过亚马逊Bedrock、Prime Video等团队的案例,揭示了成为前沿团队的五个关键实践,并指出工作流程的变革比工具本身更重要。
前沿团队不仅仅是将AI用于更快地编写代码。他们正在重新设计软件的构建方式。结果是4.5倍的生产力提升,某些情况下甚至超过10倍。
六名工程师。七十六天。一个原本计划由30名开发人员耗时12到18个月的项目,在一个季度内交付。这并非假设。这是亚马逊Bedrock团队在停止将AI视为编码捷径、转而将其作为工作基础后所发生的事。该团队在五个月内投入生产的代码量超过了前十年。
像这样的团队与其他团队之间的差距正在迅速拉大。AI编码代理从根本上改变了软件编写的速率,但并未改变其交付给客户的速率。提交量激增,CI/CD管道比以往更加繁忙。然而,投入生产的功能并未保持同样的速度。瓶颈不在于代理生成输出的能力,而在于代理获取做出正确决策所需知识的渠道,以及团队围绕这一现实重组工作的意愿。
我们将这些已经找到解决方案的团队称为“前沿团队”。他们并不局限于精英实验室,而是遍布各行各业和公司规模。他们有一个共同的原则:将AI采用视为一项工程投资,而不是工具部署。任何工程团队都可以成为前沿团队。
亚马逊实现AI原生开发的三条路径
AI原生软件开发将AI视为软件构建的基础,由人类专家指导能力不断增强的代理。团队如何指导这些代理决定了结果。在亚马逊,AI在开发中的主要驱动力是减少开发人员花在文档、协调和运维等非编码任务上的时间,消除技术债务,并最小化数千个小型“两个披萨”团队之间的编码不一致性。我们已在数百个工程团队中进行了实验,并确定了至少三条路径:由专家挑战难题的探路者计划、执行明确计划的结构化冲刺,以及在现有方法与AI适应工作流程之间将团队一分为二的原位实验。这些路径结构不同,但都指向同一个洞察。
探路者计划是一项对照实验。六名高级工程师接到单一任务:重建亚马逊Bedrock推理引擎,该项目最初估计需要30名开发人员工作12到18个月。团队并未增加人员,而是在最初几周围绕AI重新设计工作流程,从离散任务转向目标导向的结果,并行运行多个代理,并建立系统让AI在非工作时间独立工作。该项目在76天内交付。以标准化提交速度衡量,单个开发人员的生产力提高了约20倍。提交次数从每周2次增加到40次。该团队在五个月内投入生产的高质量代码超过了前十年的项目总和。
结构化冲刺采取了不同的方法。Prime Video财务系统团队进行了一次为期10天的实验,灵感来自探路者模式。六名工程师,一个房间,零上下文切换,无待命职责,无其他项目,有限的会议。一名高级工程师提前三周将复杂性分解为范围明确的任务,并附有详细需求。团队对复杂功能工作采用规范驱动开发,对需求明确的任务直接采用代理辅助开发。10天内,他们产生了556次提交(基准为96次),并将90周的项目估计缩短至24周。这相当于近6倍的吞吐量和4倍的加速。他们将AI带来的收益归因于三个因素的倍增:低判断力工作的加速(1.5倍)、高判断力工作的专注(1.5倍)以及即时获取代理捕获的领域专业知识(1.5倍)。移除任何一个因素,收益就会消失。该团队现在正寻求在日常运营中优化这三个因素。
在原位实验中,在所研究的50多个团队中,实施新工具和新实践的25个团队优于那些仅仅在现有工作流程中添加AI的团队。亚马逊商店以典型开发团队为对象,针对其常规积压工作进行了结构化试点,使用了Kiro和专用AI工具,没有特殊条件,也没有挑选工程师。中位生产力提升为4.5倍,部分团队在标准化部署速度上实现了超过10倍的改进。Perfect Order Experience现在可以在一个下午内交付功能,而不是两周。WW Grocery将设计文档创建时间从五天缩短至几个小时。
不同的路径,同样的教训:工作流程至关重要,而不仅仅是工具。
成为前沿团队的五个步骤
在所有三条路径中,表现最好的团队共享五个实践,且具有共同逻辑:减少代理获取上下文的障碍,增加其独立完成工作的表面积。
前沿团队与以往习惯的分歧在于此。传统方法优化的是个体代码生成的速度。前沿团队则优化不同的事物:正确、可投产的软件交付给客户的速度。这一区别驱动着以下每一个实践。
投资于代理上下文。最先进的团队大力投入,通过代理引导文件和关于团队惯例、编码标准、测试和代码库导航的指南,使项目和知识更易于代理消费。Bedrock基础设施团队将所有代码和文档放入单一代码库,并保留AI生成的在线注释,将其视为持久记忆。跳过此步骤的团队会疑惑为什么代理不断重复同样的错误。
放慢速度以加速。上述实践需要时间,要求团队有耐心。每个高绩效团队都报告说,随着他们学习模型,事情最初会放慢。他们将跨职能专业知识编码到可重用的引导文档中,重组仓库以便LLM能够推理,并为AI消费添加注释和重构代码分割。那些挺过学习曲线并首先定义预期结果的团队经历了复合加速。那些期望立竿见影而不改变工作流程的团队则感到失望。预计前两周会感觉较慢。之后几周会感觉快得多。在第二周放弃的团队永远看不到复合效应。
喂养代理而非监控。前沿团队维护一个稳定的、范围明确的任务积压,具有清晰的结果,并行运行多个代理,并异步审查输出。构建者报告说,在短时间内完成主要功能,即使他们没有主动等待代理完成任务,工作也在推进。一位首席工程师仅用“几个小时的连续时间”就完成了一个完整的更改,因为代理在工程师处理代码审查、运维支持和会议时工作。
在编写代码前明确意图。无论是通过结构化规范、详细的需求文档,还是范围明确的任务分解,前沿团队确保代理在开始生成代码之前对“完成”的样子有清晰的上下文。一些采用此方法的团队报告说,他们只手写了1-2%的代码,同时每人每周的提交量比以前显著增加。
“左移测试”。前沿团队构建工具,使代理能够在代码进入管道之前本地运行所有集成测试并自我纠正。Prime Video团队投资于自动化防护栏、组件测试、性能测试和格式化工具,及早发现问题。代码审查的重点转向接口定义和架构决策,而不是代码风格和命名约定。
技术领导者今天可以做什么
并非每个团队都能取得这些成果。跳过上下文构建阶段、将AI视为替代品、或期望不重组工作就能立竿见影的团队,表现始终不佳。整个行业的开发人员都采用了AI编码工具,但并非所有人都看到了生产收益。他们使用的工具没错,但工作流程不对。
关键要点:
改变工作方式,让AI发挥最佳效果。
三个因素倍增带来成果:AI处理低判断力工作、不间断专注于高判断力工作、即时获取领域专业知识。
先试点,再推广。
实际的起点不是广泛部署,而是深思熟虑的试点。从一个小团队开始,愿意花最初几周构建代理上下文(引导文件、规范模板、单一代码库),然后再编写生产代码。给团队重组工作流程的授权。衡量提交速度、部署频率和解决时间,以及开发者满意度分数。然后利用所学为组织其他部分制定手册。
实现4.5倍到10倍以上生产力提升的团队不仅仅是采用了更好的技术。他们学会了以不同的方式与之协作。这一决定今天对每个工程组织都可用。当然,代码提交速度只是故事的一部分。我们希望在软件开发生命周期的所有方面提供帮助,无论是简化发布管理、运维和安全操作,还是处理EOL升级和软件工程中无数无差异的任务。请关注下一篇博客,我将介绍我们如何应对这些挑战。
了解更多关于前沿团队的信息 >
收听AWS纽约峰会,了解更多关于AI原生开发的内容。