AI News HubLIVE
站内改写3 分钟阅读

AI转型是一个系统性问题:与DX的Justin Reock对话

文章指出,AI转型暴露了原本就存在的系统性问题。DX的研究显示,PR速度中位数提升仅7.5%,但顶尖团队达到70%,关键在于系统设计。工程师仅16%时间用于编码,AI只影响这16%。历史数据和现代研究均表明,系统(如模块化代码、快速CI、良好文档)决定生产力。领导者应关注价值流映射,而不是只优化个体。

来源Hacker News AI作者: mooreds

每个与我交谈的工程领导者都试图转型。他们希望团队成为AI原生团队,推出工具、跟踪采用率、盯着仪表盘。但更难的问题却是大多数领导者不愿明说的:我们到底想改变什么?成功是什么样子?我们应该如何思考这个问题?

DX的CTO Justin Reock每天都在与工程领导者讨论这些问题。DX汇聚了来自数百家公司数十万工程师的遥测和调查数据,包括一项从2024年11月到2025年2月追踪500家公司PR速度的纵向研究。我在最新一期《We Built What》节目中与他进行了对话。数据讲述了一个清晰的故事:AI正在暴露一个一直存在的系统性问题。当前获胜的公司正是那些看清这一点的公司。

数据告诉我们冷静下来,也告诉我们你一直在关注错误的东西。

DX研究的关键数字:PR速度中位数提升7.5%,平均提升13%,最佳表现者达到70%。

“谁会不投资于10%或15%的整体生产力提升呢?”Justin问道,“我认为我们需要开始允许自己接受10%或15%就是成功的。”

这是大多数领导者需要听到的重新校准,但数据告诉我们的最重要信息并非如此。

Atlassian的DevEx研究一致显示,工程师只有约16%的时间真正在写代码。Justin明确指出:“即使你有一个100%准确、无需重写、重构或审查、且瞬间完成的工具,你仍然只攻击了16%的问题。”

如果你将AI指向那16%而忽略其余84%,单位数的生产力提升正是你应该预期的结果。

系统性的教训比DevEx更古老

这并非新发现。1970年代的编码战争游戏发现了一个持续五十年的现象:不同组织中,顶级表现者的产出是底部表现者的11倍。而在同一组织内,个体之间的差距仅为20%左右。

早在此前几十年,W. Edwards Deming就更加清晰地阐述了这一点:一个组织90%到95%的生产力输出由系统决定,而非工人。

Google最近重新发现了同样的事情。当他们研究180个团队以找出最佳团队的关键因素时,团队组成并不重要,重要的是规范。同一个人在一个团队可能表现出色,在另一个团队则可能挣扎。表现的最佳预测因子是他们所处的系统、管理者和团队。

AI不会改变这一点,反而会放大它。将一个强大的AI工具放入为缓慢、顺序、大门重重的工作而设计的系统中,你只会在一个根本上受限的管道上获得边际改进。将同样的工具放入为流程设计的系统(模块化代码、新鲜文档、快速CI、心理安全以进行实验)中,你会得到70%的提升。

“系统”真正意味着什么

Justin列出了DX数据中表现最佳公司的共同点:

代码模块化和可访问的、最新的文档。过时的文档和混乱的代码不仅是工程师的痛点,它们还是推理输入。

快速的CI/CD管道。如果你的构建需要40分钟,你的代理的反馈循环也需要40分钟。

教育和吸收时间。DX的数据显示了一个反直觉的现象:轻度AI采用实际上降低了生产力。只有中度到重度采用才优于未采用。学习曲线是真实存在的,它需要时间、安全的失败项目和实验的心理安全。

代理编排和良好的推理管道设计。Justin的例子:用一个高温度模型生成质量标准,然后用一个低温度推理模型进行验证。

“对人类有利的东西也对代理有利。过去十年我们一直说组织需要为良好开发者体验做的这些事情,他们终于开始关心了,因为他们在代币上花了太多钱。”

知道系统是什么是一回事,知道系统中的摩擦实际存在于何处是另一回事。

映射价值流,而不是工程师

在修复系统之前,你必须先看到它。Justin的建议是做大多数团队跳过的缓慢而昂贵的工作:一个真正的价值流图。与领导者坐下来,从构思到收入或可证明的客户价值追踪价值。

大多数团队不这样做是因为周期时间更容易测量。PR批准到发布,任务打开到任务关闭。这些数字告诉你过程中间的摩擦。但真正的瓶颈通常存在于别处:上游的构思和优先级排序,或下游的发布、采用和货币化。

Justin引用了Eli Goldratt:节省瓶颈之外的一个小时毫无价值。

代理体验是新的开发者体验

系统论据延伸到下一个时代。混合人机代理团队已经变得正常。系统必须为两个群体工作。

Justin分享了DX已经在做的事情:他们开始将开发者体验调查发送给代理。代理完成任务后,它会收到与人类相同的调查。他们称之为代理体验指数。

“如果开发者体验是开发者生产力的先行指标,那么代理体验将成为代理生产力的先行指标。”

我们为人类构建的清洁文档、模块化代码和快速反馈循环正是决定我们代理表现如何的输入。系统要么为两者工作,要么都不工作。这意味着你已经在开发者体验上做的工作不是遗留投资,而是你的代理策略将运行的基础。

工程领导者的工作仍然关乎系统

Justin直接指出:开发者体验更多关乎系统而非人。这使责任回到领导层。你的工作不是从个体工程师那里榨取更多,而是设计一个工程师和代理都能将努力转化为成果的系统。

“我们往往过于关注个体,而不够关注系统。我认为我们应该纠正这一点。如果我们真正拓宽视野,我们可以找到更具创造性的应用,真正创造我们想从这些投资中看到的流程和回报。”

追踪你的价值流。找到你真正的瓶颈。修复文档、构建管道、模块化、学习文化。构建一个人类和代理都能蓬勃发展的系统,因为相同的东西使两者都高效。

仅靠代码生成不会让你成为AI原生。系统会。

收听《We Built What》与DX的CTO Justin Reock的完整节目,可在YouTube、Spotify或Apple Podcasts上找到。我们讨论了为什么7.5%的中位数是好消息,优化工程师一天中错误16%的陷阱,以及为什么Justin认为现在是成为软件工程师的最佳时机。

作者:Emma Webb,传播主管,领导Augment Code的传播工作,曾在CircleCI和Coursera任职。她主持《We Built What?》播客,关注工程组织如何在其工艺本身发生变化时描述他们的工作。