AI News HubLIVE
站内改写3 分钟阅读

开发者正在验证他们未曾编写——甚至可能不理解——的代码

GitLab的AI问责制报告显示,43%的开发者无法可靠区分AI生成的代码与人类编写的代码,85%的人表示AI已将瓶颈从编写代码转移到审查代码。报告强调需要治理和集成工具链来管理AI生成的代码。

来源The New Stack AI作者: Adrian Bridgwater

GitLab于周二发布了其AI问责制报告,聚焦于AI编码工具给软件工程团队带来的巨大下游压力,旨在评估“行业对话”的走向。这一叙事似乎已从团队能多快生成代码,转向他们是否能真正控制所交付的内容。

哈里斯民意调查代表GitLab对六个国家的1528名开发者和技术买家进行了调查。结果显示,91%的组织正在积极使用两个或更多AI编码工具,78%的受访者表示采用AI工具后开发者编写和提交代码的速度更快。但速度正在超越控制——43%的受访者表示无法可靠地区分自己代码库中AI生成的代码和人类编写的代码。

GitLab首席产品与营销官Manav Khurana告诉The New Stack,该研究揭示了一个因代码产量激增而出现的治理缺口。他指出:“AI已将瓶颈从编写代码转移到审查代码——85%的受访者证实了这一点。开发者现在需要验证他们未曾编写且可能不完全理解的代码,负担加重。编写代码速度的提升被长达数天的审查周期所抵消。”

Khurana提醒,虽然编码速度提高了,但编写代码只是软件开发生命周期的一部分:编码前有需求,编码过程中有审查、安全、测试和部署,编码后有增强、集成和维护。他认为解决方案是使用代理基础设施,使软件交付的其余部分与代理编码保持相同速度。这意味着机器规模的执行、整个生命周期的上下文、内置于流程中的治理以及跨所有层的编排。

接下来是工具链问题。Khurana强调:“只有28%的组织表示其SDLC工具完全集成,共享数据和工作流。审查代理生成的合并请求的开发者可以看到谁调用了代理以及它关联了哪个问题。但他们通常无法看到——除非从多个系统中拉取——它涉及了哪些安全发现、受何种政策管辖以及引入的风险是否已解决。”

GitLab的理念是,当治理内置于平台时,代码审查基于团队和公司的政策自动进行。所有代理操作都与身份关联、记录在政策中,并在审查流程中自动呈现。Khurana建议:“目标是让治理层对开发者透明,从而使审查者能够专注于需要人类判断的决策。”

在提供机器规模代理执行方面,GitLab开发了新的Git后端和接口,声称将“可靠地支持数百万代理会话”且速度极快。在其测试中,与当前一代Git相比,观察到墙壁时钟时间最多快50倍,网络流量最多减少1000倍。Khurana澄清:“我们还为上下文进行了工程设计。GitLab Orbit(今年6月10日推出)为代理提供了一个上下文图,连接代码、流水线、工作项、安全发现和生产信号。在我们的测试中,代理工作速度提升11倍,所需令牌减少4.5倍,幻觉减少45倍。更重要的是,代理现在可以回答以前无法回答的问题,因为它们可以通过一次图形调用获取所需的所有上下文。”此外,还在推进额外的治理和编排开发,以确保代理操作根据团队定义的策略自动协调。

关键在于,GitLab报告将AI问责制定义为回答关于任何一行AI生成代码的三个问题的组织和技术能力:这些代码来自哪里?它原本要做什么?一旦投入生产,谁对其负责?GitLab表示,大多数组织目前无法回答这些问题。由于不清楚AI代码执行的“谁、什么、哪里”(推测还包括“为什么”和“何时”),Khurana表示成本上升通常是治理缺口扩大的明确信号。他解释,代理在并非为其构建的基础设施上低效消耗令牌,表明缺乏上下文和治理层。

Khurana坚持:“大多数组织通过将AI编码工具叠加在现有基础设施上来追求代理软件工程,问题迅速显现。这是GitLab方法的不同之处。GitLab正在构建其他工具未能解决的代理基础设施——从机器规模执行到上下文、治理和整个软件生命周期的编排。编码助手使单个开发者更快——而我们做的是使整个系统以机器速度移动而不失去控制。”

GitLab研究的其他数据提供了两个重要百分比:91%的组织可能在未来12个月内投资AI代码治理工具;98%已经分配或预计分配预算。此外,85%的人同意软件中AI的下一个阶段将更少关注代码生成,更多关注治理。

Khurana指出了企业在思考AI方面的“成熟化”,如果做得好,会将AI代码功能从生产力工具转变为可扩展的基础能力。这种成熟化对高层工程项目管理有影响,也对刚起步的初级开发者有影响。他总结:“现在最重要的技能之一是判断力。投资于深入理解系统(不仅仅是语法)并能将代码追溯回流水线、安全发现和生产信号的初级开发者,是使代理工程工作的人。”我们知道代理能比任何开发者更快地生成代码,但当前它们无法评估这些代码是否适合系统及其需要满足的需求。