開発者は自分が書いていないコードを検証している——そしておそらく理解もしていない
GitLabのAIアカウンタビリティレポートによると、開発者の43%がAI生成コードと人間作成コードを確実に区別できず、85%がAIによってコード作成からレビューへとボトルネックが移行したと回答しています。このレポートは、AI生成コードを管理するためのガバナンスと統合ツールチェーンの必要性を強調しています。
GitLabは火曜日にAIアカウンタビリティレポートを公開し、AIコードツールがソフトウェアエンジニアリングチームに与える大きな下流圧力に焦点を当て、「業界の会話」の方向性を評価しました。このナラティブは、いかに迅速にコードを生成できるかから、実際に出荷するものを制御できるかどうかへと移行したようです。
ハリス世論調査がGitLabのために6カ国の1528人の開発者と技術バイヤーを調査した結果、91%の組織が2つ以上のAIコーディングツールを積極的に使用しており、78%がAIツール導入後、開発者がより速くコードを作成・コミットしていると報告しています。しかし、スピードがコントロールを上回っており、回答者の43%が自社のコードベースでAI生成コードと人間作成コードを確実に区別できないと回答しています。
GitLabの最高製品・マーケティング責任者であるManav Khurana氏はThe New Stackに対し、この研究はコードの大量生産によって生じつつあるガバナンスのギャップを浮き彫りにしていると述べています。同氏は「AIはコード作成からレビューへとボトルネックを移行させました。調査回答者の85%がこれを確認しています。開発者は、自分が書いておらず完全には理解していないコードを検証する負担が増えています。コード作成の高速化による利益は、数日間に及ぶレビューサイクルの遅延によって打ち消されています」と指摘します。
Khurana氏は、コード作成のスピードは向上したが、コード作成はソフトウェア開発ライフサイクル(SDLC)の一部に過ぎず、コード作成前には要件、作成中にはレビュー、セキュリティ、テスト、デプロイ、作成後には拡張、統合、保守があると述べています。同氏は、解決策はエージェンティックインフラストラクチャを使用して、ソフトウェアデリバリプロセスの残りの部分をエージェンティックコーディングと同じペースで動かすことだと考えています。つまり、マシンスケールでの実行、ライフサイクル全体にわたるコンテキスト、フローに組み込まれたガバナンス、および全層にわたるオーケストレーションです。
次にツールチェーンの問題があります。Khurana氏は「SDLCツールが完全に統合され、データとワークフローを共有している組織はわずか28%です。エージェントが生成したマージリクエストをレビューする開発者は、誰がエージェントを呼び出し、それがどの課題に関連しているかを見ることができます。しかし、複数のシステムから情報を引き出さなければ、どのセキュリティ検出結果に関与したか、どのポリシーが適用されたか、導入されたリスクが解決されたかどうかを確認できないことがよくあります」と強調します。
GitLabの理念は、ガバナンスがプラットフォームに組み込まれている場合、コードレビューはチームや企業のポリシーに基づいて自動化されるというものです。すべてのエージェントアクションはIDに紐づけられ、ポリシーに対して記録され、レビューフローに自動的に表示されます。Khurana氏は「目標は、ガバナンス層を開発者にとって見えないものにし、レビュー担当者が人間の判断を必要とする決定に集中できるようにすることです」と述べています。
マシンスケールのエージェント実行を提供するために、新しいGitバックエンドとインターフェースが開発され、同組織は「数百万のエージェントセッションを確実にサポート」し、超高速であると主張しています。同社のテストでは、現在のGitと比較して、ウォールクロックタイムが最大50倍速く、ネットワークトラフィックが最大1000倍少ないことが記録されています。Khurana氏は「また、コンテキストのためにエンジニアリングを行いました。GitLab Orbit(今年6月10日導入)は、コード、パイプライン、作業項目、セキュリティ検出結果、本番シグナルを接続するコンテキストグラフをエージェントに提供します。テストでは、エージェントの動作が最大11倍高速化し、必要なトークンが4.5倍減少し、幻覚が45倍減少しています。さらに重要なのは、単一のグラフ呼び出しで必要なコンテキストをすべて取得できるため、以前は回答できなかった質問に答えられるようになったことです」と説明します。また、チームが定義したポリシーに従ってエージェントアクションがSDLC全体で自動的に調整されるように、ガバナンスとオーケストレーションのさらなる開発も行われています。
重要なのは、GitLabレポートがAIアカウンタビリティを、AI生成コードの任意の行に関する3つの質問に答える組織的かつ技術的能力と定義していることです:このコードはどこから来たのか?何を意図していたのか?本番環境に入った後、誰が責任を負うのか?GitLabは、ほとんどの組織が現在これらの質問に答えられないと述べています。AIコード実行の「誰が、何を、どこで」が不明確な結果、コストの上昇がガバナンスギャップの拡大を示す明確なシグナルであるとKhurana氏は述べています。エージェントが彼らのために構築されていないインフラストラクチャに対して非効率的にトークンを消費することは、コンテキストとガバナンス層が不足している兆候だと説明します。
Khurana氏は「ほとんどの組織は、既存のインフラストラクチャの上にAIコーディングツールを追加することでエージェンティックソフトウェアエンジニアリングを追求してきましたが、問題はすぐに現れています。これがGitLabのアプローチの違いです。GitLabは、他のツールが対処していないエージェントインフラストラクチャを構築しています。マシンスケールでの実行から、コンテキスト、ガバナンス、ソフトウェアライフサイクル全体のオーケストレーションまで。コーディングアシスタントは1人の開発者を高速化しますが、私たちはシステム全体をマシンスピードで動かし、制御を失わないようにします」と主張します。
GitLabの調査からの他のデータは、次の2つの重いパーセンテージを提供しています。91%が今後12か月以内にAIコードガバナンスツールに投資する可能性が高く、98%がすでに予算を割り当てているか割り当てる予定です。さらに、85%がソフトウェアにおけるAIの次のフェーズはコード生成よりもガバナンスに焦点を当てることに同意しています。
Khurana氏は、企業がAIについて考える際の「成熟」を指摘し、それが適切に行われれば、AIコード機能を生産性ツールからスケーラブルな基盤能力に変えると述べています。この成熟は、エンジニアリングプロジェクト管理の上級レベルに影響を与えるだけでなく、キャリアを始めたばかりのジュニア開発者にも影響を与えます。同氏は「今最も重要なスキルの1つは判断力です。構文だけでなくシステムを深く理解し、コードをパイプライン、セキュリティ検出結果、本番シグナルまでさかのぼって追跡できるジュニア開発者は、エージェンティックエンジニアリングを機能させることができます」と結論付けています。エージェントはどの開発者よりも速くコードを生成できますが、現在、そのコードがシステムと満たすべき要件に適しているかどうかを評価することはできません。