それでも私の仕事はできない:4年にわたるゴールポストの移動(2022–2026)
この記事は、2022年11月のChatGPTリリースから2026年にかけて、AIのコーディング能力に対する懐疑論者たちがゴールポストを絶えず動かしてきた歴史をたどります。AIがスネークゲームの作成、試験合格、実際の製品構築、本番コードの処理といったマイルストーンを達成するたびに、批判者たちは新たな基準を設けてきました。AIの進歩にもかかわらず、人々は常に「それでも私の仕事はできない」と言い続けています。記事の最後には将来の予測が含まれています。
2022年11月、ChatGPTは水曜日にローンチされ、週末までに100万人のユーザーを獲得しました。私のフィードは、コンパイルできないコードに対して謝罪するスクリーンショットで埋め尽くされました。関数をでっち上げ、API全体を幻覚させました。スネークゲーム—10代の頃に午後一発で書けるゲーム—を依頼したところ、最初の動きで自分自身を食べてしまいました。5日後、Stack Overflowは禁止しました。「ChatGPTから正しい回答を得られる平均率が低すぎるため、ChatGPTが作成した回答の投稿はサイトに実質的な害を及ぼす」という理由でした。当時の評決は明白でした。コンパイラに一度も会ったことのない、シニア開発者のように話すことを覚えた確率的オウムです。
しかし2023年3月、GPT-4が登場しました。たった1つのプロンプトで動くスネークが作れるようになりました。4ヶ月前には失敗していた同じゲームです。コメントセクションは即座に調整され、決して速度を緩めませんでした。「おもちゃのスクリプトや試験はエンジニアリングではない。本物のもの、例えば3Dゲームを構築したら連絡してこい。」
2024年3月、スタートアップのCognitionが「初のAIソフトウェアエンジニア」Devinを発表。デモ動画は1週間で広まりましたが、ベテラン開発者Carl Brownがフレームごとに分析したところ、印象的な部分はすべてキュレーションされたものでした。同月、NvidiaのCEOジェンスン・フアンはドバイで「プログラミング言語は人間の言語であり、世界中の誰もがプログラマーになった」と宣言しました。しかし、誰もプログラミングを辞めませんでした。ただ、誰もがこっそりCopilotをインストールしました。
2024年10月、Googleのサンダー・ピチャイCEOは、Googleの新コードの4分の1以上がAIによって生成され、エンジニアのレビューを経て採用されたと明かしました。コメントセクションは動じません。「コード行を生成することは仕事ではない。チケットを受け取って機能を出荷したら連絡してこい。」
2025年2月、Andrej Karpathyが「バイブコーディング」の概念を提唱。3週間後、Pieter Levelsがゲーム開発経験ゼロで、マルチプレイヤー3Dフライトシミュレーターを3時間でプロンプトから作り上げました。17日間で年間100万ドルの収益を達成しました。しかし、漏洩したAPIキーや開放されたデータベースによるセキュリティ問題も生じました。「プロトタイプは結構。本番に触れて生き残ったら連絡してこい。」
2025年7月、METRの研究では、16人の経験豊富なオープンソース開発者にAIツールを使わせたところ、19%遅くなったことが判明。彼ら自身は20%速くなったと信じていました。同月、OpenAIとGoogle DeepMindは国際数学オリンピックで6問中5問を平易な言語で解き、人間の時間制限内に達成しました。両方の出来事が同時に真実であり、その事実を直視する人はほとんどいません。
2026年、AIエージェントは数時間無人で稼働し、プルリクエストを作成し、マージされます。今週、あなたも気づかずにレビューしたかもしれません。Stack Overflowの質問数は私がプログラミングを学んだ頃の水準に戻りました。質問が回答されたからではなく、誰もフォーラムに質問しなくなったからです。
現在のゴールポストはまだ保持されるかもしれません。しかし、上記のどのエントリーも約18ヶ月間保持されたことを指摘しておきます。次のゴールポストは?「私たちのレガシーコードベースを扱えるようになったら連絡してこい。」「責任を負えるようになったら。」「どうやって構築するかだけでなく、何を構築すべきかを知ったら。」
記事の最後では将来を予測しています。2027年に1つのプロンプトで完全なオープンワールドゲーム、2028年にAIが15年のレガシーモノリスをリファクタリング、2030年にAIがオンコール対応、2033年にAIがゼロから企業を立ち上げ10億ドル評価に。各段階で新たな基準が待っています。