なぜAIはソフトウェアエンジニアを置き換えていないのか、そして今後も置き換えない
本稿では、AIがソフトウェアエンジニアの大量解雇を引き起こしたというナラティブをデータとケーススタディで反論する。AIによる解雇とされるものは財務上の理由による「AIウォッシング」であることが多く、実際の雇用データは、AIが「実行」層を圧縮しても「意思決定」と「提供」層は人間に依存することを示している。「決定-実行-提供サンドイッチ」モデルを提示し、これらのボトルネックはAIの能力向上だけでは解消されないと論じる。
AIが雇用を奪うという不安と不確実性は大きい。曖昧な警告や大げさな予測を超えて、この問題にデータを持ち込むにはどうすればよいか?良い方法の一つは、AIの能力が最も進み、導入が異常に速い職業、すなわちソフトウェアエンジニアリングに注目することだ。
本稿では、AIの能力がある閾値に達すると大量解雇が起こるというナラティブを否定する十分な証拠があると主張する。規制上の障壁がほとんどないセクターでさえこれが真実であれば、他のほとんどの職業はさらに緩衝されると考えられる。
その理由もよく理解している。多くの知識労働(ソフトウェア開発を含む)は、「決定-実行-提供サンドイッチ」と考えることができる。AIは「実行」層(サンドイッチの中央)を圧縮するが、他の二層は能力向上だけでは克服できない形で自動化に抵抗する。
ソフトウェアエンジニアリングの需要の将来軌道については、慎重な楽観論で結論付ける。本稿はシリーズの第一弾であり、次回はたとえ全体の需要が健全でも、個々のソフトウェアエンジニアのキャリアが不安定になりうる理由を考察する。このシリーズは、経済学とソフトウェアエンジニアリングの既発表文献、AIエージェントの評価と観察、そして多くのソフトウェアエンジニアのAIが彼らの職業に与える影響に関する現在と将来の考察に基づいている。
ソフトウェアにおけるAI主導の大量解雇の話は、典型的な「AIウォッシング」であると思われる。
三つのニュースと現実の対比を考えてみよう。
2月、フィンテック企業Block(Cash App、Square、Afterpayなどの開発元)は、創業者Jack DorseyがAIが「新しい働き方を可能にしている」と述べ、特に2025年末のモデル能力向上を挙げたことから、4000人の従業員解雇を発表した。しかし、その後の報道は全く異なる実態を明らかにした。パンデミック中に従業員数が3倍以上に増加した後、同社は大きな財務圧力に直面していた。Cash AppチームのデータサイエンティストNaoko Takedaは、Blockが「AIを全員に押し付けた」が、「生産性の向上は非常に限定的だった」と投稿した。彼女は75%の残留昇給を拒否して退職した。他の従業員へのインタビューでは、BlockにおけるAIの能力や、Dorseyが問題を理解しているかどうかについて大きく異なる認識が示された。
Aaron Levieが指摘したように、CEOはAIの有用性について幻覚を見やすい。なぜなら、彼らはプロトタイプを素早く作れるが、それを完成品にするのに必要な90%の作業が見えないからだ。DorseyのAIに関する公的発言はまさにこのパターンに当てはまる。
4月、Snapは約1000人を解雇し、CEOのEvan Spiegelは解雇メモで主な理由としてAIを挙げた。彼はまた、AIが新規コードの65%を生成したと述べた。実際には、解雇はアクティビスト投資家によるコスト削減要求に続くものだった(Snapは2017年のIPO以来毎年純損失を計上しており、2026年の株価は30%以上下落していた)。重要なことに、解雇の性質(拡張現実部門の様々な役割に及ぶ150の職など)は、AIが原因であれば予想される解雇(プログラミングなど「AIにさらされた」職種が全体的に減少し、特定の部門に集中しない)とは相関していない。
5月、Intuitは3000人の削減を発表し、同時にAnthropicおよびOpenAIとの取引を発表した。メディアは両者を結び付け、AI主導の再編成と報じた。今回、CEOは実際にこの安易なナラティブに反論し、「それはすべてAIとは無関係」であり、削減は「調整の多い役割」と過剰な管理層を対象としていると述べた。
これらの例は恣意的に選んだわけではない。私たちが検証したAI主導のソフトウェアエンジニアリング解雇に関するすべての話で、同じナラティブの矛盾が現れた。解雇における「AIウォッシング」は経済全体に及ぶ現象であり、多くの調査がそれを証明している。
米国の採用担当者の59%は、採用凍結や解雇を説明する際にAIを強調することを認めており、それは財務上の制約を挙げるよりも利害関係者に受けが良いからである。
ForresterのプリンシパルアナリストJ.P. Gownderは、いわゆるAI主導の解雇を準備している企業について次のように述べている。「彼らに、それらの仕事を埋める成熟した検証済みのAIアプリケーションがあるかと尋ねると、10回のうち9回は『ない』という答えが返ってきて、まだ始めてもいない。」
HBRの1000人以上のグローバル経営幹部調査では、21%が「AIを見越して」大規模な人員削減を行い、さらに39%が低度または中度の人員削減を行っていた。対照的に、実際のAI導入に関連して大規模な人員削減を行ったのはわずか2%だった。この10倍のギャップは、経営幹部も他の人々と同様に、AIが雇用を奪うという誤解を招くナラティブに屈しやすいことを示唆している。
もう一つの興味深いデータは、WARN法から得られる。この法律は、100人以上の労働者に影響を与える工場閉鎖や大量解雇の一定の開示を義務付けている。2025年3月、ニューヨーク州は米国で初めてWARN法の届出にAI開示チェックボックスを追加した。丸一年で、160社以上がWARN通知を提出した。しかし、AIボックスにチェックを入れた企業は一社もなかった。ニューヨーク州労働局に確認したところ、5月末時点でチェックを入れたのはNespresso社のみであることが確認された。これらの届出が正確であれば、該当期間にニューヨーク州で解雇された約25,000人の労働者のうち、AIの影響を受けたのはわずか46人、つまり約0.2%に過ぎない。
AI主導の大量解雇ナラティブにとってさらに痛手なのは、解雇自体がそもそもAIの潜在的な生産性向上の正しいシグナルではないということだ。研究は明らかに、その効果は「離職の増加ではなく、採用の鈍化」を通じて作用する。既存の労働者を解雇すると、労働者がAIを効果的に活用するための暗黙知や組織資本が正確に失われる。さらに、退職金、士気の低下、再雇用リスクなどのコストがかかる。これらのコストを考えると、自然離職が数年で同じ結果を達成するため、解雇はほとんど不要である。
では、解雇を超えて全体的な雇用動向を見ると、データは何を語っているのか?連邦準備制度のエコノミストによる重要な論文が、米国の文脈での証拠をまとめている。雇用はまだ増加しているが、ChatGPT後はAIがない場合の反事実と比較して、年間約3パーセントポイント成長が鈍化していることがわかった。この研究の重要な限界は、自営業を捉えられないことである。そのため、成長鈍化の一部は起業によって吸収されている可能性がある。他の研究から、AIが起業を容易にすることの証拠はある。したがって、実際の状況は連邦準備制度の研究が示すよりもおそらく健全である。
最後に、ソフトウェアエンジニアリングにおける間接的なAI主導の雇用損失には、実際に存在するが、AIがソフトウェアエンジニアを置き換えるのとは異なる二つのタイプがあることを認める価値がある。第一に、AIは時に製品の需要を壊滅させる。Chegg(宿題支援)やStack Overflow(技術支援)のようなケースでは、両社とも人員削減を行った。AIはこれらの労働者が行っていた仕事を直接行うのではなく、その必要性をなくす。歴史的な類似は強い。1950年の米国国勢調査の270の職業のうち、自動化されたのはエレベーター運転手のたった一つだった。しかし、電信技士のような他の多くの職業は、新技術によって廃れた。
もう一つの信頼できるAI主導の解雇話は、AIを購入するのではなく販売する企業に関するものである。したがって、IBMやSAPのような企業がAIを理由に解雇を発表する場合、より正確な枠組みは「レガシー機能から最も成長している製品ラインに人員を再配置した」というものだ。これは収益機会を巡る通常の企業再編であり、技術が労働者を追い出しているわけではない。
なぜコーディングエージェントが労働力の置き換えにつながらないのか:「決定-実行-提供サンドイッチ」
多くのテクノロジーリーダー(上記のSnap CEOなど)は、解雇や将来の雇用喪失の予測と並行して、AIが書いたコードの割合を報告している。これは、AIがすべてのコードを書けばコーダーは不要になるという単純なメンタルモデルを助長する。幸い、このメンタルモデルは間違っている。このAI作成コードの指標は、労働力の置き換えに重要なものとはほぼ無関係である。理由は以下の通り。
第一に、コードを書くことは、かつてなくボトルネックではない。例えば、2019年の論文は既存の研究を要約し、「開発者がコーディングに費やす時間は驚くほど少なく、研究によって9%から61%まで様々である」と結論づけた。この発見は、マイクロソフトの6000人の開発者からのデータと一致した。コーディングエージェントが採用され始めると、2025年後半には、コードを書くことがボトルネックではないと指摘するブログ投稿が爆発的に増えた。開発者たちは、エージェントを使ってほとんどのコードを書いても、全体的な生産性への影響はほとんどないことに気づいたのだ。
コードを書くことがボトルネックでなければ、何がボトルネックなのか?タスク分解調査は、会議やデバッグなどを指し示している。これによりさらに疑問が生じる。開発者は会議で何をしているのか?なぜAIでできないのか?能力が向上すればデバッグは自動化されないのか?真のボトルネックを理解するには、定性的に掘り下げ、ソフトウェアエンジニア自身が自動化に抵抗するものについての理解を探る必要がある。
私たちがこの分析を行ったところ、三つの真のボトルネックが明らかになった:(1)何を構築するかを決定し、仕様化すること、(2)提供されるものを検証し、それに対する責任を負うこと、(3)これら両方を実行するために必要な深い人間の理解——コードベース、ビジネス、環境についての理解。
言い換えれば、ソフトウェアエンジニアの仕事は「決定-実行-提供サンドイッチ」(理解は前二者の前提条件)で構成されている。AIはサンドイッチの中央を圧縮したが、両端はほとんど変わっていない。ソフトウェア開発チームが意思決定を担当し、提供するものに責任を持つ限り、エンジニアはシステムの深い理解を構築するために時間を費やす必要がある。これらが三つのボトルネックである。
図:ソフトウェア開発は三つの層から成る:(1)決定——問題の枠組み、仕様、計画;(2)実行——設計と実装;(3)提供——テスト、検証、統合、保守など。これらは概念的な層であり、時間的なフェーズではない。プロジェクトの進行中にこれらを行き来することは一般的である。
AIの生産性効果に関する「サンドイッチ」モデルの証拠は、最近の論文「コードを書くこと vs. コードを提供すること」から得られる。GitHub上の10万人の開発者を対象に、研究者はAIエージェントが書かれたコード行数を8倍に増加させることを発見した。これはAIが「実行」層をほぼ完全に圧縮したことと一致する。しかし、リリース数はわずか30%しか増加せず、人間のボトルネック(「決定」層と「提供」層)がまだ残っていることを強く示唆している。
サンドイッチはさらに圧縮できるだろうか?私たちはそうは思わない。パイプラインの一端では、開発チームは何を構築するかを決定する必要がある。ジュニアソフトウェアエンジニアが学ぶ最も重要な教訓の一つは、要件仕様(この層の専門用語)に驚くほど時間がかかり、それを圧縮すると後により大きな苦痛を招くということである。この層は自動化が難しい。なぜなら、ユーザーニーズ、市場シグナル、組織の優先順位、場合によっては規制上の制約について考える必要があるからだ。
AIの能力が向上するにつれて、AIに委任できる意思決定の種類は時間とともに増える。しかし、これは「決定」層を薄くするわけではない。一度決定をAIに委任できるようになると、それはもはや競争優位の源泉ではなくなり、その価値は...(原文は打ち切り)