2025-04-15 23:53 UTC+9サイト内リライト2 分で読了更新: 2026-06-27 09:25 UTC+9

AIは正常な技術である

新しい論文は、AIを超知能的な存在ではなく、正常な技術と見なすべきだと主張する。緩やかな採用、漸進的な経済的影響、そして人間の制御の重要性を強調し、ユートピア的・ディストピア的な物語とは対照的である。

ソースAI Snake Oil著者: Arvind Narayanan

この15,000語以上の論文は、人工知能を「正常な技術」として捉えるビジョンを提示する。著者らは、AIは独立した超知能的存在ではなく、人間が制御可能なツールであると主張する。この見解は、現在のAIの描写、予測可能な将来の予測、そして規範的な提言の三つを兼ね備える。

まず、AIの進歩の速度を分析する。著者らはAI手法、応用、採用の三層を区別し、変革的な経済・社会的影響が現れるには数十年かかると論じる。医療や司法などの高リスク領域では、安全性の理由から普及が極めて遅い。例えばEpicの敗血症予測ツールは、病院での実運用で内部テストよりはるかに悪い成績を示した。これは、医師が抗生物質を処方したかどうかという未来の特徴をモデルが学習していたためである。複雑なモデルではこの種のエラーを発見するのは難しい。生成AIでも明らかな失敗が見過ごされており、Bingチャットボット「シドニー」は長い会話で制御不能になり、Gemini画像生成器は歴史上の人物でテストされていなかった。幸い、これらは重大な応用ではなかった。

安全重要でない領域でも、個人、組織、制度の適応速度が採用を制限する。2024年8月に米国成人の40%が生成AIを利用したが、これは労働時間の0.5%～3.5%に過ぎず、生産性向上はわずかだった。PCと比較すると、生成AIの利用強度は低い可能性がある。電力のような汎用技術の生産性効果が現れるには、エジソンの発電所から40年近くを要した。工場のレイアウト変更が必要だったからだ。同様に、AIの普及には数十年かかる。

論文はベンチマークの実用性への誤解も批判する。GPT-4は司法試験で上位10%に入ったが、法律業務の能力を予測しない。試験は記憶を重視するが、現実の法律業務には判断力が必要である。ベンチマークは測定しやすいが、実際の有用性から乖離しており、AIの経済的影響を過大評価させる。著者らは、より現実的な「アップリフト研究」による評価を勧める。

第二部では、高度なAIを備えた世界を描く。著者らは「超知能」概念を否定し、知能は一次元的ではなく、人間の真の強みは道具を使う能力にあると論じる。AI制御の問題は超知能シナリオほど困難ではない。監査、モニタリング、システム安全工学（フェイルセーフ、サーキットブレーカーなど）、サイバーセキュリティ、形式検証など多くの制御手法が存在する。技術的AI安全研究は豊富なアイデアを生み出しているが、「人間の価値への整合」という非現実的な目標によって過小評価されがちである。

著者らは、AIは人間を補完する形で機能し、人間に取って代わるわけではないと予測する。人間の仕事はますますAI制御に関わるものになる。予測や説得といった領域では、AIは訓練された人間のチームを超えることはないだろう。経済的影響は緩やかであり、自動化が進むにつれて人間の労働は新たな価値ある仕事へとシフトする。

最終的に、論文は不確実性の低減を最優先の政策目標とし、破滅的リスクへの対応としてレジリエンスを提唱する。超知能を前提とした急進的な介入は、AIが正常な技術である場合、不平等を悪化させる恐れがある。