「倫理的なAI」に反対する
本稿は、Anthropic を中心とする「倫理的なAI」運動を批判する。その運動は、AI開発は止められないが方向づけは可能という未証明の仮定に基づいている。実際には、倫理的AIは認識論的衛生を再生せず、AIを人間らしい方向に導くこともなく、非倫理的AIの御用反対派として機能している。Jack Clark の世界構築物語を分析することで、著者は矛盾を露呈する:AIを減速できないと主張しながら、その結果を制御できると主張する。
Esther Berry は本稿で、Anthropic に代表される「倫理的なAI」運動を痛烈に批判する。彼女によれば、倫理的AIは一見するとAIに盲目的に賛成もせず、単純に反対もせず、避けられない技術発展を有益な方向に導くための道筋を提供するように見える。しかし、その核心には「AIの進歩は止められないが、善い方向に舵取りできる」という証明されていない仮定がある。実際には、倫理的AIは認識論的衛生を再構築することも、AIを人間らしい目的に導くこともできず、非倫理的AIのための「御用反対派」として機能しているに過ぎない。
記事は、Anthropic の共同創業者 Jack Clark の発言を分解することで、倫理的AIがSF的な世界構築と深く結びついていることを示す。Clark はオックスフォードでの講演で、AI開発を「世界構築プロジェクト」と表現し、2026年から2028年にかけての具体的な予測を列挙した:AIによる生活の自律管理、キャリアの大規模変更、AI生成のカスタムSF小説の愛読、AIによる概念的な突破口など。彼は進歩が「ロックイン」されていると信じ、機械経済、ロボット化、宇宙データセンターなどの「混乱した奇跡」の到来を予言する。この物語は標準的な技術楽観主義の延長線上にあるが、倫理的AIはそこに重要な変形を加える:進歩は不可避だが、その善悪は完全に人間次第であり、特に Anthropic に支援された者たち次第だという。
著者はこの物語の内部矛盾を鋭く指摘する。AI開発を減速させることさえ不可能だと主張しながら、その結果を制御できると断言するのは論理的整合性を欠く。AI開発を減速させるのは確かに難しいが、スーパーインテリジェントなロボット軍団を制御するよりははるかに容易だろう。さらに、倫理的AIはAIの道徳的地位について二重基準を採用している:大規模言語モデルはプログラムによって道徳的に行動するよう仕向けられる「道徳的主体」だが、奴隷化や殺害を心配する必要のない「道徳的患者」ではないとする。Ted Chiang が指摘するように、この立場は都合が良すぎる。
最終的に、著者は倫理的AIの物語が一種の「世界構築」であり、Anthropic に莫大な未来への影響力を帰属させる一方で、現在の責任を回避するものだと結論づける。それは進歩を不可避とし、自らを唯一の救世主に仕立て上げる魅力的な物語だが、信頼性に欠ける。真の課題は、この「進歩不可避」という前提を受け入れるか、それとも疑問視するかにある。人間は技術発展における自らの主体性を再考すべき時なのだ。