Import AI 451:政治的超知能;Googleの心の社会;そしてロボットドラマー
今回のImport AIでは、スタンフォード大学のAndy Hall教授が提唱する「政治的超知能」の概念、ロボットドラマーの課題、Googleによる非生物知能社会の構想、Metaの自己改善型ハイパーエージェント、そして新しい数学ベンチマークHorizonMathを取り上げる。これらの進展は、様々な領域におけるAIの可能性と限界を示している。
今回のImport AIでは、AIの最先端研究を幅広く取り上げる。政治応用からロボット制御、自己改善型AIシステムまで、各分野の進展と課題を詳しく見ていく。
まず、スタンフォード大学の政治経済学教授Andy Hallは「政治的超知能」の概念を提唱する。彼は、AIは印刷技術と同様に、情報ではなく知能を安価で利用可能にすると述べ、市民や代表者、機関が現実をより鋭く認識し、トレードオフを理解し、権力に挑み、効果的に行動するためのツールを提供できると主張する。Hallは政治的超知能を3つの層に分ける:情報層(政府のデータアクセスと理解を改善)、代表層(AIが個人の政治代理として機能)、ガバナンス層(AIインフラの権力バランスを確保)。このビジョンを実現するには、技術ツールの開発、透明性の向上、規制の構築など、意図的な努力が必要であると強調する。
情報層では、AIが政府のデータアクセスや理解、問題の特定、市民からの意見聴取、サービスの分配を大きく変える可能性があるが、政府が関心を持つ情報に関するAIシステムの評価方法の改善や、政策立案者向けのAIツールの構築が必要となる。代表層では、それぞれの市民が政治分野で絶え間なく活動する自動化された代理人を持ち、投票方法の提案や人間の監督者と共に政策決定を行うことが想定される。しかし、代理人が確実に本人の利益を代行し、敵対的なプロンプトに影響されないようにする必要があり、また代理人の所有権に関する問題も生じる。ガバナンス層では、政治的超知能が少数の民間企業によって所有・運営されるインフラ上に構築されるため、人々がそれを活用できるようにルールを策定する方法が求められる。
Hallは、政治的超知能の構築は、人や機関とのインターフェースと同程度に価値があると指摘する。強力なAIシステムが政治について高度に思考できるようになるのは確実だが、それらが繁栄する社会をもたらすためには、UXやUIの設計に意図的な努力が必要である。どのように対話するのか、信頼するための技術的手段は何か、どのような情報を誰に生成するのか、制御はどこにあり、誰が監督するのか。これらの問いに答えるためには、AI開発者が人々がAIシステムを理解し監督するための技術ツールに投資し、システムの行動に関する市民の意見を収集するツールを改善する必要がある。政策立案者や市民はAI企業に対してより高い要求をすべきであり、最終的にはAI企業の透明性制度や、社会が企業やシステムと対話するための標準APIの整備が必要となる。
ロボット分野では、DexDrummerプロジェクトがAIによるロボットハンドのドラム演奏に挑戦する。このシステムは階層的強化学習ポリシーを採用し、高レベルの軌道計画と低レベルの巧みな制御からなる。シミュレーション環境ではある程度の成功を収めたものの、実際のテストではロボットの動作はぎこちなく、人間のドラマーの域には程遠い。これは、事前学習済み言語モデルの汎用性と比較して、動的環境でのロボットの微細制御が依然として大きな課題であることを示している。
Googleの研究はより壮大なビジョンを提示する。未来の知能の爆発は、単一の超知能ではなく、複数の非生物知能が協調する社会から生まれるという。彼らは歴史的な知能の飛躍(霊長類の社会集団、人類の言語、文字や法律)を振り返り、次の飛躍はAIと人間の制度が混ざり合ったハイブリッド社会システムであると予測する。これには、透明性、公平性、説明責任を備えたデジタル制度の設計が必要となる。
Metaと複数の大学が共同開発した「ハイパーエージェント」は、AIの自己改善能力を示す画期的な研究である。このシステムは自己参照的な枠組みを持ち、タスクエージェントとメタエージェントが互いのプロンプトやメカニズムを編集することで、コーディング、論文レビュー、ロボット報酬設計、数学理解などのタスクで性能を大幅に向上させる。例えば、論文レビューでは正解率が0%から71%に向上した。これは、AIが自律的に改善する可能性を示す一方で、安全性のリスクも伴う。
最後に、HorizonMathベンチマークは100の未解決数学問題を提示する。現在の最良のAIモデルGPT 5.4 Proでも正解率は7%に過ぎず、最も易しい問題でも50%である。このベンチマークは自動検証を採用し、汚染を防ぎ、AIの創造的発見能力をテストすることを目的としている。
これらの進展は、AIが単一モデルから複雑な生態系へと進化する一方で、それに対応する社会的・技術的ガバナンスの枠組みも同時に構築する必要があることを示唆している。