なぜAIが人間に与える影響を測定しないのか?
AIシステムの能力が向上するにつれ、その性能を測定するために膨大なリソースが投入されているが、人間の認知、関係性、行動への影響については系統的な測定がほとんど行われていない。人道技術センターのイムラン・カーン氏は、AIが人間の基本的な能力を侵食する可能性を指摘し、長期的な研究、データ共有、規制の重要性を訴える。
人工知能の能力が向上するにつれ、その技術的性能を測定するために多くのリソースと労力が注がれています。研究者は技術評価指標を調べ、AIに推論テストを課し、スループットを追跡しています。しかし、しばしば見落とされる重要な指標があります。それは、AIが人間に何をしているかという問いです。
非営利団体「Center for Humane Technology」で心理社会的評価を担当するイムラン・カーン氏は、最近のエッセイで、認知、関係性、行動を再形成できるAIツールを展開しているにもかかわらず、その下流の影響を測定する体系的な取り組みがほとんど行われていないと指摘しています。AIの心理社会的影響をより詳しく調べる動きは、ソーシャルメディアとその害をめぐる議論に似ていますが、カー氏はAIがさらに広範囲かつ親密な影響を与える可能性があると考えています。
IEEE Spectrumのインタビューで、カーン氏はなぜAI評価が狭い範囲に焦点を当てているのか、有意義な人間の成果の測定とはどのようなものか、そしてAI業界がこれらの問いを問うインセンティブがあるのかについて語りました。カーン氏は、AI開発の現場にいると、モデルの能力の驚くべき進歩を示すグラフを目にする一方で、現実世界では10代の自殺やAI精神病などの危険な出来事が起きていると述べています。
彼は、私たちは日常生活との関連性が限られている抽象的な事柄を測定することに多大なエネルギーを費やしている一方で、人間の幸福に影響を与えるAIの測定ははるかに少ないと指摘します。これは、最も関心を持つべきことを最も測定していないという奇妙なパラドックスです。
カーン氏は、ソーシャルメディアと同様に、害が定着してから証拠が強まる可能性があると警告します。彼は、すでに10代の自殺やAI精神病などの高名な事例があり、これらは氷山の一角であると考えています。しかし、OpenAIがお世辞問題でモデルを調整したように、公の圧力が変化をもたらす可能性もあります。
特に注意が必要な領域として、カーン氏は感情的なサポートや伴侶としてのAI、子どもや青少年の使用、教育、危機対応を挙げています。孤独な人が本当に必要とするのは、実際に気にかけてくれる人間であり、AIはそれを提供できません。また、認知タスクや感情関与の摩擦をなくすことが発達中の脳に長期的な影響を与えるかは不明です。
AIの社会的影響を評価するためには、医薬品の承認後監視のような長期研究が必要です。カーン氏は、企業が保有するデータへのアクセスを研究者に開くこと、および責任制度の確立を提言しています。彼は、業界全体として安全な製品への信頼を得るためにデータ共有のインセンティブがあるとし、複数の企業が協力すれば前進できると述べています。
5年後の成功像として、カーン氏はAIラボ、政府、規制当局、大学、スタートアップの専門家が協力し、人間とAIの良い関係とは何かを定義することを挙げています。彼は、技術の進歩に追いつくために、今から人間への影響を理解し始めることが不可欠だと警告しています。