Midjourneyのような生成AIはステレオタイプに満ちた画像を作り出す
生成AIが画像生成においてステレオタイプや偏見を強化する方法を探る。5,000枚以上のAI画像の分析により、高収入の職業では肌の色が薄く、男性優位であることが判明。また、Rest of Worldの調査では、国ごとの描写にも偏りがあることが明らかになった。
7月、BuzzFeedは人気のAI画像生成ツールMidjourneyを使用して作成された195枚のバービー人形画像のリストを公開しました。各人形は異なる国を表すことを意図しており、アフガニスタンバービー、アルバニアバービー、アルジェリアバービーなどがありました。しかし、その描写には明らかな欠陥がありました。アジアのバービー数体は肌の色が薄く、タイ、シンガポール、フィリピンのバービーはすべて金髪でした。レバノンバービーは瓦礫の上に立ち、ドイツバービーは軍服を着ており、南スーダンバービーは銃を持っていました。
この記事(BuzzFeedは後に削除する前に免責事項を追加)は、Midjourney、Dall-E、Stable Diffusionなどの最近の生成AIテキスト・ツー・イメージシステムが生成する画像に広がる偏見とステレオタイプの顕著な例を意図せず示しました。このような偏りは、トレーニングデータに存在する体系的な不均衡に起因します。例えば、Bloombergが5,000枚以上のAI画像を分析したところ、高収入の職種(医師、弁護士、CEOなど)に関連する画像では肌の色が薄く、ほとんどの専門職の結果は男性が支配的であることがわかりました。これは、現実世界の不平等がAIモデルによって増幅されていることを示しています。
Rest of Worldによる新しい分析は、生成AIシステムが国家アイデンティティに関しても偏見、ステレオタイプ、還元主義の傾向を持つことを明らかにしました。研究チームはMidjourneyを使用して、「一人の人」「一人の女性」「一軒の家」「一本の通り」「一皿の食べ物」という5つの一般的なプロンプトを選び、それらを中国、インド、インドネシア、メキシコ、ナイジェリアの各国に適応させました。比較のために、Midjourney(ほとんどの大手生成AI企業と同様に米国に拠点を置く)を考慮して、米国も調査に含めました。各プロンプトと国の組み合わせ(例:「インドの人」「メキシコの家」「ナイジェリアの料理の皿」)に対して、100枚の画像を生成し、合計3,000枚のデータセットを得ました。
調査の結果、AIが生成する画像はしばしば一般的なステレオタイプを繰り返していることがわかりました。例えば、中国人は伝統的な服装をしていたり、寺院の前に立っているように描かれる傾向があり、ナイジェリアの料理画像はシンプルなストリートフードに偏り、多様性が無視されていました。このような単純化は、誤った文化的認識を広めるだけでなく、世界中の偏見を強化する可能性があります。生成AIの急速な発展により、これらの画像はさまざまなアプリケーションで広く使用されており、その潜在的な影響は無視できません。