類似Midjourney的生成式AI製作的圖像充滿刻板印象
本文探討了生成式AI如Midjourney在圖像生成中如何強化刻板印象和偏見。通過分析3000張圖片,研究發現AI不僅在高薪職業中偏向淺膚色和男性形象,還在描繪不同國家時存在簡化與偏見。
今年7月,BuzzFeed發佈了一組使用流行AI圖像生成器Midjourney製作的195張芭比娃娃圖片,每個娃娃代表一個不同的國家:阿富汗芭比、阿爾巴尼亞芭比、阿爾及利亞芭比等等。這些描繪存在明顯缺陷:幾個亞洲芭比膚色偏白;泰國芭比、新加坡芭比和菲律賓芭比都是金髮;黎巴嫩芭比站在廢墟上;德國芭比穿着軍裝;南蘇丹芭比手持槍支。
這篇文章——BuzzFeed在刪除前添加了免責聲明——無意中揭示了近期生成式AI文本到圖像系統(如Midjourney、Dall-E和Stable Diffusion)所產生圖像中充斥的偏見和刻板印象。這種偏見並非偶然,而是源於訓練數據中存在的系統性偏差。例如,Bloomberg對5000多張AI圖像的分析發現,與高薪職位(如醫生、律師、CEO)相關的圖像中人物膚色更淺,且大多數職業角色的結果以男性為主,這反映了現實世界中的不平等現象被AI模型放大。
Rest of World進行的一項新分析進一步表明,生成式AI系統在描繪國家身份時也存在偏見、刻板印象和簡化傾向。研究團隊使用Midjourney,基於“一個人”、“一個女人”、“一棟房子”、“一條街道”和“一盤食物”這五個通用概念選擇提示詞,然後針對中國、印度、印度尼西亞、墨西哥和尼日利亞五個國家進行調整。由於Midjourney總部位於美國,他們也將美國納入比較範圍。對於每個提示詞和國家的組合(例如“一個印度人”、“墨西哥的房子”、“一盤尼日利亞食物”),研究人員生成了100張圖像,最終得到3000張圖像的數據集。
研究結果顯示,AI生成的圖像往往重複常見的刻板印象,例如中國人物常被描繪成穿着傳統服裝或站在寺廟前,而尼日利亞的食物圖像則偏向於簡單的街頭小吃,忽略了當地美食的多樣性。這種簡化不僅傳播了錯誤的文化認知,還可能加劇全球範圍內的偏見。生成式AI的快速發展使得這些圖像被廣泛用於各種應用,其潛在影響不容忽視。