AI News HubLIVE
站内改写

當AI在信仰問題上站隊:AI介導的信仰指導中持續存在的非對稱性

一項新研究發現,大型語言模型(LLMs)在回答宗教轉換問題時表現出持續的非對稱性。模型傾向於支援加入天主教、巴哈伊教和錫克教,同時勸阻放棄這些信仰,而對無神論者、不可知論者和耶和華見證人則相反。該研究測試了20個模型在182對宗教配對中的表現,結果具有可重複性。研究使用人類驗證的“LLM作為法官”框架,發現所有模型均顯示非對稱性,其中Grok 4.20最為顯著。這些偏差如果大規模部署可能產生現實影響。

文章情報

工程師進階

要點

  • 大型語言模型在宗教轉換建議上存在系統性偏差,偏好某些宗教而貶低其他。
  • 研究測試了20個商業和開源模型,涵蓋182對宗教組合,非對稱性可重複。
  • 天主教、巴哈伊教和錫克教受到普遍青睞,而無神論者、不可知論者和耶和華見證人則相對受冷遇。
  • 模型大小和提供商影響偏差程度,Grok 4.20表現出最強的非對稱性。

為什麼重要

這條新聞值得關注,因為大型語言模型在宗教轉換建議上存在系統性偏差,偏好某些宗教而貶低其他。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

近期,一項發表在arXiv上的研究揭示了大型語言模型(LLMs)在提供宗教轉換建議時存在持續的非對稱性。該研究由Brett Israelsen等六位作者完成,論文標題為“When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance”,於2026年5月21日提交。研究團隊測試了20個商業和開源語言模型,涵蓋182對宗教組合,透過模擬使用者尋求信仰轉換建議的場景,評估模型對不同宗教的態度。

研究採用了一種經過人工驗證的“LLM作為法官”框架來確保評估的可靠性。每個模型透過與模擬使用者的互動進行探測,模擬使用者就潛在的信仰轉換尋求建議。模型傾向於對某些信仰轉換使用更鼓勵性的語言,而對其他則相對冷淡。這些模式在多次試驗中系統地重複出現,表明非對稱性是模型行為的穩健屬性,而非評分方法的偽影。

研究結果表明,所有測試模型都表現出可重複的非對稱性,但偏好模式各不相同。整體而言,模型更傾向於鼓勵加入天主教、巴哈伊教和錫克教,而對放棄這些信仰則持謹慎態度。相反,對於無神論者、不可知論者和耶和華見證人,模型往往更支援離開這些信仰,而不是加入。這種非對稱性在多種提問方式和宗教配對資料集的變體中保持一致。

值得注意的是,不同模型之間的偏好差異顯著。例如,Grok 4.20表現出最強的非對稱性,而其他模型則相對溫和。研究還發現,模型大小和提供商也會影響偏差程度。研究人員強調,這種系統性偏差如果被大規模部署和複製,可能會產生現實世界的影響,特別是在宗教指導和諮詢領域。該研究提醒我們,AI系統在敏感話題上的潛在偏見需要被認真對待和持續監控。