2026-05-25 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

當AI在信仰問題上站隊：AI介導的信仰指導中持續存在的非對稱性

一項新研究發現，大型語言模型（LLMs）在回答宗教轉換問題時表現出持續的非對稱性。模型傾向於支援加入天主教、巴哈伊教和錫克教，同時勸阻放棄這些信仰，而對無神論者、不可知論者和耶和華見證人則相反。該研究測試了20個模型在182對宗教配對中的表現，結果具有可重複性。研究使用人類驗證的“LLM作為法官”框架，發現所有模型均顯示非對稱性，其中Grok 4.20最為顯著。這些偏差如果大規模部署可能產生現實影響。

來源arXiv Computational Linguistics作者: Brett Israelsen, Sheryl Carty, Josh Coates, Nancy Fulda, Julie Park, Pete Whiting

近期，一項發表在arXiv上的研究揭示了大型語言模型（LLMs）在提供宗教轉換建議時存在持續的非對稱性。該研究由Brett Israelsen等六位作者完成，論文標題為“When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance”，於2026年5月21日提交。研究團隊測試了20個商業和開源語言模型，涵蓋182對宗教組合，透過模擬使用者尋求信仰轉換建議的場景，評估模型對不同宗教的態度。

研究採用了一種經過人工驗證的“LLM作為法官”框架來確保評估的可靠性。每個模型透過與模擬使用者的互動進行探測，模擬使用者就潛在的信仰轉換尋求建議。模型傾向於對某些信仰轉換使用更鼓勵性的語言，而對其他則相對冷淡。這些模式在多次試驗中系統地重複出現，表明非對稱性是模型行為的穩健屬性，而非評分方法的偽影。

研究結果表明，所有測試模型都表現出可重複的非對稱性，但偏好模式各不相同。整體而言，模型更傾向於鼓勵加入天主教、巴哈伊教和錫克教，而對放棄這些信仰則持謹慎態度。相反，對於無神論者、不可知論者和耶和華見證人，模型往往更支援離開這些信仰，而不是加入。這種非對稱性在多種提問方式和宗教配對資料集的變體中保持一致。

值得注意的是，不同模型之間的偏好差異顯著。例如，Grok 4.20表現出最強的非對稱性，而其他模型則相對溫和。研究還發現，模型大小和提供商也會影響偏差程度。研究人員強調，這種系統性偏差如果被大規模部署和複製，可能會產生現實世界的影響，特別是在宗教指導和諮詢領域。該研究提醒我們，AI系統在敏感話題上的潛在偏見需要被認真對待和持續監控。