AI模型在瑞典大選中的投票傾向
本文通過將28種AI模型配置(來自Agent Arena排行榜)對瑞典選舉指南35個問題的回答與各政黨官方立場進行對比,發現這些模型更傾向於主流政黨,而對極右翼的瑞典民主黨支持率最低。實驗排除了聊天界面、網絡搜索及系統提示,僅使用原始模型權重,揭示了模型本身的固有傾向。
瑞典《 Svenska Dagbladet 》最近將各大AI聊天機器人置於SVT的選舉指南(Valkompass)中,測試了ChatGPT、Gemini、Claude和Grok等模型的選擇。然而,這種測試反映的是聊天產品的表現,而非模型本身。這些應用帶有系統提示、安全層,且多數具備實時網絡搜索功能,因此測試結果更多體現了產品及其搜索棧的特性。
為探究模型自身的政治傾向,我們剔除了所有外部因素,僅使用原始模型權重進行實驗。我們從Agent Arena排行榜中選取了28種配置,涵蓋Anthropic、OpenAI、Google、xAI、DeepSeek、Moonshot、Z.ai、MiniMax、Alibaba和NVIDIA的23個前沿模型。每種配置均通過OpenRouter API調用,無任何系統提示、網絡搜索或工具輔助。模型需回答SVT選舉指南中的35個問題,而後將其答案與各政黨的官方立場進行對比。
結果顯示,所有配置並未集中支持某一政黨。7種配置最接近左翼黨(Vänsterpartiet),6種最接近綠黨(Miljöpartiet),5種最接近温和黨(Moderaterna),4種最接近自由黨(Liberalerna)和社會民主黨(Socialdemokraterna),2種最接近中間黨(Centerpartiet)。無一種配置最接近基督教民主黨(Kristdemokraterna)或瑞典民主黨(Sverigedemokraterna)。
從平均值看,模型對六大主流政黨的同意率均在67%至69%之間,相當接近,表明模型總體處於政治光譜的中間位置。而基督教民主黨和瑞典民主黨的同意率明顯較低,分別為57%和49%。其中瑞典民主黨在28種配置中有26次位列末位,成為模型最不認同的政黨。
值得注意的是,推理設置對結果的影響超出預期。例如,Kimi K2.6在開啓思考模式後,35個答案中有23個發生改變,導致其最接近的政黨也隨之變化。這正是Agent Arena排行榜將思考模式作為獨立配置的原因。
需要強調的是,本實驗測試的是原始模型,而非聊天產品。目前模型的大部分流量通過API產生,用於代碼生成等任務。當用户通過聊天界面詢問政治問題時,模型可藉助網絡搜索獲取信息,因此結果可能大相徑庭。本實驗旨在揭示模型本身的傾向,而非市場上產品的表現。
總體而言,這些模型在瑞典政治問題上並未呈現極端傾向,而是集中於主流政黨,尤其對右翼民粹主義政黨的支持度最低。這一發現對於理解AI模型的政治偏見具有重要意義。