AI模型在瑞典大选中的投票倾向
本文通过将28种AI模型配置(来自Agent Arena排行榜)对瑞典选举指南35个问题的回答与各政党官方立场进行对比,发现这些模型更倾向于主流政党,而对极右翼的瑞典民主党支持率最低。实验排除了聊天界面、网络搜索及系统提示,仅使用原始模型权重,揭示了模型本身的固有倾向。
瑞典《 Svenska Dagbladet 》最近将各大AI聊天机器人置于SVT的选举指南(Valkompass)中,测试了ChatGPT、Gemini、Claude和Grok等模型的选择。然而,这种测试反映的是聊天产品的表现,而非模型本身。这些应用带有系统提示、安全层,且多数具备实时网络搜索功能,因此测试结果更多体现了产品及其搜索栈的特性。
为探究模型自身的政治倾向,我们剔除了所有外部因素,仅使用原始模型权重进行实验。我们从Agent Arena排行榜中选取了28种配置,涵盖Anthropic、OpenAI、Google、xAI、DeepSeek、Moonshot、Z.ai、MiniMax、Alibaba和NVIDIA的23个前沿模型。每种配置均通过OpenRouter API调用,无任何系统提示、网络搜索或工具辅助。模型需回答SVT选举指南中的35个问题,而后将其答案与各政党的官方立场进行对比。
结果显示,所有配置并未集中支持某一政党。7种配置最接近左翼党(Vänsterpartiet),6种最接近绿党(Miljöpartiet),5种最接近温和党(Moderaterna),4种最接近自由党(Liberalerna)和社会民主党(Socialdemokraterna),2种最接近中间党(Centerpartiet)。无一种配置最接近基督教民主党(Kristdemokraterna)或瑞典民主党(Sverigedemokraterna)。
从平均值看,模型对六大主流政党的同意率均在67%至69%之间,相当接近,表明模型总体处于政治光谱的中间位置。而基督教民主党和瑞典民主党的同意率明显较低,分别为57%和49%。其中瑞典民主党在28种配置中有26次位列末位,成为模型最不认同的政党。
值得注意的是,推理设置对结果的影响超出预期。例如,Kimi K2.6在开启思考模式后,35个答案中有23个发生改变,导致其最接近的政党也随之变化。这正是Agent Arena排行榜将思考模式作为独立配置的原因。
需要强调的是,本实验测试的是原始模型,而非聊天产品。目前模型的大部分流量通过API产生,用于代码生成等任务。当用户通过聊天界面询问政治问题时,模型可借助网络搜索获取信息,因此结果可能大相径庭。本实验旨在揭示模型本身的倾向,而非市场上产品的表现。
总体而言,这些模型在瑞典政治问题上并未呈现极端倾向,而是集中于主流政党,尤其对右翼民粹主义政党的支持度最低。这一发现对于理解AI模型的政治偏见具有重要意义。