各大语言模型的政治立场分析
一项新研究分析并绘制了六大主流AI语言模型的政治立场分布。结果显示,六分之四的模型偏左,其中Grok最偏右,Gemini最稳定、最中立。研究还发现,部分模型的自我宣称立场与实际测量存在偏差。
近期,一项由 trakkr.ai 开展的研究对六大主流AI语言模型——ChatGPT、Claude、Gemini、Grok、Llama 和 DeepSeek——进行了系统的政治立场分析。该研究通过一套开放的题库,在关闭网络搜索的条件下,对每个模型进行了多次提问,并利用中立的分类器对回答进行评分,最终绘制出每个模型在经济和社会两个轴向上的立场分布图。
研究结果显示,在这六款模型中,有四款在经济轴上偏向左侧(自由/进步),其中 ChatGPT 最左,接近德国绿党(Die Grünen)的立场;而 Grok 则是最偏右的模型,接近法国总统马克龙的立场。Gemini 和 DeepSeek 在立场上最为中立,且稳定性最高。值得注意的是,研究还对比了模型自我宣称的立场与实际测量结果:Gemini 和 DeepSeek 保持一致,而 Claude 和 ChatGPT 实际测量的位置比其声称的更加偏左,Grok 则更加偏右。
除了经济轴,研究还涉及社会议题,如毒品合法化、性别认同医疗、多元文化主义、化石燃料淘汰、财富税等。每个模型在这些议题上的立场强度也被量化,并以可视化方式呈现。研究人员强调,这项研究是描述性的,而非规范性,旨在客观反映模型当前的输出倾向,并不评判哪种立场更好或正确。
研究还提供了丰富的交互功能,包括查看每个模型的详细档案、按问题浏览、对比任意两个模型、以及让用户通过回答相同问题来寻找与自己立场最接近的模型。所有原始数据、问题库和方法论均公开可查,并遵循 CC BY 4.0 许可协议。
该研究的方法论严谨,通过多次运行和错误区间估计,避免了单一测试的不确定性。研究人员指出,关闭网络搜索是为了测试模型本身的内在倾向,而非其检索外部信息的能力。一个独立的“边界测试”则开启搜索,以测量不同地域下检索结果对模型回答的影响。
尽管该研究并非旨在引发争议,但它确实揭示了当前AI模型在政治议题上的分布并不均匀——多数模型倾向于左翼或中间偏左立场。这种偏向可能会影响用户在使用这些模型时获得的信息和观点。因此,理解和关注AI模型的政治立场,对于负责任地使用AI工具至关重要。