AI News HubLIVE
站內改寫2 分鐘閱讀

各大語言模型的政治立場分析

一項新研究分析並繪製了六大主流AI語言模型的政治立場分佈。結果顯示,六分之四的模型偏左,其中Grok最偏右,Gemini最穩定、最中立。研究還發現,部分模型的自我宣稱立場與實際測量存在偏差。

來源Hacker News AI作者: mektrik

近期,一項由 trakkr.ai 開展的研究對六大主流AI語言模型——ChatGPT、Claude、Gemini、Grok、Llama 和 DeepSeek——進行了系統的政治立場分析。該研究透過一套開放的題庫,在關閉網路搜尋的條件下,對每個模型進行了多次提問,並利用中立的分類器對回答進行評分,最終繪製出每個模型在經濟和社會兩個軸向上的立場分佈圖。

研究結果顯示,在這六款模型中,有四款在經濟軸上偏向左側(自由/進步),其中 ChatGPT 最左,接近德國綠黨(Die Grünen)的立場;而 Grok 則是最偏右的模型,接近法國總統馬克龍的立場。Gemini 和 DeepSeek 在立場上最為中立,且穩定性最高。值得注意的是,研究還對比了模型自我宣稱的立場與實際測量結果:Gemini 和 DeepSeek 保持一致,而 Claude 和 ChatGPT 實際測量的位置比其聲稱的更加偏左,Grok 則更加偏右。

除了經濟軸,研究還涉及社會議題,如毒品合法化、性別認同醫療、多元文化主義、化石燃料淘汰、財富稅等。每個模型在這些議題上的立場強度也被量化,並以視覺化方式呈現。研究人員強調,這項研究是描述性的,而非規範性,旨在客觀反映模型當前的輸出傾向,並不評判哪種立場更好或正確。

研究還提供了豐富的互動功能,包括檢視每個模型的詳細檔案、按問題瀏覽、對比任意兩個模型、以及讓使用者透過回答相同問題來尋找與自己立場最接近的模型。所有原始資料、問題庫和方法論均公開可查,並遵循 CC BY 4.0 許可協議。

該研究的方法論嚴謹,透過多次執行和錯誤區間估計,避免了單一測試的不確定性。研究人員指出,關閉網路搜尋是為了測試模型本身的內在傾向,而非其檢索外部資訊的能力。一個獨立的“邊界測試”則開啟搜尋,以測量不同地域下檢索結果對模型回答的影響。

儘管該研究並非旨在引發爭議,但它確實揭示了當前AI模型在政治議題上的分佈並不均勻——多數模型傾向於左翼或中間偏左立場。這種偏向可能會影響使用者在使用這些模型時獲得的資訊和觀點。因此,理解和關注AI模型的政治立場,對於負責任地使用AI工具至關重要。