2026-06-25 21:08 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-25 21:12 UTC+8

各大語言模型的政治立場分析

一項新研究分析並繪製了六大主流AI語言模型的政治立場分佈。結果顯示，六分之四的模型偏左，其中Grok最偏右，Gemini最穩定、最中立。研究還發現，部分模型的自我宣稱立場與實際測量存在偏差。

來源Hacker News AI作者: mektrik

近期，一項由 trakkr.ai 開展的研究對六大主流AI語言模型——ChatGPT、Claude、Gemini、Grok、Llama 和 DeepSeek——進行了系統的政治立場分析。該研究透過一套開放的題庫，在關閉網路搜尋的條件下，對每個模型進行了多次提問，並利用中立的分類器對回答進行評分，最終繪製出每個模型在經濟和社會兩個軸向上的立場分佈圖。

研究結果顯示，在這六款模型中，有四款在經濟軸上偏向左側（自由/進步），其中 ChatGPT 最左，接近德國綠黨（Die Grünen）的立場；而 Grok 則是最偏右的模型，接近法國總統馬克龍的立場。Gemini 和 DeepSeek 在立場上最為中立，且穩定性最高。值得注意的是，研究還對比了模型自我宣稱的立場與實際測量結果：Gemini 和 DeepSeek 保持一致，而 Claude 和 ChatGPT 實際測量的位置比其聲稱的更加偏左，Grok 則更加偏右。

除了經濟軸，研究還涉及社會議題，如毒品合法化、性別認同醫療、多元文化主義、化石燃料淘汰、財富稅等。每個模型在這些議題上的立場強度也被量化，並以視覺化方式呈現。研究人員強調，這項研究是描述性的，而非規範性，旨在客觀反映模型當前的輸出傾向，並不評判哪種立場更好或正確。

研究還提供了豐富的互動功能，包括檢視每個模型的詳細檔案、按問題瀏覽、對比任意兩個模型、以及讓使用者透過回答相同問題來尋找與自己立場最接近的模型。所有原始資料、問題庫和方法論均公開可查，並遵循 CC BY 4.0 許可協議。

該研究的方法論嚴謹，透過多次執行和錯誤區間估計，避免了單一測試的不確定性。研究人員指出，關閉網路搜尋是為了測試模型本身的內在傾向，而非其檢索外部資訊的能力。一個獨立的“邊界測試”則開啟搜尋，以測量不同地域下檢索結果對模型回答的影響。

儘管該研究並非旨在引發爭議，但它確實揭示了當前AI模型在政治議題上的分佈並不均勻——多數模型傾向於左翼或中間偏左立場。這種偏向可能會影響使用者在使用這些模型時獲得的資訊和觀點。因此，理解和關注AI模型的政治立場，對於負責任地使用AI工具至關重要。