主要なLLMの政治的スタンスはどこにあるか
新しい研究により、6つの主要なAI言語モデルの政治的傾向がマッピングされました。6つのうち4つが左寄りで、Grokが最も右寄り、Geminiが最も中立で安定していることが判明しました。分析では、モデルの自己申告の立場と測定された立場の間にギャップがあることも明らかになりました。
最近、trakkr.ai が実施した研究により、ChatGPT、Claude、Gemini、Grok、Llama、DeepSeek という6つの主要なAI言語モデルの政治的スタンスが体系的に分析されました。この研究では、オープンな質問バンクを使用し、ウェブ検索をオフにした状態で各モデルに複数回質問し、中立的な分類器で回答をスコアリングすることで、各モデルの経済軸と社会軸におけるスタンスの分布をマッピングしました。
結果によると、6つのモデルのうち4つが経済軸で左寄り(リベラル/進歩的)であり、ChatGPTが最も左寄りでドイツの緑の党に近いスタンスを示しました。一方、Grokは最も右寄りで、フランスのマクロン大統領に近いスタンスでした。GeminiとDeepSeekは最も中立的で安定性が高いことが示されました。注目すべき点は、モデルの自己申告のスタンスと実際の測定結果の比較です。GeminiとDeepSeekは一貫していましたが、ClaudeとChatGPTは実際の測定値が自己申告よりも左寄りであり、Grokはより右寄りでした。
経済軸に加えて、ドラッグの合法化、性別適合医療、多文化主義、化石燃料の段階的廃止、富裕税などの社会問題に関する各モデルの立場も定量化され、視覚化されています。研究者らは、この研究は記述的であり規範的ではないと強調し、モデルの現在の出力傾向を客観的に反映することを目的としており、どちらの立場が良いか悪いかを判断するものではないと述べています。
この研究では、各モデルの詳細プロフィールの表示、質問ごとの閲覧、任意の2つのモデルの比較、ユーザーが同じ質問に答えることで自分に最も近いモデルを見つける機能など、豊富なインタラクティブ機能も提供されています。すべての生データ、質問バンク、方法論は公開されており、CC BY 4.0 ライセンスの下で利用可能です。
この研究の方法論は厳密で、複数回の実行と誤差区間の推定により、単一テストの不確実性を回避しています。ウェブ検索をオフにしたのは、モデルが外部情報を検索する能力ではなく、モデル本来の内在的傾向をテストするためです。別の「境界テスト」では検索をオンにして、地域による検索結果の違いがモデルの回答に与える影響を測定しています。
この研究は論争を巻き起こすことを意図したものではありませんが、現在のAIモデルの政治的スタンスが均一ではなく、多くが左派または中道左派に偏っていることを明らかにしています。このような偏りは、ユーザーがこれらのモデルを使用する際に得られる情報や見解に影響を与える可能性があります。したがって、AIツールを責任を持って使用するためには、AIモデルの政治的スタンスを理解し、注意を払うことが重要です。