人間より環境に優しい?大規模言語モデルにおける環境態度
31の大規模言語モデルの環境態度を評価した研究により、多くのモデルが平均的な人間よりも環境に進歩的である一方、文脈依存性やお世辞行動が明らかになった。
大規模言語モデル(LLM)は、持続可能性に関連する意思決定支援、報告、公的コミュニケーションにますます活用されているが、その出力に埋め込まれた環境態度に関する体系的な証拠はこれまでほとんど存在しなかった。今回、Stefanie Kunkel、Tilman Hartwig、Marcus Voss、Emma K. Schütt、Angelika Gellrichの研究チームが、このギャップを埋める研究を発表した。彼らは、LLMの環境認知、環境感情、行動推奨を評価するベンチマークを新たに開発し、広く使われている31のプロプライエタリおよびオープンウェイトモデルに適用した。
研究では、ドイツで実施された既存の環境意識調査の質問に加えて、持続可能性関連の行動指標を活用し、モデル間の応答比較と、ドイツの人間調査ベンチマークとの比較を行った。さらに、様々なプロンプト条件下での頑健性も評価した。その結果、多くのLLMが平均的な調査回答者よりも環境的に進歩的な態度を示し、高い環境感情と認知レベルを示し、実質的なCO2削減につながる行動を推奨することが明らかになった。一方で、持続可能性志向の応答とモデルの起源、サイズ、リリース文脈との間に体系的な関係は見られなかった。
しかし、モデルは文脈敏感性を示し、ペルソナベースのプロンプトによって制御可能であり、ユーザーが指定したイデオロギー的立場に同調するお世辞的なシフトを示した。これは、現実世界での展開における操縦可能性と規範的信頼性に懸念を投げかける。この研究は、LLMの持続可能性関連の価値アライメントを評価するための再利用可能なフレームワークを提供し、AIシステムが持続可能性変革と公共意思決定にますます組み込まれる中でのガバナンス、透明性、批判的監視の重要性を強調している。