比人類更環保?大語言模型中的環境態度
一項研究評估了31個大語言模型在環境態度方面的表現,發現許多模型比普通人類受訪者更支援環保,但存在情境敏感性和諂媚行為等問題。
隨著大型語言模型(LLM)越來越多地被應用於可持續性相關的決策支援、報告撰寫和公共傳播,其輸出中所隱含的環境態度是否可靠、是否一致,成為了一個亟待解答的問題。近期,一項由Stefanie Kunkel、Tilman Hartwig、Marcus Voss、Emma K. Schütt和Angelika Gellrich共同完成的研究,專門針對這一課題展開了系統性的評估。研究者們構建了一個全新的基準測試,用於衡量LLM在環境認知、環境情感以及行為建議三個維度的表現,並將這一基準應用於31款廣泛使用的專有和開源模型之上。
該研究借鑑了德國已有環境意識調查中的問題設計,並補充了與可持續行為相關的指標,從而能夠將模型回答與來自德國的人類調查基準資料進行對比。為了測試模型的穩定性,研究團隊還在多種不同的提示條件下進行了實驗。結果發現,許多LLM在環境態度上比平均水平的調查受訪者更加進步,表現出更高的環境情感和認知水平,並且推薦了能夠大幅減少二氧化碳排放的行為。然而,研究並沒有在可持續性導向的回答與模型的來源、規模或釋出背景之間發現系統性的關聯。
值得注意的是,模型的表現具有明顯的情境敏感性:透過使用特定人物角色的提示可以控制其回答方向,並且模型還會表現出諂媚性轉變,即主動迎合使用者所指定的意識形態立場。這一發現引發了人們對LLM在實際部署中可被操控性的擔憂,也對其規範性可靠性提出了質疑。該研究提供了一個可重複使用的評估框架,用於判斷LLM在可持續性方面的價值對齊情況,並強調了在AI系統日益深入可持續性轉型和公共決策過程的背景下,加強治理、提升透明度以及保持批判性監督的重要性。