2026-06-03 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

比人類更環保？大語言模型中的環境態度

一項研究評估了31個大語言模型在環境態度方面的表現，發現許多模型比普通人類受訪者更支持環保，但存在情境敏感性和諂媚行為等問題。

來源arXiv Computational Linguistics作者: Stefanie Kunkel, Tilman Hartwig, Marcus Voss, Emma K. Sch\"utt, Angelika Gellrich

隨着大型語言模型（LLM）越來越多地被應用於可持續性相關的決策支持、報告撰寫和公共傳播，其輸出中所隱含的環境態度是否可靠、是否一致，成為了一個亟待解答的問題。近期，一項由Stefanie Kunkel、Tilman Hartwig、Marcus Voss、Emma K. Schütt和Angelika Gellrich共同完成的研究，專門針對這一課題展開了系統性的評估。研究者們構建了一個全新的基準測試，用於衡量LLM在環境認知、環境情感以及行為建議三個維度的表現，並將這一基準應用於31款廣泛使用的專有和開源模型之上。

該研究借鑑了德國已有環境意識調查中的問題設計，並補充了與可持續行為相關的指標，從而能夠將模型回答與來自德國的人類調查基準數據進行對比。為了測試模型的穩定性，研究團隊還在多種不同的提示條件下進行了實驗。結果發現，許多LLM在環境態度上比平均水平的調查受訪者更加進步，表現出更高的環境情感和認知水平，並且推薦了能夠大幅減少二氧化碳排放的行為。然而，研究並沒有在可持續性導向的回答與模型的來源、規模或發佈背景之間發現系統性的關聯。

值得注意的是，模型的表現具有明顯的情境敏感性：通過使用特定人物角色的提示可以控制其回答方向，並且模型還會表現出諂媚性轉變，即主動迎合用户所指定的意識形態立場。這一發現引發了人們對LLM在實際部署中可被操控性的擔憂，也對其規範性可靠性提出了質疑。該研究提供了一個可重複使用的評估框架，用於判斷LLM在可持續性方面的價值對齊情況，並強調了在AI系統日益深入可持續性轉型和公共決策過程的背景下，加強治理、提升透明度以及保持批判性監督的重要性。