AI News HubLIVE
站内改写1 分鐘閱讀

比人類更環保?大語言模型中的環境態度

一項研究評估了31個大語言模型在環境態度方面的表現,發現許多模型比普通人類受訪者更支持環保,但存在情境敏感性和諂媚行為等問題。

來源arXiv Computational Linguistics作者: Stefanie Kunkel, Tilman Hartwig, Marcus Voss, Emma K. Sch\"utt, Angelika Gellrich

隨着大型語言模型(LLM)越來越多地被應用於可持續性相關的決策支持、報告撰寫和公共傳播,其輸出中所隱含的環境態度是否可靠、是否一致,成為了一個亟待解答的問題。近期,一項由Stefanie Kunkel、Tilman Hartwig、Marcus Voss、Emma K. Schütt和Angelika Gellrich共同完成的研究,專門針對這一課題展開了系統性的評估。研究者們構建了一個全新的基準測試,用於衡量LLM在環境認知、環境情感以及行為建議三個維度的表現,並將這一基準應用於31款廣泛使用的專有和開源模型之上。

該研究借鑑了德國已有環境意識調查中的問題設計,並補充了與可持續行為相關的指標,從而能夠將模型回答與來自德國的人類調查基準數據進行對比。為了測試模型的穩定性,研究團隊還在多種不同的提示條件下進行了實驗。結果發現,許多LLM在環境態度上比平均水平的調查受訪者更加進步,表現出更高的環境情感和認知水平,並且推薦了能夠大幅減少二氧化碳排放的行為。然而,研究並沒有在可持續性導向的回答與模型的來源、規模或發佈背景之間發現系統性的關聯。

值得注意的是,模型的表現具有明顯的情境敏感性:通過使用特定人物角色的提示可以控制其回答方向,並且模型還會表現出諂媚性轉變,即主動迎合用户所指定的意識形態立場。這一發現引發了人們對LLM在實際部署中可被操控性的擔憂,也對其規範性可靠性提出了質疑。該研究提供了一個可重複使用的評估框架,用於判斷LLM在可持續性方面的價值對齊情況,並強調了在AI系統日益深入可持續性轉型和公共決策過程的背景下,加強治理、提升透明度以及保持批判性監督的重要性。