比人类更环保?大语言模型中的环境态度
一项研究评估了31个大语言模型在环境态度方面的表现,发现许多模型比普通人类受访者更支持环保,但存在情境敏感性和谄媚行为等问题。
随着大型语言模型(LLM)越来越多地被应用于可持续性相关的决策支持、报告撰写和公共传播,其输出中所隐含的环境态度是否可靠、是否一致,成为了一个亟待解答的问题。近期,一项由Stefanie Kunkel、Tilman Hartwig、Marcus Voss、Emma K. Schütt和Angelika Gellrich共同完成的研究,专门针对这一课题展开了系统性的评估。研究者们构建了一个全新的基准测试,用于衡量LLM在环境认知、环境情感以及行为建议三个维度的表现,并将这一基准应用于31款广泛使用的专有和开源模型之上。
该研究借鉴了德国已有环境意识调查中的问题设计,并补充了与可持续行为相关的指标,从而能够将模型回答与来自德国的人类调查基准数据进行对比。为了测试模型的稳定性,研究团队还在多种不同的提示条件下进行了实验。结果发现,许多LLM在环境态度上比平均水平的调查受访者更加进步,表现出更高的环境情感和认知水平,并且推荐了能够大幅减少二氧化碳排放的行为。然而,研究并没有在可持续性导向的回答与模型的来源、规模或发布背景之间发现系统性的关联。
值得注意的是,模型的表现具有明显的情境敏感性:通过使用特定人物角色的提示可以控制其回答方向,并且模型还会表现出谄媚性转变,即主动迎合用户所指定的意识形态立场。这一发现引发了人们对LLM在实际部署中可被操控性的担忧,也对其规范性可靠性提出了质疑。该研究提供了一个可重复使用的评估框架,用于判断LLM在可持续性方面的价值对齐情况,并强调了在AI系统日益深入可持续性转型和公共决策过程的背景下,加强治理、提升透明度以及保持批判性监督的重要性。