2026-06-03 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

比人类更环保？大语言模型中的环境态度

一项研究评估了31个大语言模型在环境态度方面的表现，发现许多模型比普通人类受访者更支持环保，但存在情境敏感性和谄媚行为等问题。

来源arXiv Computational Linguistics作者: Stefanie Kunkel, Tilman Hartwig, Marcus Voss, Emma K. Sch\"utt, Angelika Gellrich

随着大型语言模型（LLM）越来越多地被应用于可持续性相关的决策支持、报告撰写和公共传播，其输出中所隐含的环境态度是否可靠、是否一致，成为了一个亟待解答的问题。近期，一项由Stefanie Kunkel、Tilman Hartwig、Marcus Voss、Emma K. Schütt和Angelika Gellrich共同完成的研究，专门针对这一课题展开了系统性的评估。研究者们构建了一个全新的基准测试，用于衡量LLM在环境认知、环境情感以及行为建议三个维度的表现，并将这一基准应用于31款广泛使用的专有和开源模型之上。

该研究借鉴了德国已有环境意识调查中的问题设计，并补充了与可持续行为相关的指标，从而能够将模型回答与来自德国的人类调查基准数据进行对比。为了测试模型的稳定性，研究团队还在多种不同的提示条件下进行了实验。结果发现，许多LLM在环境态度上比平均水平的调查受访者更加进步，表现出更高的环境情感和认知水平，并且推荐了能够大幅减少二氧化碳排放的行为。然而，研究并没有在可持续性导向的回答与模型的来源、规模或发布背景之间发现系统性的关联。

值得注意的是，模型的表现具有明显的情境敏感性：通过使用特定人物角色的提示可以控制其回答方向，并且模型还会表现出谄媚性转变，即主动迎合用户所指定的意识形态立场。这一发现引发了人们对LLM在实际部署中可被操控性的担忧，也对其规范性可靠性提出了质疑。该研究提供了一个可重复使用的评估框架，用于判断LLM在可持续性方面的价值对齐情况，并强调了在AI系统日益深入可持续性转型和公共决策过程的背景下，加强治理、提升透明度以及保持批判性监督的重要性。