司法机构对AI治理的警醒:政府不能外包决策给ChatGPT
联邦法院裁定,DOGE使用ChatGPT终止超过1400项NEH拨款的行为违宪,凸显了在没有人类监督的情况下将政府决策外包给AI的危险。法院明确指出,LLM是工具,政府必须对其输出负责,并需建立适当保障措施。
2026年5月,美国联邦法院在一起具有里程碑意义的案件中给特朗普政府的人工智能雄心泼了一盆冷水。美国学术团体协会诉国家人文基金会案(American Council of Learned Societies v. National Endowment for the Humanities)涉及政府效率部(DOGE)大规模取消NEH拨款的行为。案情揭示了一个令人不安的故事:两名年轻的DOGE工作人员将数百项拨款的描述输入ChatGPT,并提示“以下内容是否与DEI(多样性、公平、包容和可及性)有关?”ChatGPT产生了离奇的结果,例如将一座捕鲸博物馆的拨款标记为DEI相关,因为其旨在“创造包容且有影响力的体验”。更严重的是,许多取消决定仅基于项目描述中提及特定种族或性别,如一项关于科法克斯惨案纪录片因其“探讨了对黑人公民权利产生重大影响的历史事件”而被取消。DOGE全盘接受了ChatGPT的输出,以此取消了超过1400项拨款。
法院裁定DOGE的行为多次违宪。基于与“不受欢迎的思想”关联而终止拨款违反了第一修正案,而基于种族或性别取消拨款则违反了平等保护原则。法院特别强调了DOGE与ChatGPT对话的直白性,认为这暴露了政府的歧视意图。“用户明确要求聊天机器人进行歧视,而聊天机器人照做了,”法官写道。政府试图与ChatGPT的输出撇清关系,声称其仅提供“背景”,但法院驳回了这一辩护,指出“DOGE选择了AI工具,制定了提示,并定义了基于观点的标准”,因此“这些分类在宪法目的上是政府自身的分类”。
此案的关键见解在于:大型语言模型是工具,它们可以谨慎或不负责任地使用。与法律研究数据库或文字处理器不同,LLM是生成性的,它们会产生文本、答案和理由。这诱使机构将LLM视为决策者,就像DOGE那样不加质疑地批准其输出。但法院明确指出,这种外包是行不通的。LLM倾向于说不恰当和错误的话,并且难以抵制错误指令。将监管决策交给这样的工具会带来明显的法律和实际问题。
然而,这并不意味着监管者不能负责任地使用LLM。LLM可能非常适合许多任务,如审查相关文献、阐述竞争观点、识别草案弱点以及起草分析和政策文件。但关键在于,机构必须设计流程以利用其优势并防范其弱点。这包括培训员工了解LLM的已知限制,制定协议以减少谄媚和幻觉倾向,并确保有责任感的官员能实质性审查和验证其工作。正如法院裁决所示,Learned Societies案应成为政府AI使用的反面教材。
LLM无疑将在联邦管理中发挥重要作用,但需适当的保障措施。Learned Societies案是一个警钟:将监管决策外包给LLM的计划是误入歧途的,而且无论如何都不会成功。