司法機構對AI治理的警醒:政府不能外包決策給ChatGPT
聯邦法院裁定,DOGE使用ChatGPT終止超過1400項NEH撥款的行為違憲,凸顯了在沒有人類監督的情況下將政府決策外包給AI的危險。法院明確指出,LLM是工具,政府必須對其輸出負責,並需建立適當保障措施。
2026年5月,美國聯邦法院在一起具有里程碑意義的案件中給特朗普政府的人工智慧雄心潑了一盆冷水。美國學術團體協會訴國家人文基金會案(American Council of Learned Societies v. National Endowment for the Humanities)涉及政府效率部(DOGE)大規模取消NEH撥款的行為。案情揭示了一個令人不安的故事:兩名年輕的DOGE工作人員將數百項撥款的描述輸入ChatGPT,並提示“以下內容是否與DEI(多樣性、公平、包容和可及性)有關?”ChatGPT產生了離奇的結果,例如將一座捕鯨博物館的撥款標記為DEI相關,因為其旨在“創造包容且有影響力的體驗”。更嚴重的是,許多取消決定僅基於專案描述中提及特定種族或性別,如一項關於科法克斯慘案紀錄片因其“探討了對黑人公民權利產生重大影響的歷史事件”而被取消。DOGE全盤接受了ChatGPT的輸出,以此取消了超過1400項撥款。
法院裁定DOGE的行為多次違憲。基於與“不受歡迎的思想”關聯而終止撥款違反了第一修正案,而基於種族或性別取消撥款則違反了平等保護原則。法院特別強調了DOGE與ChatGPT對話的直白性,認為這暴露了政府的歧視意圖。“使用者明確要求聊天機器人進行歧視,而聊天機器人照做了,”法官寫道。政府試圖與ChatGPT的輸出撇清關係,聲稱其僅提供“背景”,但法院駁回了這一辯護,指出“DOGE選擇了AI工具,制定了提示,並定義了基於觀點的標準”,因此“這些分類在憲法目的上是政府自身的分類”。
此案的關鍵見解在於:大型語言模型是工具,它們可以謹慎或不負責任地使用。與法律研究資料庫或文書處理器不同,LLM是生成性的,它們會產生文本、答案和理由。這誘使機構將LLM視為決策者,就像DOGE那樣不加質疑地批准其輸出。但法院明確指出,這種外包是行不通的。LLM傾向於說不恰當和錯誤的話,並且難以抵制錯誤指令。將監管決策交給這樣的工具會帶來明顯的法律和實際問題。
然而,這並不意味著監管者不能負責任地使用LLM。LLM可能非常適合許多工,如審查相關文獻、闡述競爭觀點、識別草案弱點以及起草分析和政策檔案。但關鍵在於,機構必須設計流程以利用其優勢並防範其弱點。這包括培訓員工瞭解LLM的已知限制,制定協議以減少諂媚和幻覺傾向,並確保有責任感的官員能實質性審查和驗證其工作。正如法院裁決所示,Learned Societies案應成為政府AI使用的反面教材。
LLM無疑將在聯邦管理中發揮重要作用,但需適當的保障措施。Learned Societies案是一個警鐘:將監管決策外包給LLM的計劃是誤入歧途的,而且無論如何都不會成功。