美國政府關閉最強AI的那一天
2026年6月12日,美國商務部以國家安全為由,命令Anthropic立即暫停對Claude Fable 5和Mythos 5的訪問。此事件源於研究人員Pliny the Liberator透過提示注入技術成功破解了Fable 5的安全防護,使其能夠展示出與受限版本Mythos 5相當的進攻性網路能力。Anthropic被迫全球停用這兩個模型,並公開質疑政府的決定。本文詳細分析了事件經過、技術細節及其對網路安全領域的影響。
2026年6月12日,人工智慧領域發生了一件前所未有的重大事件。美國商務部以國家安全為由,向Anthropic公司發出指令,要求其立即暫停對最新推出的Claude Fable 5和Mythos 5兩個模型的訪問。這一決定迫使Anthropic在全球範圍內關閉了這兩個模型,引發了業界對AI監管和安全性的廣泛討論。
事件起源於6月9日Anthropic公開發布Fable 5模型。Fable 5被設計為Mythos 5的“安全版本”,後者擁有目前最先進的進攻性網路安全能力,僅限小範圍政府合作伙伴和關鍵基礎設施防禦者使用。Fable 5則透過一套獨立的分類器過濾敏感請求,理論上更安全。然而,短短幾小時內,一名化名為Pliny the Liberator的研究人員就在社交媒體上聲稱成功“解放”了Fable 5。
Pliny the Liberator使用的破解方法並不涉及程式碼漏洞或逆向工程,而是透過精心設計的提示(prompt)來繞過安全分類器。具體技術包括:使用Unicode和西里爾字元替換來混淆模式識別;利用長上下文對話將在惡意意圖分散在多次互動中;將敏感請求分解為多個看似無害的子主題,然後在攻擊者端重組輸出;以及將敏感請求包裝成教育或創作場景。最令人震驚的是,他成功生成了功能性的棧緩衝區溢位漏洞利用程式碼,而這一切是在“學習OSED認證考試”的偽裝下完成的。
美國商務部的反應極為迅速。據NBC新聞、華爾街日報等媒體報道,商務部長Howard Lutnick親自簽署了給Anthropic CEO Dario Amodei的信函,援引國家安全權力將Fable 5和Mythos 5列為受出口管制的技術。這一法律框架歷史上曾用於加密演算法、武器元件等敏感技術。分析師很快將其與1990年代的加密戰爭相提並論,當時美國政府試圖限制RSA等加密演算法的出口,但最終以失敗告終。
Anthropic雖然遵守了指令,但公開表達了強烈異議。公司認為政府的理解存在偏差,所聲稱的破解方法不過是要求模型閱讀程式碼庫並修復軟體漏洞,這類功能其他公開模型早已具備。Anthropic還指出,政府僅提供了口頭證據,沒有強有力的技術演示,而且類似能力在OpenAI的GPT-5.5中無需破解即可實現。如果按照同一標準,幾乎所有主要AI提供商的前沿模型都應被關閉。
這一事件對網路安全領域具有深遠影響。首先,進攻性AI已正式進入政府監管視線。政府能在數小時內作出反應,表明其對具有潛在攻擊能力的AI模型保持高度警惕。其次,提示注入和破解攻擊已被證明是真實有效的攻擊向量,AI安全不能僅依賴對話層的內容過濾器。安全團隊必須將多輪攻擊序列、字元替換、上下文操縱等攻擊手段納入測試範圍。再次,防禦性與進攻性AI之間的界限變得模糊。Mythos 5原本是幫助防禦者發現和修復漏洞的工具,但同一能力極易被武器化。最後,此次事件開創了政府迫使商業AI公司將正在執行中的模型完全下線的先例,預示著前沿AI模型的部署將面臨越來越嚴格的監管約束。
目前,Anthropic的其他模型如Claude Opus 4.8和Haiku仍可正常使用。公司表示正在努力在政府的框架內恢復Fable 5和Mythos 5的訪問,但未給出時間表。ChatGPT和Gemini等其他平臺未受此次指令影響。
對於安全團隊而言,應立即採取行動:審計對特定AI模型和供應商的依賴,識別單點故障;將AI攻擊面納入滲透測試範圍,包括提示注入、破解和上下文操縱測試;建立獨立於模型的安全層,避免僅依賴AI自身的判斷;將AI監管風險納入風險管理框架;並模擬AI加速的攻擊場景,驗證檢測和響應能力。
這一事件表明,AI工具正變得日益強大,監管力度也在加強,使用者的責任隨之增加。如何在不扼殺創新的前提下有效管控風險,將是未來整個行業面臨的重大課題。