2026-06-13站内改写2 分鐘閱讀更新: 2026-06-13

美國政府關閉最強AI的那一天

2026年6月12日，美國商務部以國家安全為由，命令Anthropic立即暫停對Claude Fable 5和Mythos 5的訪問。此事件源於研究人員Pliny the Liberator透過提示注入技術成功破解了Fable 5的安全防護，使其能夠展示出與受限版本Mythos 5相當的進攻性網路能力。Anthropic被迫全球停用這兩個模型，並公開質疑政府的決定。本文詳細分析了事件經過、技術細節及其對網路安全領域的影響。

來源Hacker News AI作者: johnzoro107

2026年6月12日，人工智慧領域發生了一件前所未有的重大事件。美國商務部以國家安全為由，向Anthropic公司發出指令，要求其立即暫停對最新推出的Claude Fable 5和Mythos 5兩個模型的訪問。這一決定迫使Anthropic在全球範圍內關閉了這兩個模型，引發了業界對AI監管和安全性的廣泛討論。

事件起源於6月9日Anthropic公開發布Fable 5模型。Fable 5被設計為Mythos 5的“安全版本”，後者擁有目前最先進的進攻性網路安全能力，僅限小範圍政府合作伙伴和關鍵基礎設施防禦者使用。Fable 5則透過一套獨立的分類器過濾敏感請求，理論上更安全。然而，短短幾小時內，一名化名為Pliny the Liberator的研究人員就在社交媒體上聲稱成功“解放”了Fable 5。

Pliny the Liberator使用的破解方法並不涉及程式碼漏洞或逆向工程，而是透過精心設計的提示（prompt）來繞過安全分類器。具體技術包括：使用Unicode和西里爾字元替換來混淆模式識別；利用長上下文對話將在惡意意圖分散在多次互動中；將敏感請求分解為多個看似無害的子主題，然後在攻擊者端重組輸出；以及將敏感請求包裝成教育或創作場景。最令人震驚的是，他成功生成了功能性的棧緩衝區溢位漏洞利用程式碼，而這一切是在“學習OSED認證考試”的偽裝下完成的。

美國商務部的反應極為迅速。據NBC新聞、華爾街日報等媒體報道，商務部長Howard Lutnick親自簽署了給Anthropic CEO Dario Amodei的信函，援引國家安全權力將Fable 5和Mythos 5列為受出口管制的技術。這一法律框架歷史上曾用於加密演算法、武器元件等敏感技術。分析師很快將其與1990年代的加密戰爭相提並論，當時美國政府試圖限制RSA等加密演算法的出口，但最終以失敗告終。

Anthropic雖然遵守了指令，但公開表達了強烈異議。公司認為政府的理解存在偏差，所聲稱的破解方法不過是要求模型閱讀程式碼庫並修復軟體漏洞，這類功能其他公開模型早已具備。Anthropic還指出，政府僅提供了口頭證據，沒有強有力的技術演示，而且類似能力在OpenAI的GPT-5.5中無需破解即可實現。如果按照同一標準，幾乎所有主要AI提供商的前沿模型都應被關閉。

這一事件對網路安全領域具有深遠影響。首先，進攻性AI已正式進入政府監管視線。政府能在數小時內作出反應，表明其對具有潛在攻擊能力的AI模型保持高度警惕。其次，提示注入和破解攻擊已被證明是真實有效的攻擊向量，AI安全不能僅依賴對話層的內容過濾器。安全團隊必須將多輪攻擊序列、字元替換、上下文操縱等攻擊手段納入測試範圍。再次，防禦性與進攻性AI之間的界限變得模糊。Mythos 5原本是幫助防禦者發現和修復漏洞的工具，但同一能力極易被武器化。最後，此次事件開創了政府迫使商業AI公司將正在執行中的模型完全下線的先例，預示著前沿AI模型的部署將面臨越來越嚴格的監管約束。

目前，Anthropic的其他模型如Claude Opus 4.8和Haiku仍可正常使用。公司表示正在努力在政府的框架內恢復Fable 5和Mythos 5的訪問，但未給出時間表。ChatGPT和Gemini等其他平臺未受此次指令影響。

對於安全團隊而言，應立即採取行動：審計對特定AI模型和供應商的依賴，識別單點故障；將AI攻擊面納入滲透測試範圍，包括提示注入、破解和上下文操縱測試；建立獨立於模型的安全層，避免僅依賴AI自身的判斷；將AI監管風險納入風險管理框架；並模擬AI加速的攻擊場景，驗證檢測和響應能力。

這一事件表明，AI工具正變得日益強大，監管力度也在加強，使用者的責任隨之增加。如何在不扼殺創新的前提下有效管控風險，將是未來整個行業面臨的重大課題。