2026-07-02 04:41 UTC+8站內改寫3 分鐘閱讀更新: 2026-07-02 05:03 UTC+8

Anthropic於7月1日重新部署Claude Fable 5，美國出口管制解除後新增網路安全分類器

Anthropic宣佈將於7月1日重新部署其最強大的通用模型Claude Fable 5，此前美國出口管制已解除。新增的安全分類器能以超過99%的準確率阻止報告中提到的技術，並將被阻止的請求路由至Opus 4.8。Anthropic還與亞馬遜、微軟和谷歌共同提出了一個四準則越獄嚴重性框架。

來源MarkTechPost作者: Michal Sutter

Anthropic正在重新部署其最強大的通用模型Claude Fable 5。6月30日，該公司宣佈美國出口管制已解除。這些管制此前覆蓋了Claude Fable 5和Claude Mythos 5。Fable 5於7月1日（週三）重新向全球使用者開放，而Mythos 5的訪問許可權則恢復給一組美國組織。

這些模型於6月12日被暫停使用。美國政府的一項指令將其限制為非外國公民使用。Anthropic無法即時驗證國籍，因此暫時中止了這兩個模型對所有人的訪問。本文解釋了觸發該限制的原因，介紹了新的安全保障措施和提出的越獄框架，並展示了Fable 5與GLM-5.2等競爭對手的比較。

快速事實

模型：Claude Fable 5（一個為通用使用而安全化的Mythos級模型）
事件：2026年7月1日出口管制解除後重新部署
暫停原因：亞馬遜的一份關於安全繞過技術的報告
修復：新的安全分類器可阻止報告中提到的技術
定價：每百萬輸入令牌10美元，每百萬輸出令牌50美元
可用平臺：Claude Platform、Claude.ai、Claude Code、Claude Cowork

事件時間線 Anthropic於6月9日釋出了Fable 5和Mythos 5。兩者共享相同的底層模型。Fable 5帶有強大的通用安全措施，而Mythos 5則為防禦性網路安全合作伙伴解除了一些安全限制。6月12日，美國政府實施出口管制，命令立即生效。Anthropic為避免違規風險暫停了訪問。觸發這一事件的是亞馬遜研究人員的一份報告，他們發現了一種繞過Fable 5安全措施的方法。該提示使模型識別大量軟體漏洞，並在一例中生成了利用某個漏洞的程式碼。到6月26日，政府批准Mythos 5恢復對部分美國組織的訪問。6月30日，管制全面解除。

Anthropic為何稱該發現並非獨有 Anthropic測試了該發現是否僅適用於Fable 5。結果並非如此。能力較弱的模型也識別出了相同的漏洞，包括Claude Opus 4.8、GPT-5.5和Kimi K2.7。對於單個漏洞利用演示，所有測試的模型（包括Haiku 4.5、Sonnet 4.6、Opus 4.6、4.7、4.8、GPT-5.4、5.5和Kimi K2.7）都重現了它。Anthropic團隊表示，該技術並未暴露任何獨特的Mythos級網路能力，他們認為此案例對於Fable 5的安全措施而言屬於邊緣情況，所涉及的行為僅為常規的防禦性網路安全工作。

新分類器的工作原理 Anthropic仍然採取了措施來彌補這一漏洞。他們訓練了一個改進的安全分類器，專門針對報告中的行為。該分類器在超過99%的情況下能阻止特定技術。被阻止的請求不會被直接拒絕，而是被路由到Claude Opus 4.8，使用者會收到回退通知。商務部CAISI的研究人員測試了新舊安全措施，他們一致認為安全措施極為強大，但代價是在常規編碼和除錯過程中會出現更多誤報。這反映了Anthropic的“深度防禦”設計：分類器是檢測有害網路任務的較小AI系統，而故意的“安全餘量”也會阻止一些良性請求。Fable 5的安全餘量比之前的模型大得多。

提出的越獄嚴重性框架 這一事件暴露了一個空白：行業缺乏評估“越獄”（繞過模型安全措施的技術）的共享標準。Anthropic正在與亞馬遜、微軟、谷歌和其他Glasswing合作伙伴共同起草一個框架。該草案基於四個標準對越獄進行評分：能力增益（使用者超出現有工具的程度）、能力增益廣度（解鎖的獨立攻擊任務數量）、武器化難度（攻擊仍需的人工工作）、可發現性（獲取技術的難易程度）。對於最嚴重的類別，Anthropic將立即部署初步緩解措施，並設立24/7監控越獄提交渠道。

用例與示例 Fable 5專注於長週期、代理型工作。早期工程師可將其應用於程式碼庫遷移（Stripe報告一天內完成5000萬行Ruby程式碼庫的遷移，手工需兩個月）、金融分析（在Hebbia金融基準測試中得分最高）、視覺轉程式碼（從截圖重建Web應用原始碼）以及長執行代理（基於檔案的記憶使其能在數百萬令牌上保持專注）。

Fable 5對比 暫停期間，競爭對手出現了。在暫停後的幾天裡，智譜AI以開放權重發布了GLM-5.2。獨立測試者將其評為最強的開放權重模型。GLM-5.2採用混合專家設計，總計約7500億引數，每個令牌僅啟用約400億。在Semgrep的IDOR基準測試中，其F1得分為39%，高於Claude Code的32%。成本方面，在AA-Briefcase上，Fable 5平均每任務31美元，而GLM-5.2僅為2.40美元。

訪問與快速API示例 對於Pro、Max、Team和部分Enterprise計劃，Fable 5在7月7日前免費包含，覆蓋周使用限額的50%。之後將轉為使用點數。Anthropic還將在AWS、Google Cloud和Microsoft Foundry上重新啟用Fable 5。開發者可使用字串"claude-fable-5"呼叫模型。如果分類器觸發，響應將來自Opus 4.8，但程式碼路徑保持不變。

要點總結

Fable 5於7月1日在出口管制解除後迴歸。
新分類器在超過99%的情況下阻止報告中的繞過方法。
被阻止的請求路由至Opus 4.8，而非直接拒絕。
Anthropic提出四準則越獄評分框架。
暫停期間，GLM-5.2作為更便宜的開源競爭對手出現。