AI News HubLIVE
站內改寫3 分鐘閱讀

Anthropic於7月1日重新部署Claude Fable 5,美國出口管制解除後新增網路安全分類器

Anthropic宣佈將於7月1日重新部署其最強大的通用模型Claude Fable 5,此前美國出口管制已解除。新增的安全分類器能以超過99%的準確率阻止報告中提到的技術,並將被阻止的請求路由至Opus 4.8。Anthropic還與亞馬遜、微軟和谷歌共同提出了一個四準則越獄嚴重性框架。

來源MarkTechPost作者: Michal Sutter

Anthropic正在重新部署其最強大的通用模型Claude Fable 5。6月30日,該公司宣佈美國出口管制已解除。這些管制此前覆蓋了Claude Fable 5和Claude Mythos 5。Fable 5於7月1日(週三)重新向全球使用者開放,而Mythos 5的訪問許可權則恢復給一組美國組織。

這些模型於6月12日被暫停使用。美國政府的一項指令將其限制為非外國公民使用。Anthropic無法即時驗證國籍,因此暫時中止了這兩個模型對所有人的訪問。本文解釋了觸發該限制的原因,介紹了新的安全保障措施和提出的越獄框架,並展示了Fable 5與GLM-5.2等競爭對手的比較。

快速事實

  • 模型:Claude Fable 5(一個為通用使用而安全化的Mythos級模型)
  • 事件:2026年7月1日出口管制解除後重新部署
  • 暫停原因:亞馬遜的一份關於安全繞過技術的報告
  • 修復:新的安全分類器可阻止報告中提到的技術
  • 定價:每百萬輸入令牌10美元,每百萬輸出令牌50美元
  • 可用平臺:Claude Platform、Claude.ai、Claude Code、Claude Cowork

事件時間線 Anthropic於6月9日釋出了Fable 5和Mythos 5。兩者共享相同的底層模型。Fable 5帶有強大的通用安全措施,而Mythos 5則為防禦性網路安全合作伙伴解除了一些安全限制。6月12日,美國政府實施出口管制,命令立即生效。Anthropic為避免違規風險暫停了訪問。觸發這一事件的是亞馬遜研究人員的一份報告,他們發現了一種繞過Fable 5安全措施的方法。該提示使模型識別大量軟體漏洞,並在一例中生成了利用某個漏洞的程式碼。到6月26日,政府批准Mythos 5恢復對部分美國組織的訪問。6月30日,管制全面解除。

Anthropic為何稱該發現並非獨有 Anthropic測試了該發現是否僅適用於Fable 5。結果並非如此。能力較弱的模型也識別出了相同的漏洞,包括Claude Opus 4.8、GPT-5.5和Kimi K2.7。對於單個漏洞利用演示,所有測試的模型(包括Haiku 4.5、Sonnet 4.6、Opus 4.6、4.7、4.8、GPT-5.4、5.5和Kimi K2.7)都重現了它。Anthropic團隊表示,該技術並未暴露任何獨特的Mythos級網路能力,他們認為此案例對於Fable 5的安全措施而言屬於邊緣情況,所涉及的行為僅為常規的防禦性網路安全工作。

新分類器的工作原理 Anthropic仍然採取了措施來彌補這一漏洞。他們訓練了一個改進的安全分類器,專門針對報告中的行為。該分類器在超過99%的情況下能阻止特定技術。被阻止的請求不會被直接拒絕,而是被路由到Claude Opus 4.8,使用者會收到回退通知。商務部CAISI的研究人員測試了新舊安全措施,他們一致認為安全措施極為強大,但代價是在常規編碼和除錯過程中會出現更多誤報。這反映了Anthropic的“深度防禦”設計:分類器是檢測有害網路任務的較小AI系統,而故意的“安全餘量”也會阻止一些良性請求。Fable 5的安全餘量比之前的模型大得多。

提出的越獄嚴重性框架 這一事件暴露了一個空白:行業缺乏評估“越獄”(繞過模型安全措施的技術)的共享標準。Anthropic正在與亞馬遜、微軟、谷歌和其他Glasswing合作伙伴共同起草一個框架。該草案基於四個標準對越獄進行評分:能力增益(使用者超出現有工具的程度)、能力增益廣度(解鎖的獨立攻擊任務數量)、武器化難度(攻擊仍需的人工工作)、可發現性(獲取技術的難易程度)。對於最嚴重的類別,Anthropic將立即部署初步緩解措施,並設立24/7監控越獄提交渠道。

用例與示例 Fable 5專注於長週期、代理型工作。早期工程師可將其應用於程式碼庫遷移(Stripe報告一天內完成5000萬行Ruby程式碼庫的遷移,手工需兩個月)、金融分析(在Hebbia金融基準測試中得分最高)、視覺轉程式碼(從截圖重建Web應用原始碼)以及長執行代理(基於檔案的記憶使其能在數百萬令牌上保持專注)。

Fable 5對比 暫停期間,競爭對手出現了。在暫停後的幾天裡,智譜AI以開放權重發布了GLM-5.2。獨立測試者將其評為最強的開放權重模型。GLM-5.2採用混合專家設計,總計約7500億引數,每個令牌僅啟用約400億。在Semgrep的IDOR基準測試中,其F1得分為39%,高於Claude Code的32%。成本方面,在AA-Briefcase上,Fable 5平均每任務31美元,而GLM-5.2僅為2.40美元。

訪問與快速API示例 對於Pro、Max、Team和部分Enterprise計劃,Fable 5在7月7日前免費包含,覆蓋周使用限額的50%。之後將轉為使用點數。Anthropic還將在AWS、Google Cloud和Microsoft Foundry上重新啟用Fable 5。開發者可使用字串"claude-fable-5"呼叫模型。如果分類器觸發,響應將來自Opus 4.8,但程式碼路徑保持不變。

要點總結

  • Fable 5於7月1日在出口管制解除後迴歸。
  • 新分類器在超過99%的情況下阻止報告中的繞過方法。
  • 被阻止的請求路由至Opus 4.8,而非直接拒絕。
  • Anthropic提出四準則越獄評分框架。
  • 暫停期間,GLM-5.2作為更便宜的開源競爭對手出現。