AI News HubLIVE
站內改寫3 分鐘閱讀

Anthropic如何帶回Fable 5——以及何時收費

美國政府解除出口管制後,Anthropic宣佈將於7月1日重新推出Fable 5模型。但使用者需注意使用限制和額外費用。文章詳細說明了訪問許可權、定價、安全改進以及“越獄”事件的細節。

來源The New Stack AI作者: Frederic Lardinois

美國政府於週二解除對Fable 5的出口管制後,Anthropic宣佈將於週三(7月1日)重新推出該模型。現在,該公司明確了這一過程的具體安排,以及導致商務部對Claude Fable 5和Claude Mythos 5實施出口管制的“越獄”事件的更多細節。

7月1日,Fable 5將重新在Claude平臺、Claude.ai、Claude Code和Claude Cowork上向全球所有Pro、Max、Team和Enterprise計劃使用者開放。但也有一些壞訊息:到7月7日之前,訂閱計劃使用者最多可使用其每週用量限額的50%來呼叫Fable 5。之後,該模型將僅能透過使用積分訪問,其計費標準與Anthropic API計劃相同。

對於標準Enterprise使用者,Fable 5不會計入其常規配額,即使是在7月7日之前。他們將立即透過使用積分計費。不過,高階Enterprise席位有一個短暫的寬限期至7月7日,在此之前這些使用者可透過訂閱計劃使用Fable 5。

最初,Fable 5原定於6月9日至22日免費提供。

透過AWS、Google Cloud和Microsoft Foundry訪問Fable 5的開發者也很快將重新獲得訪問許可權。

在撤下Fable 5之前,Anthropic的定價為每百萬輸入tokens 10美元,每百萬輸出tokens 50美元。這一價格似乎不會改變。

根據Anthropic的說法

透過此次更新,Anthropic還公佈了導致這一切的更多細節。Anthropic確認,亞馬遜研究人員“找到了一種繞過Fable 5安全防護的方法:透過提示使其識別出大量軟體漏洞。”在一個案例中(似乎也是唯一一例),他們讓模型演示瞭如何利用該漏洞。

Anthropic表示,它與政府和合作夥伴(包括亞馬遜)合作審查了這份報告,發現其他模型(如Claude Opus 4.8、GPT-5.5和Kimi K2.7)也能發現Fable 5報告中提到的相同漏洞,並且團隊測試的每一個模型(包括Claude Haiku 4.5等基礎模型)都能找出利用該漏洞的方法。

該公司強調,“報告中的技術並未暴露任何獨特的Mythos級網路能力”,而只是剛剛觸及Fable 5安全防護的邊界。

“新的分類器意味著Amazon報告中描述的具體技術在99%以上的情況下都會被阻止。”——Anthropic。

在Fable 5下線後,Anthropic與政府合作訓練了改進的安全分類器——一種能夠檢測使用者何時要求模型產生產出有害輸出的系統——現在也能阻止這類請求。該公司實質上增加了模型會阻止的良性請求數量。

帶回Fable 5的代價:更大的安全裕度

人們不禁要問,對於表現出相同行為的其他模型這意味著什麼,但截至目前,這僅適用於Fable 5,美國政府顯然對此沒有意見。

“新的分類器意味著Amazon報告中描述的具體技術在99%以上的情況下都會被阻止,”Anthropic寫道,並指出儘管模型仍不會阻止所有低風險網路防禦能力,但應能阻止大多數有害能力。該公司表示,“我們有意將安全分類器設定為觸發一組我們知道很可能是良性的請求”,以增加安全裕度。

當Fable 5推出時,已有使用者反饋該模型會阻止甚至最無害的請求,因此在這些增強護欄的作用下,情況將如何發展還有待觀察。Anthropic在其公告中已有所暗示。

“新的分類器還會在常規編碼和除錯任務中更頻繁地標記良性請求,”該公司寫道。“與所有安全保護一樣,我們將繼續完善,以更好地區分真正的濫用和合法請求,減少誤報。”

這似乎是Anthropic為帶回Fable所付出的代價。

與之前一樣,Fable 5會將任何有問題的請求路由到Opus 4.8——Anthropic自稱也能複製Fable 5行為的模型。對此可以自由解讀,但不要告訴美國政府。

那麼,什麼是“越獄”?

由於這一切始於一個看似相對較小的問題,Anthropic也藉此公告提出了一種根據越獄為攻擊者提供的內容來評分的方法。這些標準包括越獄解鎖的能力增益、該能力增益適用的不同進攻性網路安全任務數量、越獄武器化的難易程度以及發現和獲取該技術的難易程度。

該公司承認這是一個進展中的工作,目前尚不清楚如何對這些標準進行評分和權衡。

為了監控自己的模型,Anthropic正在組建一個團隊,將全天候監控其越獄提交通道。它還在HackerOne上啟動了一個新專案,供研究人員提交潛在漏洞。

與華盛頓保持良好關係

至於美國政府,Anthropic表示將繼續與網路總監辦公室、科技政策辦公室、財政部和商務部等機構合作,重點關注白宮在《促進人工智慧創新和安全行政令》中建立的框架。

“我們希望這種合作,以及我們提出的行業共識框架,將成為全行業系統規則的基礎——甚至為有效協調全球在人工智慧風險和收益方面的行動提供模板,”Anthropic寫道,並表示希望這些規則能“被納入強有力的監管,並平等適用於所有前沿模型開發者。”

當然,Anthropic長期以來一直是人工智慧安全法規的倡導者,這一點並不令人意外。不過,該公司呼籲這些規則也適用於其競爭對手,這絕非巧合。