Fable迴歸:這一安全機制中融入了AI元素
Anthropic在經歷出口限制後重新部署Fable 5模型,但新版本引入了更嚴格的安全分類器,導致更多良性請求被攔截,尤其在編程任務中。美國政府獲得模型預發佈訪問權和專用計算資源,標誌着AI行業向國家管控方向轉變。
Anthropic於2026年7月1日重新上線了其前沿模型Fable 5。此前,該模型因亞馬遜研究人員發現的一種越獄方法而被美國政府實施出口限制。現在,Fable 5以更嚴格的安全措施迴歸,但用户將面臨更多限制,特別是在編程等任務中。
Anthropic在博客中表示,新的安全分類器經過了與政府合作的改進,旨在攔截報告中描述的特定越獄行為。然而,這種改進是以誤報增加為代價的。Anthropic承認,在日常編程和調試任務中,更多良性請求會被標記為危險並轉交給較弱的Opus 4.8模型處理。公司將此描述為“安全邊際”的擴大,即請求必須看起來非常安全才能避免觸發分類器。
這一變化引發了擔憂。Fable 5最初發布時就因過度敏感而受到批評,如今的新版本似乎進一步加劇了這一問題。對於依賴前沿模型進行復雜實驗的用户來説,這種限制可能使有效能力停留在低一級模型水平。Anthropic承諾將繼續優化分類器以區分真正濫用和合法請求,但作者指出,在當前的監管框架下,完全開放的模型可能永遠不會再現。
此次重新部署還伴隨着政府角色的明確加強。Anthropic與美國商務部、國家網絡總監辦公室等多個機構密切合作,並承諾為未來的模型提供預發佈政府訪問和評估。此外,Anthropic將設立專門的團隊和計算資源用於聯合研究。美國商務部長霍華德·盧特尼克在信中指出,這些協議將適用於所有未來的模型,且政府保留根據情況變化重新評估限制的權利。
作者阿爾貝託·羅梅羅認為,這一事件表面上是針對一個可復現的越獄漏洞,實則為政府全面掌控AI行業鋪平了道路。他寫道:“這是AI將變得最糟糕的時刻,也是AI將變得最自由的時刻。”未來,更強的模型能力可能意味着更嚴格的安全措施和更少的用户自主權,而政府與AI公司之間的捆綁將日益緊密。
具體而言,Fable 5的新版本僅允許用户使用每週配額中50%的令牌訪問該模型,而此前為100%。Anthropic解釋這是出於安全考慮,但作者推測真正原因是計算資源不足。此外,安全分類器在編程任務中的誤報率顯著升高,許多原本合理的請求被拒絕。作者質疑,如果前沿模型的能力被限制在較低水平,那麼AI能力前沿實際上被封頂在Opus 4.8或GPT-5.5級別。
政府方面,美國商務部明確表示將審查未來所有模型的發佈,並有權在情況變化時重新施加許可要求。這一協議不僅涉及Fable,還涵蓋Anthropic未來的所有模型。作者認為,這標誌着美國政府對AI行業控制的開端,也是用户自由使用AI的終結。他警告説,隨着模型能力的提升,安全限制將更加嚴格,用户將失去對AI的自主權。