Anthropic釋出Claude Fable 5:效能卓越但爭議性使用政策引發討論
Anthropic正式釋出Claude Fable 5,號稱首個通用可用的Mythos級模型,在多項基準測試中創下新紀錄,尤其擅長程式設計和複雜任務。然而,其引入的“靜默降級”機制——在涉及前沿AI開發時暗中限制模型能力而不通知使用者——引發了開源社群的強烈不滿。
Anthropic於近日釋出了其備受期待的下一代模型家族,包括面向通用使用者的Claude Fable 5和受限訪問的Claude Mythos 5。Fable 5被描述為首個“通用可用的Mythos級模型”,這意味著其規模至少是此前Opus模型的兩倍。根據官方公告,Fable 5在幾乎所有測試基準上均達到最先進水平,尤其在軟體工程、知識工作、科學研究和視覺任務上表現突出。
在第三方基準測試中,Fable 5的表現令人矚目。Cursor平臺報告其在新版CurosrBench上達到72.9%的成績,比此前最好模型高出8個百分點。Cognition稱Fable 5在FrontierCode上奪得榜首,並將其整合到Devin Cloud Ultra、桌面版和CLI中。Cline報告其Terminal-Bench 2.1得分為88.0%,擊敗了GPT-5.5。Artificial Analysis的智慧指數顯示Fable 5以64.9分位列第一,領先GPT-5.5約5分。值得注意的是,Fable 5在需要長週期和高複雜度的任務上優勢尤為明顯,使用者反饋稱其適合處理需要數小時甚至更長時間的高難度工作。
然而,此次釋出的最大爭議不在效能,而在安全策略。Anthropic披露了兩項重大變化:第一,所有Mythos級模型的流量將被強制保留30天,用於安全監測;第二,對於涉及前沿LLM開發的請求(如構建預訓練流水線、分散式訓練基礎設施或ML加速器設計),Fable 5可能在不通知使用者的情況下,透過提示修改、轉向向量或引數高效微調等方法暗中降低模型效能。Anthropic估計這些干預僅影響約0.03%的流量,但社群反應強烈。許多研究人員和開發者認為,這種“靜默降級”破壞了信任,且可能被用於阻礙開源AI研究。
此外,Anthropic還引入了針對網路安全、生物和化學問題的自動回退機制——當檢測到相關敏感主題時,查詢會被透明地路由到Claude Opus 4.8。這與對LLM開發請求的隱形干預形成對比,引發了更多質疑。一些使用者報告稱,即使是簡單的生物或程式設計問題也可能被錯誤地標記或削弱能力。
儘管如此,Fable 5的生態系統整合迅速展開。它已出現在Cursor、Devin、Notion、Microsoft Foundry、GitHub Copilot、Cline、Replit等多個平臺。早期使用者報告稱,Fable 5在處理超長文件和複雜工程專案方面表現出色,例如Stripe使用它在一週內完成了5000萬行Ruby程式碼的遷移。API定價為每百萬輸入token 10美元,每百萬輸出token 50美元,上下文視窗保持100萬token。值得注意的是,Fable 5將暫時包含在Pro、Max和Team訂閱計劃中,直到6月22日,之後將切換到基於使用積分的計費模式。
總體而言,Claude Fable 5代表了AI能力的又一次飛躍,但其伴隨的安全政策卻在透明度和公平性方面引發了深刻辯論。開源社群呼籲保護開放研究環境,而Anthropic則強調這些措施是應對日益強大的模型可能帶來的風險所必需的。