Claude Fable 5 初印象
Anthropic 發佈了 Claude Fable 5 和 Mythos 5,Fable 5 在性能與 Mythos 5 相當的基礎上增加了更嚴格的安全護欄,擁有 100 萬 token 的上下文窗口和 12.8 萬 token 的輸出能力,定價為 Opus 4.8 的兩倍。作者 Simon Willison 在 5.5 小時的測試中發現,該模型知識淵博、能力強大,在代碼生成和複雜任務處理上表現出色,但也伴隨着高昂的費用和較慢的速度。Fable 5 成功將 micropython-wasm 升級為完整 Python 沙箱,併為 Datasette Agent 和 LLM 庫實現了工具調用的暫停-恢復機制。作者當天消耗了 110.42 美元的 token。
Anthropic 於 2026 年 6 月 9 日發佈了其最新旗艦模型 Claude Fable 5 及其無安全限制版本 Claude Mythos 5。知名開發者 Simon Willison 在第一時間對 Fable 5 進行了約 5.5 小時的深度測試,並給出了“猛獸”般的評價。
Fable 5 與 Mythos 5 共享核心能力,但前者內置了更為嚴格的安全護欄,以防止模型被用於有害目的。這些護欄觸發頻率較高,因此 Claude API 新增了通知機制,甚至允許用户在請求被拒絕時自動回退到其他模型。兩款模型均擁有 100 萬 token 的上下文窗口和 12.8 萬 token 的最大輸出能力,知識截止日期為 2026 年 1 月。定價方面,Fable 5 是 Opus 4.8 系列的兩倍:輸入 token 每百萬 10 美元,輸出 token 每百萬 50 美元,且長上下文使用不加價。
Willison 通過對比測試發現,Fable 5 在知識廣度上遠超 Opus 4.8。當他詢問“列出所有 Simon Willison 的開源項目”時(故意拼錯名),Opus 4.8 謹慎地列出了幾個主要項目,而 Fable 5 不僅糾正了拼寫錯誤,還給出了更全面、更精確的列表,涵蓋從 Django 到最近的小工具,並註明了大致發佈日期。Willison 表示,雖然曾經認為模型的知識儲備並不重要,但 Fable 5 的表現暗示了其參數規模可能非常大,甚至可能是目前最大的模型之一。
在代碼能力方面,Fable 5 展現出了驚人的實用性。Willison 要求它將他之前發佈的 micropython-wasm 庫(基於 WebAssembly 的 MicroPython 沙箱)升級為完整 Python 版本。Fable 5 迅速識別出可以使用 Brett Cannon 的 cpython-wasi-build 構建,儘管因環境限制無法直接下載,但在用户上傳所需文件後,它經過數分鐘的處理就成功生成了一個 13.9MB 的 Python WASM 輪子文件,用户可通過 uv 命令直接運行完整 Python 代碼。
更令人印象深刻的是,Fable 5 在輔助開發 Datasette Agent 和 LLM 庫時展現了強大的工程能力。Willison 原本計劃為 Datasette Agent 添加工具調用中途暫停並請求用户批准的功能,Fable 5 不僅完成了這一需求,還主動識別並實現了 LLM 庫中的四個相關改進,包括為工具調用提供唯一 ID、引入 PauseChain 異常以乾淨地暫停調用鏈、支持從歷史記錄中恢復掛起的工具調用等。這些改進最終構成了 LLM 0.32a3 版本,且絕大部分代碼、測試和文檔均由 Fable 5 生成。Willison 稱讚其 API 設計、代碼質量和文檔水平令人印象深刻,數小時的工作量相當於數天的開發成果。
然而,強大的能力也有代價。Willison 使用 AgentsView 工具追蹤了當天的 token 消耗,發現總共用掉了 110.42 美元的 token(全部來自其 100 美元/月的訂閲計劃)。其中絕大部分(89.9%)用於 Datasette Agent 項目。此外,Fable 5 的推理速度較慢,且生成質量與思考努力等級相關——在生成“騎自行車的鵜鶘”SVG 圖像測試中,最高思考等級(max)輸出 14,430 個 token,花費 72.175 美分,而中等思考等級反而比高等級消耗更多 token。
總體而言,Claude Fable 5 是一款兼具強大知識儲備和出色工程能力的旗艦模型,在複雜編程和智能代理任務上表現卓越,但其高昂的成本和較慢的速度也值得關注。Anthropic 尚未公佈模型參數規模,但所有跡象都表明這可能是有史以來最大的模型之一。