2026-06-09站内改写2 分鐘閱讀更新: 2026-06-12

Claude Fable 5 初印象

Anthropic 發佈了 Claude Fable 5 和 Mythos 5，Fable 5 在性能與 Mythos 5 相當的基礎上增加了更嚴格的安全護欄，擁有 100 萬 token 的上下文窗口和 12.8 萬 token 的輸出能力，定價為 Opus 4.8 的兩倍。作者 Simon Willison 在 5.5 小時的測試中發現，該模型知識淵博、能力強大，在代碼生成和複雜任務處理上表現出色，但也伴隨着高昂的費用和較慢的速度。Fable 5 成功將 micropython-wasm 升級為完整 Python 沙箱，併為 Datasette Agent 和 LLM 庫實現了工具調用的暫停-恢復機制。作者當天消耗了 110.42 美元的 token。

來源Simon Willison's Weblog

Anthropic 於 2026 年 6 月 9 日發佈了其最新旗艦模型 Claude Fable 5 及其無安全限制版本 Claude Mythos 5。知名開發者 Simon Willison 在第一時間對 Fable 5 進行了約 5.5 小時的深度測試，並給出了“猛獸”般的評價。

Fable 5 與 Mythos 5 共享核心能力，但前者內置了更為嚴格的安全護欄，以防止模型被用於有害目的。這些護欄觸發頻率較高，因此 Claude API 新增了通知機制，甚至允許用户在請求被拒絕時自動回退到其他模型。兩款模型均擁有 100 萬 token 的上下文窗口和 12.8 萬 token 的最大輸出能力，知識截止日期為 2026 年 1 月。定價方面，Fable 5 是 Opus 4.8 系列的兩倍：輸入 token 每百萬 10 美元，輸出 token 每百萬 50 美元，且長上下文使用不加價。

Willison 通過對比測試發現，Fable 5 在知識廣度上遠超 Opus 4.8。當他詢問“列出所有 Simon Willison 的開源項目”時（故意拼錯名），Opus 4.8 謹慎地列出了幾個主要項目，而 Fable 5 不僅糾正了拼寫錯誤，還給出了更全面、更精確的列表，涵蓋從 Django 到最近的小工具，並註明了大致發佈日期。Willison 表示，雖然曾經認為模型的知識儲備並不重要，但 Fable 5 的表現暗示了其參數規模可能非常大，甚至可能是目前最大的模型之一。

在代碼能力方面，Fable 5 展現出了驚人的實用性。Willison 要求它將他之前發佈的 micropython-wasm 庫（基於 WebAssembly 的 MicroPython 沙箱）升級為完整 Python 版本。Fable 5 迅速識別出可以使用 Brett Cannon 的 cpython-wasi-build 構建，儘管因環境限制無法直接下載，但在用户上傳所需文件後，它經過數分鐘的處理就成功生成了一個 13.9MB 的 Python WASM 輪子文件，用户可通過 uv 命令直接運行完整 Python 代碼。

更令人印象深刻的是，Fable 5 在輔助開發 Datasette Agent 和 LLM 庫時展現了強大的工程能力。Willison 原本計劃為 Datasette Agent 添加工具調用中途暫停並請求用户批准的功能，Fable 5 不僅完成了這一需求，還主動識別並實現了 LLM 庫中的四個相關改進，包括為工具調用提供唯一 ID、引入 PauseChain 異常以乾淨地暫停調用鏈、支持從歷史記錄中恢復掛起的工具調用等。這些改進最終構成了 LLM 0.32a3 版本，且絕大部分代碼、測試和文檔均由 Fable 5 生成。Willison 稱讚其 API 設計、代碼質量和文檔水平令人印象深刻，數小時的工作量相當於數天的開發成果。

然而，強大的能力也有代價。Willison 使用 AgentsView 工具追蹤了當天的 token 消耗，發現總共用掉了 110.42 美元的 token（全部來自其 100 美元/月的訂閲計劃）。其中絕大部分（89.9%）用於 Datasette Agent 項目。此外，Fable 5 的推理速度較慢，且生成質量與思考努力等級相關——在生成“騎自行車的鵜鶘”SVG 圖像測試中，最高思考等級（max）輸出 14,430 個 token，花費 72.175 美分，而中等思考等級反而比高等級消耗更多 token。

總體而言，Claude Fable 5 是一款兼具強大知識儲備和出色工程能力的旗艦模型，在複雜編程和智能代理任務上表現卓越，但其高昂的成本和較慢的速度也值得關注。Anthropic 尚未公佈模型參數規模，但所有跡象都表明這可能是有史以來最大的模型之一。