我測試了Claude Fable 5:Anthropic的最新一代AI能否兑現承諾?
本文測試了Anthropic發佈的Claude Fable 5模型,該模型源自備受限制的Mythos Preview,旨在為更廣泛的用户羣體提供高級AI能力。文章介紹了Fable 5與Mythos 5的關鍵特性、基準性能、訪問方式,並通過兩個實際任務(從截圖重建Netflix界面和將手繪儀表盤轉化為現代應用)評估了其實用性。結果表明,Fable 5在理解視覺輸入、生成生產級代碼和處理複雜多步驟任務方面表現出色。Anthropic通過Fable 5和Mythos 5的區別部署,展示了在開放前沿AI能力與限制高風險應用之間的平衡策略。
Anthropic公司今年早些時候推出的Claude Mythos Preview AI模型曾引發全球關注,如今該模型已演變為兩款新產品:Claude Fable 5和Claude Mythos 5。這些模型源自高度受限的Mythos Preview,將Anthropic最先進的AI能力帶給更廣泛的受眾。Anthropic聲稱Fable 5在多個基準測試中創下了新的性能標準。本文詳細探討了這些Mythos類模型的功能、差異及訪問方式。
什麼是Claude Fable 5?
據Anthropic介紹,Fable 5在軟件工程、知識工作、視覺、科學研究和長時間運行任務方面均優於之前的Claude模型。更值得注意的是,Anthropic聲稱Fable 5的優勢隨着任務複雜度和推理時間的增加而增長。這意味着Fable 5專為涉及多步驟、大量信息和擴展上下文的工作流程而設計,例如代碼庫遷移、財務分析、複雜文檔審查、科學研究、截圖到應用生成等。與僅優化短交互不同,Fable 5旨在維持長時間、高要求工作流程中的性能和連貫性。
Claude Fable 5和Mythos 5的關鍵特性
Claude Fable 5和Claude Mythos 5的最大升級在於處理更長、更復雜任務的能力。Anthropic表示,這些模型在編碼、知識工作、視覺、記憶和科學研究方面表現強勁。測試中,Fable 5成功處理了大型編碼項目、分析了財務文檔、解讀了圖表,並憑截圖重建了應用程序。一個關鍵區別在於自主性:模型能夠在長時間工作流程中保持專注,更有效地保持上下文,並在較少指導的情況下解決多步驟問題。Mythos 5將這些能力擴展到了網絡安全、藥物發現、分子生物學和基因組學研究等領域的可信用户。
關鍵能力包括:
- 高級編碼:支持複雜軟件工程和長期開發任務。
- 更強的知識工作:擅長文檔分析、財務推理和問題解決。
- 改進的視覺理解:能理解截圖、圖表、科學圖形和UI佈局。
- 長上下文記憶:在大型輸入和擴展工作流程中保持上下文。
- 科學研究支持:在可信訪問環境中協助生物學、基因組學和藥物發現。
- 內置安全措施:對網絡安全、生物學、化學和模型蒸餾等敏感領域提供額外保護。
基準性能
Anthropic的基準測試結果顯示,Claude Fable 5和Mythos 5在多個實際AI應用領域領先,包括智能編碼、知識工作、推理、工具使用、網絡安全、生物學和健康。總體而言,這些模型在需要持續推理、廣泛上下文和有效工具使用的複雜多步驟任務上表現最強。
訪問方式
Claude Fable 5的訪問方式簡單多樣:
- Claude API:通過模型字符串claude-fable-5立即訪問。也可用於基於消費的企業計劃。
- Claude應用程序:Pro、Max、Team和基於座位的企業計劃用户在2026年6月22日前免費使用。訪問分階段推出。
- 雲平台:AWS、Google Cloud和Microsoft Foundry上可用,同時支持Claude Code和Claude平台。
- 定價:每百萬輸入令牌10美元,每百萬輸出令牌50美元。提示緩存可為輸入令牌提供90%折扣。
注意:Fable 5包含網絡安全和生物學方面的安全措施。被標記的查詢會路由到Opus 4.8,不會產生Fable費用,對用户幾乎透明。
實際測試
基準測試固然有用,但開發者更關心模型能否加速實際開發。我通過兩個任務測試了Fable 5的視覺輸入理解、生產級代碼生成和從現有設計工作的能力。
任務1:從截圖重建Netflix界面
目標:評估Fable 5的視覺理解和前端能力。
輸入:一張Netflix“新內容與流行”頁面的截圖,包含複雜導航欄、水平滾動內容輪播、內容卡片上的排名標籤、多個內容區塊、深色主題樣式、徽章和覆蓋層。
提示:將此截圖重建為可運行的HTML/CSS頁面,要求像素級準確,無框架,僅用乾淨的HTML和CSS,並實現桌面和移動端的響應式。
結果:Fable 5出色地識別了所有重要的UI組件,並創建了與Netflix網站相似的實際功能網頁。它正確識別了網頁的三個主要部分:固定導航區、水平佈局的多個垂直卡片。特別令人印象深刻的是,它很好地識別了重複模式,為每個電影卡片使用了相同的結構並保持了一致的樣式。
任務2:將手繪儀表盤草圖轉化為現代分析應用
目標:模擬實際產品工作流程,將粗略草圖轉化為精美應用。
輸入:手繪儀表盤線框圖,包含佈局指令、圖表、KPI卡片、表格、導航元素和儀表盤小部件。
提示:將此手繪儀表盤轉化為現代SaaS分析應用程序,使用React、Tailwind CSS和響應式設計原則,創建精美的圖表、現代卡片佈局、微妙動畫、適當間距和專業排版,同時保留草圖結構。
結果:Fable 5理解意圖而非複製像素。它生成了連貫的佈局,包含側邊欄導航、KPI分析卡片、數據可視化區域、管理控制、表格和客户智能組件。模型智能地填補了缺失的顏色、排版、間距和交互性。雖然某些設計選擇偏向額外樣式,可能需要為生產環境進行微調,但應用程序功能完整且視覺一致。
結論
這次發佈最值得注意的方面不僅是性能或新能力,而是訪問管理的方式。Anthropic沒有將其最強大的模型向所有人開放,而是在廣泛可用的AI和受限的前沿AI之間劃清了界限。Fable 5將大部分Mythos類智能帶給開發者、企業和Claude用户,而Mythos 5仍限於敏感領域的可信合作伙伴和研究人員。這種方法預示着未來高級AI部署方式的轉變:不僅基於能力,還基於風險和負責任訪問。對用户而言,Fable 5提供了更強的編碼、推理、視覺和研究支持。對Anthropic而言,Mythos 5測試了在不將最危險能力暴露給公眾的情況下,能否安全擴展前沿AI。