2026-05-29 05:20 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

Anthropic發佈Claude Opus 4.8：性能超越GPT-5.5，堪稱“適度但實實在在的進步”

Anthropic推出Claude Opus 4.8，該模型在多數基準測試中擊敗了GPT-5.5和Gemini 3.1 Pro，並且識別自身編碼錯誤的頻率是前代模型的四倍。同時，Anthropic還引入了動態工作流功能，可啓動數百個並行子代理處理代碼庫遷移等任務。

來源The Decoder作者: Matthias Bastian

Anthropic近日發佈了其最新AI模型Claude Opus 4.8，公司將其描述為一次“適度但實實在在的進步”。在多項基準測試中，該模型的表現超越了OpenAI的GPT-5.5和Google的Gemini 3.1 Pro，特別是在編碼和邏輯推理任務上展現出顯著優勢。

Claude Opus 4.8在自我糾錯能力上也有重大提升，它發現並修復自身編碼錯誤的頻率是前代模型的四倍。這一進步對於依賴AI輔助編程的開發團隊來説尤為重要，可以大幅減少人工審查的工作量。

此外，Anthropic還推出了一項名為“動態工作流”的新功能，允許用户創建數百個並行運行的子代理，以協同處理大型任務，例如跨整個代碼庫的遷移或重構。這些子代理可以獨立執行子任務，並實時同步進度，從而顯著提升複雜項目的處理效率。

Claude Opus 4.8目前已通過Anthropic的API開放使用，同時也在其官方聊天平台中提供。公司表示，將繼續優化模型性能，並計劃在未來版本中引入更多企業級功能。