AI News HubLIVE
站內改寫2 分鐘閱讀

Claude Sonnet 5 釋出:新一代智慧體模型,效能接近Opus 4.8,價格更低

Anthropic釋出Claude Sonnet 5,這是迄今最具代理能力的Sonnet模型。它在推理、工具使用、編碼和知識工作方面顯著優於前代Sonnet 4.6,效能接近Opus 4.8但價格更低。即日起在所有計劃中可用,並推出限時優惠價格。

Anthropic今日釋出了Claude Sonnet 5,這是其Sonnet系列中最具代理能力的模型。該模型能夠自主制定計劃、使用瀏覽器和終端等工具,並以自主執行的方式完成複雜任務——就在幾個月前,這些能力還需要更大、更昂貴的模型才能實現。

對於許多開發者來說,代理式AI時代始於Sonnet級別的模型:Claude Sonnet 3.5、3.6和3.7是最早在編碼和工具使用方面展現出色技能的模型。然而,最近代理能力最明顯的提升出現在Opus級別的模型中。Sonnet 5縮小了這一差距:其效能接近Opus 4.8,但價格更低。它在前代Sonnet 4.6的基礎上,在推理、工具使用、編碼和知識工作等關鍵代理效能方面有了實質性改進。

早期訪問合作伙伴的反饋一致表明,Sonnet 5比其前代更具代理能力。測試者描述了它如何完成複雜任務——以前的Sonnet模型會在中途停止,它會主動檢查自己的輸出而無需明確要求,並且以極具吸引力的價格完成所有代理工作。

在安全評估方面,Sonnet 5整體不良行為率低於Sonnet 4.6,在代理安全性上能更好地拒絕惡意請求和抵禦提示注入攻擊。它也表現出更低的幻覺和諂媚率。但在自動化行為審計中,Sonnet 5的不良行為率略高於Opus 4.8和Claude Mythos Preview。值得注意的是,Sonnet 5在網路安全任務上的能力遠低於當前Opus模型,因此Anthropic預設啟用了網路安全防護措施。

從今天起,Claude Sonnet 5可在所有計劃中使用:它是免費版和Pro版的預設模型,Max、Team和企業版使用者也可使用。它也適用於Claude Code和Claude平臺,推出限時優惠價格:輸入令牌每百萬$2,輸出令牌每百萬$10,有效期至2026年8月31日。之後標準價格為輸入令牌每百萬$3,輸出令牌每百萬$15。開發者可透過Claude API使用claude-sonnet-5。

Anthropic還提高了跨Chat、Cowork、Claude Code和Claude平臺的速率限制,以適應更高努力級別帶來的更高令牌使用量。使用者可以根據專案需求選擇合適的級別。

完整的安全評估和基準測試結果可在Claude Sonnet 5系統卡中檢視。