AI News HubLIVE
站内改写2 分钟阅读

Claude Sonnet 5 发布:新一代智能体模型,性能接近Opus 4.8,价格更低

Anthropic发布Claude Sonnet 5,这是迄今最具代理能力的Sonnet模型。它在推理、工具使用、编码和知识工作方面显著优于前代Sonnet 4.6,性能接近Opus 4.8但价格更低。即日起在所有计划中可用,并推出限时优惠价格。

Anthropic今日发布了Claude Sonnet 5,这是其Sonnet系列中最具代理能力的模型。该模型能够自主制定计划、使用浏览器和终端等工具,并以自主运行的方式完成复杂任务——就在几个月前,这些能力还需要更大、更昂贵的模型才能实现。

对于许多开发者来说,代理式AI时代始于Sonnet级别的模型:Claude Sonnet 3.5、3.6和3.7是最早在编码和工具使用方面展现出色技能的模型。然而,最近代理能力最明显的提升出现在Opus级别的模型中。Sonnet 5缩小了这一差距:其性能接近Opus 4.8,但价格更低。它在前代Sonnet 4.6的基础上,在推理、工具使用、编码和知识工作等关键代理性能方面有了实质性改进。

早期访问合作伙伴的反馈一致表明,Sonnet 5比其前代更具代理能力。测试者描述了它如何完成复杂任务——以前的Sonnet模型会在中途停止,它会主动检查自己的输出而无需明确要求,并且以极具吸引力的价格完成所有代理工作。

在安全评估方面,Sonnet 5整体不良行为率低于Sonnet 4.6,在代理安全性上能更好地拒绝恶意请求和抵御提示注入攻击。它也表现出更低的幻觉和谄媚率。但在自动化行为审计中,Sonnet 5的不良行为率略高于Opus 4.8和Claude Mythos Preview。值得注意的是,Sonnet 5在网络安全任务上的能力远低于当前Opus模型,因此Anthropic默认启用了网络安全防护措施。

从今天起,Claude Sonnet 5可在所有计划中使用:它是免费版和Pro版的默认模型,Max、Team和企业版用户也可使用。它也适用于Claude Code和Claude平台,推出限时优惠价格:输入令牌每百万$2,输出令牌每百万$10,有效期至2026年8月31日。之后标准价格为输入令牌每百万$3,输出令牌每百万$15。开发者可通过Claude API使用claude-sonnet-5。

Anthropic还提高了跨Chat、Cowork、Claude Code和Claude平台的速率限制,以适应更高努力级别带来的更高令牌使用量。用户可以根据项目需求选择合适的级别。

完整的安全评估和基准测试结果可在Claude Sonnet 5系统卡中查看。