2026-05-29 21:20 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

Claude Opus 4.8：更智能的模型，正确的方向

Anthropic发布Claude Opus 4.8，重点提升可靠性、诚实性和自主工作流能力，而非单纯追求基准分数。定价保持不变，快速模式大幅降价。

来源Analytics Vidhya作者: Vasu Deo Sankrityayan

Anthropic近日发布了Claude Opus 4.8，这是其旗舰模型的最新版本。此次更新不再追求基准分数的提升，而是聚焦于可靠性、诚实性和自主工作流执行能力，标志着AI行业从“更聪明”向“更可靠”的转变。

在定价方面，Anthropic保持了与Opus 4.7相同的标准定价：每百万输入令牌5美元，每百万输出令牌25美元。但快速模式（2.5倍速度）的价格大幅降低了三倍，降至每百万输入10美元和每百万输出50美元，使得大规模自主工作流的运营成本更加可承受。

Opus 4.8的一个核心改进是“诚实性升级”。该模型经过专门训练，能够在信息不足时主动表达不确定性，而非强行给出可能错误的答案。这对于生产环境中的AI部署至关重要——优雅的失败比自信的幻觉更有价值。同时，Anthropic还推出了动态工作流（Dynamic Workflows）功能，允许Claude Code自主规划任务并在单次会话中运行数百个并行子智能体。例如，它可以执行数十万行代码的库迁移，并利用现有测试套件验证输出。此外，用户现在可以在claude.ai和Cowork上通过努力控制滑块（Effort Control slider）调节模型的处理深度：低设置响应更快，高设置则更深入思考并频繁自我纠正。

在实测中，Opus 4.8在推理、编码和战略规划任务中表现出更强的稳定性。例如，它能够正确识别投资计算中“先跌20%再涨25%”并非保本，并指出费用因素；在编码审查中，它准确诊断出线程安全问题；在规划多智能体平台迁移时，它提供了涵盖部署、风险、治理和预算的实用方案。与Opus 4.7相比，4.8版本更关注可靠性、一致性和工作流执行，不再急于给出看似聪明的答案，而是优先确保结果可靠。

总体而言，Claude Opus 4.8并非革命性更新，但代表了AI从实验走向生产的关键一步。未来AI的竞争可能不再属于最能生成漂亮回答的模型，而是属于那些能可靠执行有意义工作的系统。