2026-05-29 01:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

克劳德新模型在出错时更加“诚实”

Anthropic 于周四发布 Claude Opus 4.8，该模型在训练中强调“诚实”，能够更频繁地标记工作中的不确定性，减少无依据的断言。评估显示，其代码缺陷遗漏率比前代降低约4倍。此外，用户可控制任务投入的努力程度，以及引入“动态工作流”功能，支持并行运行数百个代理。

来源The Verge AI作者: Jay Peters

Anthropic 于周四发布了其最新 AI 模型 Claude Opus 4.8，并着重强调该模型的“诚实”特性。公司表示，他们训练所有模型时都会要求其保持诚实，例如避免做出无法支持的断言。然而，他们也承认，AI 模型普遍存在的一个问题是：有时会在证据不足的情况下仓促下结论，并自信地认为自己的工作取得了进展。

AI 实验室声称，早期测试者发现 Opus 4.8“更倾向于标出其工作中存在的疑点，而较少做出无依据的断言”。在公司内部的评估中，Opus 4.8 在代码审查时“遗漏缺陷的可能性比前代低了大约4倍”。

除了诚实度方面的改进，Opus 4.8 还允许用户控制 Claude 在某个任务上投入的努力程度。高努力响应会消耗更多令牌，而低努力选项则有助于节省配额。此外，Anthropic 还以研究预览形式推出了“动态工作流”功能，据称能让 Claude“承担更大的任务”。通过动态工作流，“Claude 可以规划工作，然后在单次会话中并行运行数百个代理（在 Opus 4.8 中，这些代理的运行时间更持久）。代理在向用户报告之前会对其输出进行验证。