克劳德新模型在出错时更加“诚实”
Anthropic 于周四发布 Claude Opus 4.8,该模型在训练中强调“诚实”,能够更频繁地标记工作中的不确定性,减少无依据的断言。评估显示,其代码缺陷遗漏率比前代降低约4倍。此外,用户可控制任务投入的努力程度,以及引入“动态工作流”功能,支持并行运行数百个代理。
文章情报
工程师进阶
要点
- Claude Opus 4.8 更倾向于在不确定时主动标识,避免做出无依据的断言。
- 相比前代,模型在代码审查中遗漏缺陷的概率降低约4倍。
- 用户可调节模型为任务付出的“努力程度”,以控制令牌消耗。
- 新增“动态工作流”功能,允许 Claude 在单会话中并行运行数百个子代理。
为什么重要
这条新闻值得关注,因为Claude Opus 4.8 更倾向于在不确定时主动标识,避免做出无依据的断言。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
Anthropic 于周四发布了其最新 AI 模型 Claude Opus 4.8,并着重强调该模型的“诚实”特性。公司表示,他们训练所有模型时都会要求其保持诚实,例如避免做出无法支持的断言。然而,他们也承认,AI 模型普遍存在的一个问题是:有时会在证据不足的情况下仓促下结论,并自信地认为自己的工作取得了进展。
AI 实验室声称,早期测试者发现 Opus 4.8“更倾向于标出其工作中存在的疑点,而较少做出无依据的断言”。在公司内部的评估中,Opus 4.8 在代码审查时“遗漏缺陷的可能性比前代低了大约4倍”。
除了诚实度方面的改进,Opus 4.8 还允许用户控制 Claude 在某个任务上投入的努力程度。高努力响应会消耗更多令牌,而低努力选项则有助于节省配额。此外,Anthropic 还以研究预览形式推出了“动态工作流”功能,据称能让 Claude“承担更大的任务”。通过动态工作流,“Claude 可以规划工作,然后在单次会话中并行运行数百个代理(在 Opus 4.8 中,这些代理的运行时间更持久)。代理在向用户报告之前会对其输出进行验证。