克勞德新模型在出錯時更加“誠實”
Anthropic 於週四釋出 Claude Opus 4.8,該模型在訓練中強調“誠實”,能夠更頻繁地標記工作中的不確定性,減少無依據的斷言。評估顯示,其程式碼缺陷遺漏率比前代降低約4倍。此外,使用者可控制任務投入的努力程度,以及引入“動態工作流”功能,支援並行執行數百個代理。
文章情報
工程師進階
要點
- Claude Opus 4.8 更傾向於在不確定時主動標識,避免做出無依據的斷言。
- 相比前代,模型在程式碼審查中遺漏缺陷的機率降低約4倍。
- 使用者可調節模型為任務付出的“努力程度”,以控制令牌消耗。
- 新增“動態工作流”功能,允許 Claude 在單會話中並行執行數百個子代理。
為什麼重要
這條新聞值得關注,因為Claude Opus 4.8 更傾向於在不確定時主動標識,避免做出無依據的斷言。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
Anthropic 於週四釋出了其最新 AI 模型 Claude Opus 4.8,並著重強調該模型的“誠實”特性。公司表示,他們訓練所有模型時都會要求其保持誠實,例如避免做出無法支援的斷言。然而,他們也承認,AI 模型普遍存在的一個問題是:有時會在證據不足的情況下倉促下結論,並自信地認為自己的工作取得了進展。
AI 實驗室聲稱,早期測試者發現 Opus 4.8“更傾向於標出其工作中存在的疑點,而較少做出無依據的斷言”。在公司內部的評估中,Opus 4.8 在程式碼審查時“遺漏缺陷的可能性比前代低了大約4倍”。
除了誠實度方面的改進,Opus 4.8 還允許使用者控制 Claude 在某個任務上投入的努力程度。高努力響應會消耗更多令牌,而低努力選項則有助於節省配額。此外,Anthropic 還以研究預覽形式推出了“動態工作流”功能,據稱能讓 Claude“承擔更大的任務”。透過動態工作流,“Claude 可以規劃工作,然後在單次會話中並行執行數百個代理(在 Opus 4.8 中,這些代理的執行時間更持久)。代理在向使用者報告之前會對其輸出進行驗證。