2026-05-29 01:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

克勞德新模型在出錯時更加“誠實”

Anthropic 於週四釋出 Claude Opus 4.8，該模型在訓練中強調“誠實”，能夠更頻繁地標記工作中的不確定性，減少無依據的斷言。評估顯示，其程式碼缺陷遺漏率比前代降低約4倍。此外，使用者可控制任務投入的努力程度，以及引入“動態工作流”功能，支援並行執行數百個代理。

來源The Verge AI作者: Jay Peters

Anthropic 於週四釋出了其最新 AI 模型 Claude Opus 4.8，並著重強調該模型的“誠實”特性。公司表示，他們訓練所有模型時都會要求其保持誠實，例如避免做出無法支援的斷言。然而，他們也承認，AI 模型普遍存在的一個問題是：有時會在證據不足的情況下倉促下結論，並自信地認為自己的工作取得了進展。

AI 實驗室聲稱，早期測試者發現 Opus 4.8“更傾向於標出其工作中存在的疑點，而較少做出無依據的斷言”。在公司內部的評估中，Opus 4.8 在程式碼審查時“遺漏缺陷的可能性比前代低了大約4倍”。

除了誠實度方面的改進，Opus 4.8 還允許使用者控制 Claude 在某個任務上投入的努力程度。高努力響應會消耗更多令牌，而低努力選項則有助於節省配額。此外，Anthropic 還以研究預覽形式推出了“動態工作流”功能，據稱能讓 Claude“承擔更大的任務”。透過動態工作流，“Claude 可以規劃工作，然後在單次會話中並行執行數百個代理（在 Opus 4.8 中，這些代理的執行時間更持久）。代理在向使用者報告之前會對其輸出進行驗證。