2026-05-29 05:20 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

Anthropic发布Claude Opus 4.8：性能超越GPT-5.5，堪称“适度但实实在在的进步”

Anthropic推出Claude Opus 4.8，该模型在多数基准测试中击败了GPT-5.5和Gemini 3.1 Pro，并且识别自身编码错误的频率是前代模型的四倍。同时，Anthropic还引入了动态工作流功能，可启动数百个并行子代理处理代码库迁移等任务。

来源The Decoder作者: Matthias Bastian

Anthropic近日发布了其最新AI模型Claude Opus 4.8，公司将其描述为一次“适度但实实在在的进步”。在多项基准测试中，该模型的表现超越了OpenAI的GPT-5.5和Google的Gemini 3.1 Pro，特别是在编码和逻辑推理任务上展现出显著优势。

Claude Opus 4.8在自我纠错能力上也有重大提升，它发现并修复自身编码错误的频率是前代模型的四倍。这一进步对于依赖AI辅助编程的开发团队来说尤为重要，可以大幅减少人工审查的工作量。

此外，Anthropic还推出了一项名为“动态工作流”的新功能，允许用户创建数百个并行运行的子代理，以协同处理大型任务，例如跨整个代码库的迁移或重构。这些子代理可以独立执行子任务，并实时同步进度，从而显著提升复杂项目的处理效率。

Claude Opus 4.8目前已通过Anthropic的API开放使用，同时也在其官方聊天平台中提供。公司表示，将继续优化模型性能，并计划在未来版本中引入更多企业级功能。