阿里最新AI模型自主运行35小时优化自有芯片代码
阿里通义千问团队发布Qwen3.7-Max,专为长时间自主代理任务设计。在基准测试中匹配Claude Opus 4.6,超越DeepSeek V4 Pro和Kimi K2.6等中国对手。团队还展示了该模型操控四足机器人。
文章情报
工程师进阶
要点
- Qwen3.7-Max专为长时间自主代理任务设计
- 基准测试匹配Claude Opus 4.6,超越中国竞品
- 展示模型操控四足机器人能力
为什么重要
这条新闻值得关注,因为Qwen3.7-Max专为长时间自主代理任务设计。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
阿里通义千问团队近日发布了Qwen3.7-Max,这是一款专为长时间运行的自主代理任务设计的专有模型。据团队介绍,该模型在基准测试中表现出色,性能匹配Claude Opus 4.6,同时超越了DeepSeek V4 Pro和Kimi K2.6等中国国内竞争对手。更令人印象深刻的是,团队还展示了该模型自主操控四足机器人的能力,展现了其在机器人领域的应用潜力。此次发布标志着阿里在自主AI代理领域的重要进展。