阿里最新AI模型自主執行35小時最佳化自有晶片程式碼
阿里通義千問團隊釋出Qwen3.7-Max,專為長時間自主代理任務設計。在基準測試中匹配Claude Opus 4.6,超越DeepSeek V4 Pro和Kimi K2.6等中國對手。團隊還展示了該模型操控四足機器人。
文章情報
工程師進階
要點
- Qwen3.7-Max專為長時間自主代理任務設計
- 基準測試匹配Claude Opus 4.6,超越中國競品
- 展示模型操控四足機器人能力
為什麼重要
這條新聞值得關注,因為Qwen3.7-Max專為長時間自主代理任務設計。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
阿里通義千問團隊近日釋出了Qwen3.7-Max,這是一款專為長時間執行的自主代理任務設計的專有模型。據團隊介紹,該模型在基準測試中表現出色,效能匹配Claude Opus 4.6,同時超越了DeepSeek V4 Pro和Kimi K2.6等中國國內競爭對手。更令人印象深刻的是,團隊還展示了該模型自主操控四足機器人的能力,展現了其在機器人領域的應用潛力。此次釋出標誌著阿里在自主AI代理領域的重要進展。