AI News HubLIVE
站内改写1 分钟阅读

Cohere 发布 Command A+:开源混合专家模型,专为智能体任务打造

Cohere 宣布开源 Command A+,一款 218B 总参数(25B 活跃)的混合专家(MoE)模型,采用 Apache 2.0 许可证。该模型专为企业级智能体工作流设计,支持 128K 输入上下文和 64K 生成长度,可处理文本、图像和工具使用。相比前代 Command A 系列,它在推理、多模态理解和多语言能力上有显著提升,同时通过低比特量化和推测解码实现高效部署。Command A+ 目前可在 Hugging Face 和 Model Vault 上获取。

Cohere 今日宣布开源 Command A+,这是其 Command 系列的最新混合专家(MoE)模型。Command A+ 拥有 218B 总参数,其中 25B 为活跃参数,采用稀疏 MoE 架构。该模型以 Apache 2.0 许可证发布,旨在为开发者提供高性能、可私有部署的智能体能力。

Command A+ 基于 Cohere 在其企业平台 North 上一年多的部署经验开发,整合了前代 Command 系列(包括 Command A、Command A Reasoning、Command A Vision 和 Command A Translate)的功能。它在一个统一模型中实现了推理、多模态理解、工具使用和多语言支持。

在性能方面,Command A+ 相比 Command A Reasoning 取得了显著提升。在电信领域的 𝜏²-Bench 基准测试中,得分从 37% 跃升至 85%;在 Terminal-Bench Hard 智能体编码任务上,从 3% 提升至 25%。在多模态理解上,MMMU 得分达 75.1%,MathVista 从 73.5% 提升至 80.6%,CharXiv 推理从 46.9% 提升至 52.7%。多语言能力从 23 种扩展至 48 种,在机器翻译和多语言推理上也录得进步。在 Artificial Analysis Intelligence Index 上,Command A+ 获得 37 分,领先其他开源模型。

效率方面,Command A+ 支持 BF16、FP8 和 W4A4 量化,可在仅两块 H100 或单块 B200 GPU 上运行,且质量损失极小。相比 Command A Reasoning,其输出令牌速度(TOPS)提升达 63%,首令牌时间(TTFT)减少 17%。Cohere 还采用了推测解码技术,进一步将推理速度提升 1.5-1.6 倍。新的分词器在非欧洲语言上实现了更好的压缩效率,阿拉伯语提升 20%,韩语 16%,日语 18%。

Command A+ 现已可通过 Hugging Face 和 Model Vault 获取。Cohere 希望这一开源举措能推动主权 AI 的发展,让开发者能够自由运行、控制和调整模型。Fujitsu 等合作伙伴已表达了对该模型的支持。