AI News HubLIVE
站内改写1 分鐘閱讀

Cohere 發佈 Command A+:開源混合專家模型,專為智能體任務打造

Cohere 宣佈開源 Command A+,一款 218B 總參數(25B 活躍)的混合專家(MoE)模型,採用 Apache 2.0 許可證。該模型專為企業級智能體工作流設計,支持 128K 輸入上下文和 64K 生成長度,可處理文本、圖像和工具使用。相比前代 Command A 系列,它在推理、多模態理解和多語言能力上有顯著提升,同時通過低比特量化和推測解碼實現高效部署。Command A+ 目前可在 Hugging Face 和 Model Vault 上獲取。

Cohere 今日宣佈開源 Command A+,這是其 Command 系列的最新混合專家(MoE)模型。Command A+ 擁有 218B 總參數,其中 25B 為活躍參數,採用稀疏 MoE 架構。該模型以 Apache 2.0 許可證發佈,旨在為開發者提供高性能、可私有部署的智能體能力。

Command A+ 基於 Cohere 在其企業平台 North 上一年多的部署經驗開發,整合了前代 Command 系列(包括 Command A、Command A Reasoning、Command A Vision 和 Command A Translate)的功能。它在一個統一模型中實現了推理、多模態理解、工具使用和多語言支持。

在性能方面,Command A+ 相比 Command A Reasoning 取得了顯著提升。在電信領域的 𝜏²-Bench 基準測試中,得分從 37% 躍升至 85%;在 Terminal-Bench Hard 智能體編碼任務上,從 3% 提升至 25%。在多模態理解上,MMMU 得分達 75.1%,MathVista 從 73.5% 提升至 80.6%,CharXiv 推理從 46.9% 提升至 52.7%。多語言能力從 23 種擴展至 48 種,在機器翻譯和多語言推理上也錄得進步。在 Artificial Analysis Intelligence Index 上,Command A+ 獲得 37 分,領先其他開源模型。

效率方面,Command A+ 支持 BF16、FP8 和 W4A4 量化,可在僅兩塊 H100 或單塊 B200 GPU 上運行,且質量損失極小。相比 Command A Reasoning,其輸出令牌速度(TOPS)提升達 63%,首令牌時間(TTFT)減少 17%。Cohere 還採用了推測解碼技術,進一步將推理速度提升 1.5-1.6 倍。新的分詞器在非歐洲語言上實現了更好的壓縮效率,阿拉伯語提升 20%,韓語 16%,日語 18%。

Command A+ 現已可通過 Hugging Face 和 Model Vault 獲取。Cohere 希望這一開源舉措能推動主權 AI 的發展,讓開發者能夠自由運行、控制和調整模型。Fujitsu 等合作伙伴已表達了對該模型的支持。