AI News HubLIVE
站内改写

欧洲的OpenAI和Anthropic答案:Mistral将编程代理推向云端

Mistral AI发布新模型Mistral Medium 3.5,并将其编程助手Vibe扩展至云端运行,允许开发者在后台执行多个代理任务。同时Le Chat新增“工作模式”,可并行处理更长任务。

文章情报

工程师进阶

要点

  • Mistral发布128B参数的Mistral Medium 3.5模型,上下文窗口256k。
  • 编程助手Vibe现在支持云端运行,任务可“传送”到云端独立完成。
  • Le Chat新增“工作模式”,可处理会议简报等更广泛任务。
  • Mistral强调开放权重和开发者控制,与Anthropic等对手形成差异化。

为什么重要

这条新闻值得关注,因为Mistral发布128B参数的Mistral Medium 3.5模型,上下文窗口256k。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

2023年成立于巴黎的Mistral AI正在挑战AI领域的主导者,如OpenAI、Anthropic和Google。该公司已从微软和英伟达等投资者处筹集数十亿美元,并以更开放的方式发布开源权重模型。本周三,Mistral推出新模型Mistral Medium 3.5,以及将编程代理Vibe迁移至云端运行的系统。Mistral Medium 3.5拥有1280亿参数和256k上下文窗口,专为处理长任务设计。该模型在SWE-bench Verified等基准测试中表现出色,与Claude Sonnet、Kimi K2.5等模型竞争。Vibe助手此前仅在终端运行,现在开发者可以通过命令行或Le Chat启动多个代理,将其“传送”至云端独立沙箱环境,在后台持续工作。Le Chat新增“工作模式”,用户可设定更广泛的任务,如准备会议简报,让系统利用连接工具并行处理。Mistral产品团队成员Pini Wietchner表示,公司内部已使用Vibe处理大部分拉取请求,效果显著。Mistral并非一步到位地实现自主代理,而是逐步构建组件:从2024年的Codestral(专注编码)到Leanstral(形式验证),再到如今的云端代理。在基准测试方面,Mistral Medium 3.5在SWE-bench Verified上取得了具有竞争力的分数,该测试评估模型解决真实GitHub问题的能力。此外,模型在电信、零售和银行业务的特定领域任务上也表现良好。Mistral还展示了与之前模型如Devstral 2相比的进步。公司强调,这些结果来自内部评估,在不同设置下可能有所差异。Mistral的开放权重策略允许开发者在本地或云端自由运行模型,这与Anthropic等公司的封闭模型形成对比。在欧洲,Mistral被视为对抗美国科技巨头的重要力量。Mistral产品团队表示,内部已经广泛应用Vibe处理拉取请求,证明其有效性。总之,Mistral正通过逐步构建组件的方式,将AI从需要持续监督的工具转变为能够自主处理复杂任务的助手,这一趋势在整个行业日益明显。这一举措象征着Mistral重视AI民主化和开发者自主权的战略。未来,Mistral有望被更多企业和开发者采用。