2026-05-01 22:46 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

欧洲的OpenAI和Anthropic答案：Mistral将编程代理推向云端

Mistral AI发布新模型Mistral Medium 3.5，并将其编程助手Vibe扩展至云端运行，允许开发者在后台执行多个代理任务。同时Le Chat新增“工作模式”，可并行处理更长任务。

来源The New Stack AI作者: Paul Sawers

2023年成立于巴黎的Mistral AI正在挑战AI领域的主导者，如OpenAI、Anthropic和Google。该公司已从微软和英伟达等投资者处筹集数十亿美元，并以更开放的方式发布开源权重模型。本周三，Mistral推出新模型Mistral Medium 3.5，以及将编程代理Vibe迁移至云端运行的系统。Mistral Medium 3.5拥有1280亿参数和256k上下文窗口，专为处理长任务设计。该模型在SWE-bench Verified等基准测试中表现出色，与Claude Sonnet、Kimi K2.5等模型竞争。Vibe助手此前仅在终端运行，现在开发者可以通过命令行或Le Chat启动多个代理，将其“传送”至云端独立沙箱环境，在后台持续工作。Le Chat新增“工作模式”，用户可设定更广泛的任务，如准备会议简报，让系统利用连接工具并行处理。Mistral产品团队成员Pini Wietchner表示，公司内部已使用Vibe处理大部分拉取请求，效果显著。Mistral并非一步到位地实现自主代理，而是逐步构建组件：从2024年的Codestral（专注编码）到Leanstral（形式验证），再到如今的云端代理。在基准测试方面，Mistral Medium 3.5在SWE-bench Verified上取得了具有竞争力的分数，该测试评估模型解决真实GitHub问题的能力。此外，模型在电信、零售和银行业务的特定领域任务上也表现良好。Mistral还展示了与之前模型如Devstral 2相比的进步。公司强调，这些结果来自内部评估，在不同设置下可能有所差异。Mistral的开放权重策略允许开发者在本地或云端自由运行模型，这与Anthropic等公司的封闭模型形成对比。在欧洲，Mistral被视为对抗美国科技巨头的重要力量。Mistral产品团队表示，内部已经广泛应用Vibe处理拉取请求，证明其有效性。总之，Mistral正通过逐步构建组件的方式，将AI从需要持续监督的工具转变为能够自主处理复杂任务的助手，这一趋势在整个行业日益明显。这一举措象征着Mistral重视AI民主化和开发者自主权的战略。未来，Mistral有望被更多企业和开发者采用。