Mistral AI 推出云端编码代理,新模型 Mistral Medium 3.5 驱动
Mistral AI 发布了远程编码代理,基于新旗舰模型 Mistral Medium 3.5。该模型为128B密集模型,具有256k上下文窗口,在编码和智能体任务上表现出色。Vibe 远程代理可在云端并行运行,而 Le Chat 的 Work 模式则支持复杂多步骤任务。
文章情报
要点
- Mistral Medium 3.5 是一款新旗舰模型,合并指令跟随、推理和编码能力,可自托管于最少4块GPU。
- Mistral Vibe 远程代理在云端运行,支持异步并行编码会话。
- Le Chat 的 Work 模式通过新代理处理复杂多步骤任务。
- 模型以修改版MIT许可开源,API定价为每百万输入tokens 1.5美元。
为什么重要
这条新闻值得关注,因为Mistral Medium 3.5 是一款新旗舰模型,合并指令跟随、推理和编码能力,可自托管于最少4块GPU。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
近日,Mistral AI 宣布将其编码代理从本地终端迁移至云端,实现异步并行运行,并在任务完成后通知用户。用户可以通过 Mistral Vibe CLI 或 Le Chat 启动这些远程代理,无需离开对话即可分配编码任务。
推动这一变革的是 Mistral Medium 3.5 模型,目前处于公开预览阶段。作为 Mistral Vibe 和 Le Chat 的新默认模型,它专为长时间编码和生产工作设计。与此同时,Le Chat 新增的“工作模式”(预览版)提供了一个强大的代理,用于处理研究、分析和跨工具操作等复杂多步骤任务。
Mistral Medium 3.5 是 Mistral 的首款旗舰合并模型,采用密集架构,拥有1280亿参数和256k上下文窗口。它将指令遵循、推理和编码能力整合到单一权重中,并在实际应用中表现强劲,最低仅需4块GPU即可自托管。推理力度可按需配置,使同一模型既能快速回复聊天,也能完成复杂的智能体任务。视觉编码器从零训练,支持可变图像尺寸和宽高比。
在性能方面,Mistral Medium 3.5 在 SWE-Bench Verified 上取得77.6%的分数,领先于 Devstral 2 和 Qwen3.5 397B A17B 等模型。其智能体能力同样出色,在 τ³-Telecom 上获得91.4分。该模型专为长周期任务构建,能可靠调用多个工具,并生成可供下游代码使用的结构化输出。
Vibe 远程代理允许编码会话在云端独立运行,多个会话可并行执行,用户不再成为每个步骤的瓶颈。从 CLI 或 Le Chat 启动后,用户可以查看文件差异、工具调用、进度状态和问题。本地 CLI 会话可通过“传送”功能迁移至云端,保持会话历史和任务状态。Vibe 与 GitHub、Linear、Jira、Sentry 以及 Slack 或 Teams 等应用集成,每个编码会话在隔离沙箱中运行,完成后可自动在 GitHub 上创建拉取请求并通知用户。
此外,Mistral 在 Le Chat 中推出了新的“工作模式”(预览版)。该模式由新代理驱动,基于 Mistral Medium 3.5,可同时使用多种工具,执行跨步骤项目,直至完成任务。例如,它可以在单次运行中处理电子邮件、消息和日历;通过网页、内部文档和连接工具深入研究主题并生成结构化简报;或者分类收件箱并草拟回复。所有操作均可见,敏感任务需用户明确批准。
Mistral Medium 3.5 现已在 Mistral Vibe 和 Le Chat 中提供,并支持 Pro、Team 和企业计划。API 价格为每百万输入 tokens 1.5美元,每百万输出 tokens 7.5美元。开放权重已在 Hugging Face 上以修改版 MIT 许可发布。此外,该模型还可在 NVIDIA GPU 加速端点上进行原型设计,并作为可扩展的容器化推理微服务 NVIDIA NIM 使用。
Mistral AI 正在招聘研究、工程和产品岗位,以进一步推动智能体系统的发展。