Mistral AI 推出雲端編碼代理,新模型 Mistral Medium 3.5 驅動
Mistral AI 發佈了遠程編碼代理,基於新旗艦模型 Mistral Medium 3.5。該模型為128B密集模型,具有256k上下文窗口,在編碼和智能體任務上表現出色。Vibe 遠程代理可在雲端並行運行,而 Le Chat 的 Work 模式則支持複雜多步驟任務。
文章情報
要點
- Mistral Medium 3.5 是一款新旗艦模型,合併指令跟隨、推理和編碼能力,可自託管於最少4塊GPU。
- Mistral Vibe 遠程代理在雲端運行,支持異步並行編碼會話。
- Le Chat 的 Work 模式通過新代理處理複雜多步驟任務。
- 模型以修改版MIT許可開源,API定價為每百萬輸入tokens 1.5美元。
為甚麼重要
這條新聞值得關注,因為Mistral Medium 3.5 是一款新旗艦模型,合併指令跟隨、推理和編碼能力,可自託管於最少4塊GPU。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
近日,Mistral AI 宣佈將其編碼代理從本地終端遷移至雲端,實現異步並行運行,並在任務完成後通知用户。用户可以通過 Mistral Vibe CLI 或 Le Chat 啓動這些遠程代理,無需離開對話即可分配編碼任務。
推動這一變革的是 Mistral Medium 3.5 模型,目前處於公開預覽階段。作為 Mistral Vibe 和 Le Chat 的新默認模型,它專為長時間編碼和生產工作設計。與此同時,Le Chat 新增的“工作模式”(預覽版)提供了一個強大的代理,用於處理研究、分析和跨工具操作等複雜多步驟任務。
Mistral Medium 3.5 是 Mistral 的首款旗艦合併模型,採用密集架構,擁有1280億參數和256k上下文窗口。它將指令遵循、推理和編碼能力整合到單一權重中,並在實際應用中表現強勁,最低僅需4塊GPU即可自託管。推理力度可按需配置,使同一模型既能快速回復聊天,也能完成複雜的智能體任務。視覺編碼器從零訓練,支持可變圖像尺寸和寬高比。
在性能方面,Mistral Medium 3.5 在 SWE-Bench Verified 上取得77.6%的分數,領先於 Devstral 2 和 Qwen3.5 397B A17B 等模型。其智能體能力同樣出色,在 τ³-Telecom 上獲得91.4分。該模型專為長週期任務構建,能可靠調用多個工具,並生成可供下游代碼使用的結構化輸出。
Vibe 遠程代理允許編碼會話在雲端獨立運行,多個會話可並行執行,用户不再成為每個步驟的瓶頸。從 CLI 或 Le Chat 啓動後,用户可以查看文件差異、工具調用、進度狀態和問題。本地 CLI 會話可通過“傳送”功能遷移至雲端,保持會話歷史和任務狀態。Vibe 與 GitHub、Linear、Jira、Sentry 以及 Slack 或 Teams 等應用集成,每個編碼會話在隔離沙箱中運行,完成後可自動在 GitHub 上創建拉取請求並通知用户。
此外,Mistral 在 Le Chat 中推出了新的“工作模式”(預覽版)。該模式由新代理驅動,基於 Mistral Medium 3.5,可同時使用多種工具,執行跨步驟項目,直至完成任務。例如,它可以在單次運行中處理電子郵件、消息和日曆;通過網頁、內部文檔和連接工具深入研究主題並生成結構化簡報;或者分類收件箱並草擬回覆。所有操作均可見,敏感任務需用户明確批准。
Mistral Medium 3.5 現已在 Mistral Vibe 和 Le Chat 中提供,並支持 Pro、Team 和企業計劃。API 價格為每百萬輸入 tokens 1.5美元,每百萬輸出 tokens 7.5美元。開放權重已在 Hugging Face 上以修改版 MIT 許可發佈。此外,該模型還可在 NVIDIA GPU 加速端點上進行原型設計,並作為可擴展的容器化推理微服務 NVIDIA NIM 使用。
Mistral AI 正在招聘研究、工程和產品崗位,以進一步推動智能體系統的發展。