AI News HubLIVE
站内改写

Mistral AI 推出雲端編碼代理,新模型 Mistral Medium 3.5 驅動

Mistral AI 釋出了遠端編碼代理,基於新旗艦模型 Mistral Medium 3.5。該模型為128B密集模型,具有256k上下文視窗,在編碼和智慧體任務上表現出色。Vibe 遠端代理可在雲端並行執行,而 Le Chat 的 Work 模式則支援複雜多步驟任務。

文章情報

工程師進階

要點

  • Mistral Medium 3.5 是一款新旗艦模型,合併指令跟隨、推理和編碼能力,可自託管於最少4塊GPU。
  • Mistral Vibe 遠端代理在雲端執行,支援非同步並行編碼會話。
  • Le Chat 的 Work 模式透過新代理處理複雜多步驟任務。
  • 模型以修改版MIT許可開源,API定價為每百萬輸入tokens 1.5美元。

為什麼重要

這條新聞值得關注,因為Mistral Medium 3.5 是一款新旗艦模型,合併指令跟隨、推理和編碼能力,可自託管於最少4塊GPU。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

近日,Mistral AI 宣佈將其編碼代理從本地終端遷移至雲端,實現非同步並行執行,並在任務完成後通知使用者。使用者可以透過 Mistral Vibe CLI 或 Le Chat 啟動這些遠端代理,無需離開對話即可分配編碼任務。

推動這一變革的是 Mistral Medium 3.5 模型,目前處於公開預覽階段。作為 Mistral Vibe 和 Le Chat 的新預設模型,它專為長時間編碼和生產工作設計。與此同時,Le Chat 新增的“工作模式”(預覽版)提供了一個強大的代理,用於處理研究、分析和跨工具操作等複雜多步驟任務。

Mistral Medium 3.5 是 Mistral 的首款旗艦合併模型,採用密集架構,擁有1280億引數和256k上下文視窗。它將指令遵循、推理和編碼能力整合到單一權重中,並在實際應用中表現強勁,最低僅需4塊GPU即可自託管。推理力度可按需配置,使同一模型既能快速回復聊天,也能完成複雜的智慧體任務。視覺編碼器從零訓練,支援可變影像尺寸和寬高比。

在效能方面,Mistral Medium 3.5 在 SWE-Bench Verified 上取得77.6%的分數,領先於 Devstral 2 和 Qwen3.5 397B A17B 等模型。其智慧體能力同樣出色,在 τ³-Telecom 上獲得91.4分。該模型專為長週期任務構建,能可靠呼叫多個工具,並生成可供下游程式碼使用的結構化輸出。

Vibe 遠端代理允許編碼會話在雲端獨立執行,多個會話可並行執行,使用者不再成為每個步驟的瓶頸。從 CLI 或 Le Chat 啟動後,使用者可以檢視檔案差異、工具呼叫、進度狀態和問題。本地 CLI 會話可透過“傳送”功能遷移至雲端,保持會話歷史和任務狀態。Vibe 與 GitHub、Linear、Jira、Sentry 以及 Slack 或 Teams 等應用整合,每個編碼會話在隔離沙箱中執行,完成後可自動在 GitHub 上建立拉取請求並通知使用者。

此外,Mistral 在 Le Chat 中推出了新的“工作模式”(預覽版)。該模式由新代理驅動,基於 Mistral Medium 3.5,可同時使用多種工具,執行跨步驟專案,直至完成任務。例如,它可以在單次執行中處理電子郵件、訊息和日曆;透過網頁、內部文件和連線工具深入研究主題並生成結構化簡報;或者分類收件箱並草擬回覆。所有操作均可見,敏感任務需使用者明確批准。

Mistral Medium 3.5 現已在 Mistral Vibe 和 Le Chat 中提供,並支援 Pro、Team 和企業計劃。API 價格為每百萬輸入 tokens 1.5美元,每百萬輸出 tokens 7.5美元。開放權重已在 Hugging Face 上以修改版 MIT 許可釋出。此外,該模型還可在 NVIDIA GPU 加速端點上進行原型設計,並作為可擴充套件的容器化推理微服務 NVIDIA NIM 使用。

Mistral AI 正在招聘研究、工程和產品崗位,以進一步推動智慧體系統的發展。