Vibe中的遠程代理:由Mistral Medium 3.5驅動
Mistral AI發佈Mistral Medium 3.5模型,這是一個128B密集參數的新型旗艦模型,同時推出Vibe遠程編碼代理和Le Chat的Work模式,支持複雜多步驟任務。
文章情報
要點
- Mistral Medium 3.5是一個128B密集模型,融合指令遵循、推理和編碼,可在4塊GPU上自託管,上下文窗口256k。
- Vibe遠程代理允許在雲端異步執行編碼任務,支持並行會話,可從CLI或Le Chat啓動,本地會話可“傳送”至雲端。
- Le Chat的Work模式由Mistral Medium 3.5驅動,可執行跨工具工作流、研究和合成等複雜任務,所有操作透明且需審批。
為甚麼重要
這條新聞值得關注,因為Mistral Medium 3.5是一個128B密集模型,融合指令遵循、推理和編碼,可在4塊GPU上自託管,上下文窗口256k。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
Mistral AI今天正式發佈了Mistral Medium 3.5,這是其最新的旗艦模型,將指令遵循、推理和編碼能力整合到一個128B密集參數模型中。該模型採用修改後的MIT許可證開放權重,可在僅四塊GPU上實現自託管,並支持高達256k的上下文窗口。Mistral Medium 3.5在SWE-Bench Verified上取得了77.6%的得分,領先於Devstral 2和Qwen3.5 397B A17B等模型,同時在τ³-Telecom上獲得91.4分,展示了強大的代理能力。該模型專為長週期任務設計,能夠可靠地調用多個工具並生成結構化輸出,為Vibe中的異步雲端代理提供了實用基礎。即日起,Mistral Medium 3.5成為Le Chat和Vibe CLI的默認模型。
Vibe遠程代理是本次發佈的另一大亮點。開發者現在可以從Mistral Vibe CLI或Le Chat直接啓動雲端編碼會話,這些會話在隔離的沙箱中並行運行,完成後通過GitHub拉取請求通知用户。本地CLI會話可以“傳送”到雲端,保留會話歷史、任務狀態和審批信息。Vibe與GitHub、Linear、Jira、Sentry以及Slack或Teams等工具集成,適用於模塊重構、測試生成、依賴升級、CI調查和錯誤修復等高容量、明確定義的任務。開發者無需再成為每個步驟的瓶頸,大幅提升工作效率。
Le Chat的Work模式(預覽版)由一個基於Mistral Medium 3.5的新代理驅動,可執行跨工具工作流、研究和合成等複雜多步驟任務。例如,在單次運行中處理電子郵件、消息和日曆,為會議準備背景信息,或從網絡和內部文檔中提煉結構化簡報。Work模式默認啓用連接器,代理能夠訪問文檔、郵箱、日曆等系統以獲取上下文,並在執行敏感操作前請求明確審批。會話持續時間更長,代理可通過試錯多次迭代直至任務完成。
Mistral Medium 3.5現已通過API提供,定價為每百萬輸入令牌1.5美元,每百萬輸出令牌7.5美元。開放權重可在Hugging Face上獲取,同時支持通過NVIDIA GPU加速端點(build.nvidia.com)和NVIDIA NIM進行原型開發和部署。Mistral AI目前正在招聘研究、工程和產品崗位,以進一步推動代理系統的發展。