Vibe中的遠端代理:由Mistral Medium 3.5驅動
Mistral AI釋出Mistral Medium 3.5模型,這是一個128B密集引數的新型旗艦模型,同時推出Vibe遠端編碼代理和Le Chat的Work模式,支援複雜多步驟任務。
文章情報
要點
- Mistral Medium 3.5是一個128B密集模型,融合指令遵循、推理和編碼,可在4塊GPU上自託管,上下文視窗256k。
- Vibe遠端代理允許在雲端非同步執行編碼任務,支援並行會話,可從CLI或Le Chat啟動,本地會話可“傳送”至雲端。
- Le Chat的Work模式由Mistral Medium 3.5驅動,可執行跨工具工作流、研究和合成等複雜任務,所有操作透明且需審批。
為什麼重要
這條新聞值得關注,因為Mistral Medium 3.5是一個128B密集模型,融合指令遵循、推理和編碼,可在4塊GPU上自託管,上下文視窗256k。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
Mistral AI今天正式釋出了Mistral Medium 3.5,這是其最新的旗艦模型,將指令遵循、推理和編碼能力整合到一個128B密集引數模型中。該模型採用修改後的MIT許可證開放權重,可在僅四塊GPU上實現自託管,並支援高達256k的上下文視窗。Mistral Medium 3.5在SWE-Bench Verified上取得了77.6%的得分,領先於Devstral 2和Qwen3.5 397B A17B等模型,同時在τ³-Telecom上獲得91.4分,展示了強大的代理能力。該模型專為長週期任務設計,能夠可靠地呼叫多個工具並生成結構化輸出,為Vibe中的非同步雲端代理提供了實用基礎。即日起,Mistral Medium 3.5成為Le Chat和Vibe CLI的預設模型。
Vibe遠端代理是本次釋出的另一大亮點。開發者現在可以從Mistral Vibe CLI或Le Chat直接啟動雲端編碼會話,這些會話在隔離的沙箱中並行執行,完成後透過GitHub拉取請求通知使用者。本地CLI會話可以“傳送”到雲端,保留會話歷史、任務狀態和審批資訊。Vibe與GitHub、Linear、Jira、Sentry以及Slack或Teams等工具整合,適用於模組重構、測試生成、依賴升級、CI調查和錯誤修復等高容量、明確定義的任務。開發者無需再成為每個步驟的瓶頸,大幅提升工作效率。
Le Chat的Work模式(預覽版)由一個基於Mistral Medium 3.5的新代理驅動,可執行跨工具工作流、研究和合成等複雜多步驟任務。例如,在單次執行中處理電子郵件、訊息和日曆,為會議準備背景資訊,或從網路和內部文件中提煉結構化簡報。Work模式預設啟用聯結器,代理能夠訪問文件、郵箱、日曆等系統以獲取上下文,並在執行敏感操作前請求明確審批。會話持續時間更長,代理可透過試錯多次迭代直至任務完成。
Mistral Medium 3.5現已透過API提供,定價為每百萬輸入令牌1.5美元,每百萬輸出令牌7.5美元。開放權重可在Hugging Face上獲取,同時支援透過NVIDIA GPU加速端點(build.nvidia.com)和NVIDIA NIM進行原型開發和部署。Mistral AI目前正在招聘研究、工程和產品崗位,以進一步推動代理系統的發展。