Cohere將主權AI推銷給企業,現在通過首個編程模型瞄準開發者
Cohere發佈其首個開源編程模型North Mini Code(Apache 2.0許可),瞄準希望擁有和控制AI基礎設施的開發者。該30B MoE模型可在單張H100 GPU上運行,在代理編程任務上與Mistral、Qwen和Gemma競爭。
加拿大基礎模型公司Cohere過去幾年一直向銀行、政府和醫療提供商推銷一個特定理念:人工智能應在他們的基礎設施上運行,受他們控制,數據永不離開邊界。這一主張在受監管行業反響良好。如今,Cohere正將這一理念帶給不同的受眾——推出了其首個編程模型North Mini Code,該模型從一開始就採用Apache 2.0許可發佈。
Cohere長期以來向企業客户提出的主權論點,其核心是關於所有權。受監管行業有硬性要求:數據不能離開特定邊界,運行在敏感基礎設施上的智能層必須由組織控制。這一要求塑造了Cohere構建產品的方式——可部署在任何地方,可在私有基礎設施上運行。
根據Cohere聯合創始人Nick Frosst的説法,變化在於誰在提出同樣的問題。Frosst告訴The New Stack:“我們現在聽到開發者也有類似的擔憂。他們開始將模型訪問視為基礎設施,而基礎設施應該是你擁有和控制的東西。這是主權的延伸。”
North Mini Code正是對這一需求的直接回應。它是一個300億參數的混合專家(MoE)模型,僅有30億活躍參數,專為代理編程任務設計——即Claude Code和Cursor等編程代理所圍繞的多步驟、工具使用型工作。Cohere表示,該模型可在單張英偉達H100 GPU上運行,使得自託管無需更大規模的多GPU部署。不願管理自有基礎設施的開發者可通過API訪問。
Cohere聲稱,在Artificial Analysis編程指數上,它的表現優於包括阿里巴巴Qwen3和谷歌Gemma 4在內的同類開源模型,得分33.4,並在相同硬件上比Mistral的Devstral Small 2提供高達2.8倍的輸出吞吐量。Cohere自有基準測試顯示North Mini Code在終端和代碼生成任務上領先,但整體評估結果參差不齊——Qwen 3.6在SWE-Bench Verified和LiveCodeBench v6上領先。這些比較基於Cohere的自身測試,應視為參考。
Cohere的發佈時機使其與一批國際公司並列,這些公司已將開源編程模型作為明確的產品選擇。巴黎AI公司Mistral於2025年5月推出Devstral——其首個專用代理編程模型,同樣採用Apache 2.0許可——並於12月推出Devstral 2。捷克開發者工具公司JetBrains最近開源了其第二代編程模型Mellum2。重點有所不同:Mistral明確將開源權重與AI主權以及在私有基礎設施上部署模型的能力聯繫起來,而JetBrains則側重於延遲、成本和部署靈活性。實際上,兩種方法都讓開發者和企業更好地控制模型的運行位置和方式。
對開源替代方案的需求顯而易見。AI代理平台Lindy最近宣佈將其100%的推理流量從Anthropic轉移到中國的DeepSeek,稱此舉將節省數百萬美元,同時提高核心用例的性能。Lindy的CEO Flo Crivello回答了關於使用中國開發模型的問題:該公司使用美國推理提供商Atlas Cloud,該提供商在美國本土託管DeepSeek。DeepSeek的開源性質使之成為可能——該模型可由任何提供商在任何司法管轄區託管。
這正是Frosst所指出的動態。開源權重為開發者提供了專有API無法提供的可選擇性:能夠選擇模型運行的地點、運營商和條款。對於推理賬單已超過工資單的公司——正如Crivello指出的Lindy的情況——這些決策具有實際的商業後果。
Cohere的Command系列——其面向企業的主打模型系列,專為代理、多語言和多模態任務構建——此前以開源權重形式發佈,但許可更為嚴格。隨着Command A+的發佈,該公司於5月轉向Apache 2.0,使使用和再分發的法律條款大為放寬。
Frosst將Cohere多年來向企業提出的主權論點與North Mini Code背後的思路直接聯繫起來。他表示,開源編程模型是對Cohere在企業AI中看到的相同集中化問題的回應——只是現在在開發者層面展開。Frosst説:“開源開發集中在少數司法管轄區,運行關鍵基礎設施的組織沒有可靠的替代方案。North Mini Code將這一思路擴展到開發者層面。隨着編程代理成為軟件工程運行的基礎設施,控制這些系統的人就控制了它們的工作方式、演進方式以及優化方向。我們認為開發者和企業應該掌握控制權。”