MAI-Thinking-1 即將登陸 Baseten
Baseten 與微軟 AI 宣佈,MAI-Thinking-1 即將在 Baseten 平臺上提供。該模型是微軟 AI 的旗艦推理模型,結合了開源模型的靈活性與閉源模型的管理便利性,具有乾淨資料來源、商業級質量和定製化能力。
MAI-Thinking-1 即將登陸 Baseten 平臺,這是 Baseten 與微軟 AI 共同宣佈的重磅訊息。MAI-Thinking-1 是微軟 AI 推出的旗艦推理模型,專為那些希望同時擁有強大能力和完全控制權的 AI 團隊設計。該模型定位在開源模型與閉源模型之間,填補了市場的空白。
當前 AI 模型市場主要分為兩類:開源模型提供完全的自由度,但需要使用者自行承擔基礎設施、最佳化、安全和維護的負擔,同時資料來源的清潔度也常令人擔憂;閉源模型則提供託管的 API,易於使用,但使用者的資料可能被模型提供商看到,且使用者的應用依賴於提供商的發展路線圖。MAI-Thinking-1 透過結合兩者的優點,提供了新的選擇。
MAI-Thinking-1 的核心特點包括:
- 乾淨的資料:模型從零開始使用經過精心挑選的高完整性資料訓練,完全沒有從第三方模型進行蒸餾。使用者可以獲得清潔、可審計且商業安全的資料來源,這對於受監管行業或嚴格智慧財產權政策的企業尤為重要。
- 商業級設計:模型從設計之初就面向商業應用,微軟完全不會接觸使用者的模型資料。使用者的微調資料、反饋訊號和領域適配都不會迴流到微軟,確保使用者的智慧資產完全屬於自己。
- 高效架構:MAI-Thinking-1 是一箇中型模型,擁有 350 億個活躍引數,在提供強大能力的同時保持了成本效率,使得大規模生產部署成為可能。
在定製化方面,Baseten 將獲得 MAI-Thinking-1 的模型權重,從而支援最佳化和定製。使用者可以透過 Baseten 進行微調,並且微調後的檢查點完全由使用者控制,分發渠道獨立於模型建立者,微軟對使用者在上層構建的內容沒有任何可見性。為了支援微調需求,Baseten 最近釋出了 Loops,這是一款專為迭代式、生產級後訓練工作流設計的訓練 SDK,支援長序列微調、基於人類反饋的強化學習以及非同步強化學習流水線。
Baseten 與微軟的合作旨在確保基於 AI 的企業能夠擁有自己的智慧,而不是無限期地從一個利益可能不一致的實驗室租賃智慧。雙方共同構建一個前沿生態系統,讓基於 AI 的業務能夠保持對自身成果的控制。MAI-Thinking-1 即將在 Baseten 上可用,感興趣的使用者可以提交早期訪問申請。