AI News HubLIVE
站内改写2 分鐘閱讀

MAI-Thinking-1 即將登陸 Baseten

Baseten 與微軟 AI 宣佈,MAI-Thinking-1 即將在 Baseten 平台上提供。該模型是微軟 AI 的旗艦推理模型,結合了開源模型的靈活性與閉源模型的管理便利性,具有乾淨數據來源、商業級質量和定製化能力。

MAI-Thinking-1 即將登陸 Baseten 平台,這是 Baseten 與微軟 AI 共同宣佈的重磅消息。MAI-Thinking-1 是微軟 AI 推出的旗艦推理模型,專為那些希望同時擁有強大能力和完全控制權的 AI 團隊設計。該模型定位在開源模型與閉源模型之間,填補了市場的空白。

當前 AI 模型市場主要分為兩類:開源模型提供完全的自由度,但需要用户自行承擔基礎設施、優化、安全和維護的負擔,同時數據來源的清潔度也常令人擔憂;閉源模型則提供託管的 API,易於使用,但用户的數據可能被模型提供商看到,且用户的應用依賴於提供商的發展路線圖。MAI-Thinking-1 通過結合兩者的優點,提供了新的選擇。

MAI-Thinking-1 的核心特點包括:

  • 乾淨的數據:模型從零開始使用經過精心挑選的高完整性數據訓練,完全沒有從第三方模型進行蒸餾。用户可以獲得清潔、可審計且商業安全的數據來源,這對於受監管行業或嚴格知識產權政策的企業尤為重要。
  • 商業級設計:模型從設計之初就面向商業應用,微軟完全不會接觸用户的模型數據。用户的微調數據、反饋信號和領域適配都不會迴流到微軟,確保用户的智能資產完全屬於自己。
  • 高效架構:MAI-Thinking-1 是一箇中型模型,擁有 350 億個活躍參數,在提供強大能力的同時保持了成本效率,使得大規模生產部署成為可能。

在定製化方面,Baseten 將獲得 MAI-Thinking-1 的模型權重,從而支持優化和定製。用户可以通過 Baseten 進行微調,並且微調後的檢查點完全由用户控制,分發渠道獨立於模型創建者,微軟對用户在上層構建的內容沒有任何可見性。為了支持微調需求,Baseten 最近發佈了 Loops,這是一款專為迭代式、生產級後訓練工作流設計的訓練 SDK,支持長序列微調、基於人類反饋的強化學習以及異步強化學習流水線。

Baseten 與微軟的合作旨在確保基於 AI 的企業能夠擁有自己的智能,而不是無限期地從一個利益可能不一致的實驗室租賃智能。雙方共同構建一個前沿生態系統,讓基於 AI 的業務能夠保持對自身成果的控制。MAI-Thinking-1 即將在 Baseten 上可用,感興趣的用户可以提交早期訪問申請。