AI News HubLIVE
站内改写2 分鐘閱讀

微軟的新MAI模型

微軟發佈了兩個新的文本LLM:MAI-Thinking-1(350億參數,推理模型)和MAI-Code-1-Flash(50億參數,代碼模型)。兩者均採用經過許可的乾淨數據進行訓練,避免了從第三方模型蒸餾。MAI-Thinking-1在盲測中表現優於Sonnet 4.6。MAI-Code-1-Flash已面向Visual Studio Code的GitHub Copilot個人用户推出。

微軟在今天上午宣佈了兩款新的文本大語言模型(LLM):MAI-Thinking-1 和 MAI-Code-1-Flash。MAI-Thinking-1 是一個擁有350億參數的推理模型,目前僅向“選定的早期合作伙伴”提供。而 MAI-Code-1-Flash 是一個50億參數的代碼專用模型,旨在為 GitHub Copilot 和 Visual Studio Code 提供高性能和更低成本,現已面向 Visual Studio Code 中的 GitHub Copilot 個人用户推出。本文作者 Simon Willison 表示尚未有機會試用它們。

值得注意的是,微軟發佈的這兩款模型參數量都相對較小,尤其是在當前大型模型訪問成本高昂的背景下。微軟聲稱,在盲測中,MAI-Thinking-1 的表現優於 Sonnet 4.6。考慮到作者經常在自己的筆記本電腦上運行比35B更大的模型,這一成績令人印象深刻。這暗示着更小、更高效的模型可能在特定任務上具有競爭力,同時也可能降低推理成本。

微軟還強調,MAI-Thinking-1 是從頭開始訓練的,使用了企業級、乾淨且經過商業許可的數據,沒有從第三方模型進行蒸餾。同樣,MAI-Code-1-Flash 也是端到端由微軟構建,使用了乾淨且適當許可的數據。作者對此表示強烈興趣,並猜測這是否是第一批沒有使用未經許可的網絡數據訓練、但依然實用的代碼專用模型。這一做法可能引發關於AI模型訓練數據合法性和可持續性的更廣泛討論。

此外,微軟此次發佈正值AI行業對高質量、合規數據需求日益增長的時期。許多模型依賴於大規模抓取的網絡數據,往往涉及版權問題。微軟明確強調數據許可和清潔度,可能為行業樹立新標準。MAI-Thinking-1 的推出尤其值得關注,因為它是一個推理模型,儘管參數較少,卻能在盲測中勝過 Sonnet 4.6,這表明其架構或訓練方法有所創新。

對於開發者而言,MAI-Code-1-Flash 的可用性意味着他們可以在日常編碼中享受更快速、更低成本的代碼補全和生成能力,尤其是在 Visual Studio Code 環境下。隨着 GitHub Copilot 的普及,這一模型可能顯著提升開發效率。未來,微軟可能會將類似的輕量級模型擴展到其他應用場景。總體而言,這兩款模型展示了微軟在打造更高效、更負責任的AI方面的努力,同時也為模型選擇提供了新的選項。