2026-06-03 06:21 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

微軟的新MAI模型

微軟發佈了兩個新的文本LLM：MAI-Thinking-1（350億參數，推理模型）和MAI-Code-1-Flash（50億參數，代碼模型）。兩者均採用經過許可的乾淨數據進行訓練，避免了從第三方模型蒸餾。MAI-Thinking-1在盲測中表現優於Sonnet 4.6。MAI-Code-1-Flash已面向Visual Studio Code的GitHub Copilot個人用户推出。

來源Simon Willison's Weblog

微軟在今天上午宣佈了兩款新的文本大語言模型（LLM）：MAI-Thinking-1 和 MAI-Code-1-Flash。MAI-Thinking-1 是一個擁有350億參數的推理模型，目前僅向“選定的早期合作伙伴”提供。而 MAI-Code-1-Flash 是一個50億參數的代碼專用模型，旨在為 GitHub Copilot 和 Visual Studio Code 提供高性能和更低成本，現已面向 Visual Studio Code 中的 GitHub Copilot 個人用户推出。本文作者 Simon Willison 表示尚未有機會試用它們。

值得注意的是，微軟發佈的這兩款模型參數量都相對較小，尤其是在當前大型模型訪問成本高昂的背景下。微軟聲稱，在盲測中，MAI-Thinking-1 的表現優於 Sonnet 4.6。考慮到作者經常在自己的筆記本電腦上運行比35B更大的模型，這一成績令人印象深刻。這暗示着更小、更高效的模型可能在特定任務上具有競爭力，同時也可能降低推理成本。

微軟還強調，MAI-Thinking-1 是從頭開始訓練的，使用了企業級、乾淨且經過商業許可的數據，沒有從第三方模型進行蒸餾。同樣，MAI-Code-1-Flash 也是端到端由微軟構建，使用了乾淨且適當許可的數據。作者對此表示強烈興趣，並猜測這是否是第一批沒有使用未經許可的網絡數據訓練、但依然實用的代碼專用模型。這一做法可能引發關於AI模型訓練數據合法性和可持續性的更廣泛討論。

此外，微軟此次發佈正值AI行業對高質量、合規數據需求日益增長的時期。許多模型依賴於大規模抓取的網絡數據，往往涉及版權問題。微軟明確強調數據許可和清潔度，可能為行業樹立新標準。MAI-Thinking-1 的推出尤其值得關注，因為它是一個推理模型，儘管參數較少，卻能在盲測中勝過 Sonnet 4.6，這表明其架構或訓練方法有所創新。

對於開發者而言，MAI-Code-1-Flash 的可用性意味着他們可以在日常編碼中享受更快速、更低成本的代碼補全和生成能力，尤其是在 Visual Studio Code 環境下。隨着 GitHub Copilot 的普及，這一模型可能顯著提升開發效率。未來，微軟可能會將類似的輕量級模型擴展到其他應用場景。總體而言，這兩款模型展示了微軟在打造更高效、更負責任的AI方面的努力，同時也為模型選擇提供了新的選項。