AI News HubLIVE
站内改写2 分で読了

Microsoftの新しいMAIモデル

マイクロソフトは2つの新しいテキストLLMを発表しました。MAI-Thinking-1(350億パラメータ、推論モデル)とMAI-Code-1-Flash(50億パラメータ、コードモデル)です。両方ともクリーンでライセンスされたデータで訓練され、第三者モデルからの蒸留は行っていません。MAI-Thinking-1はブラインド評価でSonnet 4.6よりも好まれると主張しています。MAI-Code-1-FlashはVisual Studio CodeのGitHub Copilot個人ユーザーに展開中です。

マイクロソフトは本日、2つの新しいテキストLLM「MAI-Thinking-1」と「MAI-Code-1-Flash」を発表しました。MAI-Thinking-1は350億パラメータの推論モデルで、「選ばれた初期パートナー」のみが利用可能です。一方、MAI-Code-1-Flashは50億パラメータのコード特化モデルで、GitHub CopilotとVS Code向けに高性能かつ低コストを実現するために設計され、Visual Studio CodeのGitHub Copilot個人ユーザー向けに展開中です。記事の著者Simon Willisonはまだこれらのモデルを試せていないと述べています。

特に注目すべきは、マイクロソフトがこのような低パラメータ数のモデルをリリースした点です。これは、現在大規模モデルへのアクセスが高額であることを考えると興味深い動きです。マイクロソフトは、MAI-Thinking-1がブラインド評価でSonnet 4.6よりも好まれたと主張しています。著者は自身のラップトップで35Bより大きなモデルを頻繁に実行しているため、この結果は印象的です。これは、より小型で効率的なモデルが特定のタスクで競争力を持ち、推論コストを削減できる可能性を示唆しています。

さらに、MAI-Thinking-1は企業グレードのクリーンで商用ライセンスされたデータを用いてゼロから訓練され、第三者のモデルからの蒸留は行っていません。MAI-Code-1-Flashも同様に、クリーンで適切にライセンスされたデータを使用してエンドツーエンドで構築されています。著者はこの「適切にライセンスされた」データについてさらに詳しく知りたいと述べており、これらが未ライセンスのウェブデータを使用せずに訓練された初めての実用的なコード特化モデルになる可能性に言及しています。このアプローチは、AIモデルのトレーニングデータの合法性と持続可能性に関する広範な議論を引き起こす可能性があります。

また、マイクロソフトの今回の発表は、高品質でコンプライアンスに準拠したデータへの需要が高まる時期に行われました。多くのモデルは大規模にクロールされたウェブデータに依存しており、著作権問題がしばしば発生します。マイクロソフトがデータのライセンスとクリーンさを明確に強調したことは、業界に新たな基準を設定する可能性があります。MAI-Thinking-1のリリースは特に注目に値します。パラメータ数が少ないにもかかわらず、ブラインド評価でSonnet 4.6を上回ったことは、そのアーキテクチャやトレーニング手法に革新があることを示唆しています。

開発者にとって、MAI-Code-1-Flashの利用可能性は、特にVisual Studio Code環境において、日常のコーディングでより高速で低コストなコード補完と生成を享受できることを意味します。GitHub Copilotの普及に伴い、このモデルは開発効率を大幅に向上させる可能性があります。将来的には、マイクロソフトは同様の軽量モデルを他のアプリケーションシナリオに拡張するかもしれません。全体として、これらのモデルは、より効率的で責任あるAIを構築するというマイクロソフトの取り組みを示すとともに、モデル選択に新たな選択肢を提供します。