Databricks、13億ドルでMosaicMLを買収:生成AIへの戦略的賭け
Databricksは生成AIスタートアップMosaicMLを13億ドルで買収。MosaicMLはオープンソースモデルMPT-7B、MPT-30Bを提供し、GPT-3に匹敵する性能を低コストで実現。買収により、企業向け生成AIの民主化を目指す。
Databricksは、完売したData + AI Summitの初日、生成AIスタートアップMosaicMLの買収で最終合意に達したと発表した。買収額は13億ドル。MosaicMLはOpenAIの競合であり、Apache 2.0ライセンスのオープンソース基盤モデルMPT-7Bを開発。同モデルは5月のリリース以来330万回ダウンロードされた。先週デビューしたMPT-30Bは、OpenAIのGPT-3と同等の品質でありながら、わずか300億パラメータで訓練されている(GPT-3は1750億パラメータ)。ベースモデルに加え、チャットボット、短い指示、ストーリー作成向けにファインチューニングされたバリアントも提供。
買収完了後、MosaicMLの全チーム(MLおよびニューラルネットワーク専門家の研究チームを含む)がDatabricksに参加。MosaicMLプラットフォームは段階的にスケールされ、Databricks Lakehouseプラットフォームに統合される予定。Databricksの共同創業者兼CEO Ali Ghodsi氏は、「あらゆる組織がAI革命の恩恵を受け、データの使用方法をよりコントロールできるべきだ。DatabricksとMosaicMLは透明性とオープンソースへの貢献の歴史に根ざした共通のビジョンを持ち、顧客に価値を提供する」と述べた。
エンタープライズ向け生成AIのユースケースでは、規制要件から高い精度が求められるが、基盤モデルだけでは保証できない。多くの企業は、自社データを使用して独自モデルを構築し、データの管理、セキュリティ、所有権を維持することを目指している。MosaicMLの自動最適化により、トレーニング速度は標準手法比2~7倍に向上。リソースのほぼ線形スケーリングと組み合わせることで、数十億パラメータのモデルを数時間で訓練可能。Databricksは、両社の連携により、LLMの訓練・利用コストが数百万ドルから数千ドルに低下すると主張する。
MosaicMLの顧客には、非営利研究機関Allen Institute for AI、汎用AIエージェント開発のGenerally Intelligent、サンフランシスコ拠点のIDE Replit、医療チャットボット開発のHippocratic AIが含まれる。MosaicMLの共同創業者兼CEO Naveen Rao氏は、「大規模トレーニングをすべての人が利用できるようにするという使命を、Databricksとの連携で実現したい」と語った。