AI News HubLIVE
站内改写

国産AIが自らAIを開発、世界初の快挙

面壁智能(ModelBest)が、AIによって完全に記述された世界初の本格的な大規模言語モデル事前学習フレームワーク「ForgeTrain」を発表。NVIDIAのMegatronより10%高速で、これを用いて訓練されたMiniCPM5-1Bは、1Bパラメータで従来の2B未満モデルを上回る知能密度を達成。

記事インテリジェンス

エンジニア上級

要点

  • ForgeTrainはAIが完全に生成した初の本格的な事前学習フレームワーク。
  • NVIDIA Megatronより10%高速なトレーニングを実現。
  • 訓練されたMiniCPM5-1BはAA-Indexで2B未満モデルを全て凌駕。
  • Forge Engineeringパラダイム:汎用フレームワークからAIが各シナリオに特化したコードを生成。

重要な理由

このニュースが重要なのは、ForgeTrainはAIが完全に生成した初の本格的な事前学習フレームワークためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

中国のAI企業である面壁智能(ModelBest)は、AI自身が書いた世界初の本格的な大規模言語モデル(LLM)事前学習フレームワーク「ForgeTrain」を発表しました。このフレームワークは、NVIDIAのMegatronと比較して同じハードウェア上で10%高速なトレーニングを実現し、さらにHuawei Ascendチップ上でも既存フレームワークより10%の高速化を達成しています。

ForgeTrainは「Forge Engineering」と呼ばれる新しいパラダイムに基づいています。従来の汎用フレームワークのアプローチを捨て、AIが特定のモデルアーキテクチャ、ハードウェア、タスクに合わせて専用のコードを生成します。3段階の方法論(既存フレームワークからのデータ収集と評価基準の構築、バイナリ互換バージョンの作成、反復的最適化)を通じて、Meagtronの機能を完全に再現しつつ性能を向上させました。

ForgeTrainで訓練されたMiniCPM5-1Bは、10億パラメータのコンパクトなモデルで、デスクトップペットやモバイル端末への組み込みに適しています。その知能密度は非常に高く、AA-Indexベンチマークで2B未満の全モデルを上回り、パラメータ数が半分であるにもかかわらずQwen3.5-2Bより優れた結果を示しています。同社によると、LLMの知能密度は約3.5ヶ月ごとに倍増しているとのことです。

この成果は技術的な優位性にとどまらず、AI開発のパラダイムシフトを示しています。人間はループ内でコードを書く代わりに、ループ外で目標を定義し監督する役割へと移行します。これにより、AI開発の加速とコスト削減が期待され、特に中国の半導体エコシステム(Huawei Ascendなど)にとっては、AIが生成する最適化コードによってソフトウェアのギャップを埋める絶好の機会となります。ForgeTrainとMiniCPM5-1Bはオープンソースとして公開され、Hugging FaceやGitHubなどで入手可能です。