Liquid AI、スマートフォン、Raspberry Pi、ロボット向けに最適化された230Mモデルをリリース
Liquid AIは、エッジデバイス向けに最適化された軽量基盤モデルLFM2.5-230Mをリリースしました。Galaxy S25 Ultraで213 tok/s、Raspberry Pi 5で42 tok/sの推論速度を達成。ツール使用やデータ抽出タスクで優れた性能を発揮し、Unitree G1人型ロボットでスキル選択層として実証されました。オープンウェイトで、複数の推論フレームワークをサポートします。
Liquid AIは本日、同社最小のモデルとなるLFM2.5-230Mを発表しました。このモデルはLFM2アーキテクチャに基づき、開発者がエージェントワークフロー向けに高速に微調整・デプロイできるよう設計されています。クラウドGPUから低コストCPUまで幅広いハードウェアで動作し、Samsung Galaxy S25 Ultraでは213 tok/s、Raspberry Pi 5では42 tok/sの復号速度を達成します。小型ながら、ツール使用やデータ抽出タスクで驚くべき能力を発揮します。
ベースモデル(LFM2.5-230M-Base)とポストトレーニング済みモデル(LFM2.5-230M)は本日よりHugging Faceで利用可能です。モデルは19Tトークンで事前学習され、32Kコンテキスト拡張フェーズを含みます。ポストトレーニングは、LFM2.5-350Mからの蒸留による教師あり微調整、直接選好最適化、多領域強化学習の3段階で構成されます。最終的なチェックポイントは、優れた即時性能と下流タスクへの適応性のバランスを保ちながら、より大規模なモデルと競争力を維持します。
初期の取り組みとして、Liquid AIはLFM2.5-230MをUnitree G1人型ロボットにデプロイし、完全にオンボードのNVIDIA Jetson Orin上で動作させました。ここではモデルがスキル選択層として機能し、自然言語命令を受け取り、NVIDIAのSONICフレームワークが提供する事前訓練された低レベルスキルを呼び出すツール呼び出しのシーケンスに分解します。簡単な微調整後、モデルは「2秒間静止し、その後毎秒1メートルで3メートル前方に歩き、5秒間前方片膝立ちを保持し、毎秒0.5メートルで3メートル後方に歩く」といった自由形式のコマンドを構造化された多段階計画に変換します。現時点では動作は意図的に単純ですが、230Mパラメータのモデルが迅速に微調整され、人型ロボットの自然言語制御インターフェースとして機能できることを示す有力なシグナルです。
ベンチマークでは、LFM2.5-230Mはコア能力と応用タスクをカバーする10のベンチマークで評価されました。そのサイズにもかかわらず、多くの場合2倍以上の規模のモデルと競合し、GPQA Diamond、MMLU-Pro、IFEval、CaseReportBench、BFCLv3などでより良い結果を出しています。特にデータ抽出とツール使用で優れています。ただし、コンパクトなサイズのため、高度な数学、コード生成、クリエイティブライティングなどの推論重視のワークロードには推奨されません。
このモデルはllama.cpp、MLX、vLLM、SGLang、ONNXなど推論エコシステム全体で初日からサポートされます。CPU推論では、LFM2アーキテクチャのおかげで、Raspberry Pi 5とQualcomm Snapdragon Gen4(Samsung Galaxy S25 Ultra)の両方でクラス最高のプリフィル・復号スループットを実現し、メモリフットプリントも最小です。エンタープライズ向けGPU推論のために、Liquid AIは内部推論スタックも開発し、極めて低レイテンシのサービスを提供します。
LFM2.5-230Mはオープンウェイトで提供され、制限なくダウンロード、微調整、デプロイ可能です。llama.cpp、NexaSDK、MLX、vLLMをネイティブサポートし、Apple、AMD、Qualcomm、Nvidiaハードウェアをカバーします。これにより、大規模データ抽出パイプラインや軽量なデバイス上のエージェントワークロードに理想的なソリューションとなります。Liquid AIは「エッジAIの未来はここにある」と述べています。