2026-06-28 12:58 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-28 13:22 UTC+8

Liquid AI 發佈 LFM2.5-230M：支持 on-device 推理，兼容 llama.cpp、MLX 等多種框架

Liquid AI 發佈其最小模型 LFM2.5-230M，僅 2.3 億參數，開放權重，專為邊緣設備上的工具使用和數據提取設計。在 Galaxy S25 Ultra 上可達 213 tok/s，在樹莓派 5 上為 42 tok/s。該模型在指令遵循和數據提取上超越 Qwen3.5-0.8B 和 Gemma 3 1B。提供基礎版和指令調優版，支持 32K 上下文，兼容多項推理框架。

來源MarkTechPost作者: Asif Razzaq

Liquid AI 發佈了其迄今為止最小的模型——LFM2.5-230M。該模型旨在支持手機、機器人和自動化設備上的智能體任務。基礎版和指令調優版均以開放權重形式發佈在 Hugging Face 上。

LFM2.5-230M 是一款僅文本模型，基於 LFM2 架構，擁有 2.3 億參數。模型共 14 層，其中 8 層為雙門控 LIV 卷積塊，6 層為分組查詢注意力（GQA）塊，這種混合設計針對快速 CPU 推理進行了優化。上下文長度為 32,768 個 token，詞彙量 65,536，知識截止時間為 2024 年中，支持包括英語、中文、阿拉伯語和日語在內的十種語言。

訓練方面，模型在 19 萬億 token 上進行預訓練，其中包括 32K 上下文擴展階段。後訓練分為三個階段：首先是利用更大的 LFM2.5-350M 進行蒸餾監督微調，然後是直接偏好優化（DPO），最後是多領域強化學習。這些步驟確保了模型在目標任務上的競爭力。

在基準測試中，LFM2.5-230M 在指令遵循和數據提取上表現出色。IFEval 得分 71.71，超過 Qwen3.5-0.8B（59.94）和 Gemma 3 1B IT（63.49）；IFBench 得分 38.40；臨牀數據提取測試 CaseReportBench 得分 22.51。然而，在廣泛知識任務（如 MMLU-Pro）上得分 20.25，落後於 Qwen3.5-0.8B 的 37.42；在工具使用基準 τ²-Bench Telecom 上僅得 5.26。Liquid AI 明確表示該模型不適用於高級數學、代碼生成或創意寫作等推理密集型任務。

LFM2.5-230M 的兩個主要應用場景是：大規模數據提取流水線和輕量級邊緣智能體工作負載。例如，在 4 位量化下，該模型僅需 293–375 MB 內存，可在普通 CPU 上運行臨牀報告解析；或者作為家庭自動化中樞，將語音轉換為工具調用。早期信號顯示，該模型已部署在 Unitree G1 人形機器人上，完全運行於機載 NVIDIA Jetson Orin，作為技能選擇層將自然語言指令轉為工具調用序列。

模型支持函數調用，包括四個步驟：在系統提示中定義 JSON 工具，模型輸出 Python 風格函數調用，執行後返回結果，模型再給出純文本回答。開發者可通過 Transformers 5.0.0+ 輕鬆加載，推薦設置 temperature=0.1、top_k=50、repetition_penalty=1.05。Liquid AI 還提供了微調教程，涵蓋 SFT、DPO 和 GRPO 的 LoRA 方法，附有 Colab 筆記本。該模型採用 lfm1.0 許可證。