2026-05-26 16:46 UTC+8站內改寫6 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

剛剛，國產AI自己造了AI，全球首例！

面壁智慧推出全球首個完全由AI編寫的大模型預訓練框架ForgeTrain，效能超越輝達Megatron 10%，並用它訓練出新模型MiniCPM5-1B，該模型在1B引數規模下重新整理智慧密度上限。

來源量子位作者: 十三

剛剛，國產AI自己造了AI，全球首例！ – 量子位

剛剛，國產AI自己造了AI，全球首例！

十三 2026-05-26 16:46:15

來源：量子位

訓練速度比輝達Megatron快10%

金磊發自凹非寺

量子位 | 公眾號 QbitAI

造AI這件事，現在的主角變成了AI。

因為就在剛剛，一個國產AI先自己寫出了一套大模型預訓練框架，然後再用這套預訓練框架，訓練出了一個新的小尺寸模型！

這就是面壁智慧搞出來的big news。

這套由AI寫出來的預訓練框架叫做ForgeTrain，它是全球首個完全由AI編寫的生產級大模型預訓練框架，效能甚至超越了輝達的Megatron。

並且ForgeTrain在華為昇騰上預訓練MiniCPM5-1B，相比昇騰的框架也有10%的加速。

圍繞它，面壁智慧還提出了一套新的軟體程式設計正規化，叫Forge Engineering。

更直白一點說，就是當AI寫程式碼的成本越來越低，未來軟體不一定非要做成一套通用大框架，也可以針對不同模型、不同硬體、不同任務，現場鍛造一套專用程式碼。

而被ForgeTrain訓練出來的新模型，就是MiniCPM5-1B。

至於三者的關係，我們用一張圖來解釋：

雖然過去行業裡關於“AI製造AI”的聲音不斷，但總歸來說，都還停留在特定的環節，比如寫一段函式、改一個指令碼、調一組引數等等。

不過這一次，中國大模型公司第一次把“AI製造AI”從概念，推進到了可展示、可評測、可復現的工程樣本。

AI造出來的AI，能幹啥？

既然MiniCPM5-1B是ForgeTrain訓練出來的模型，最直接的問題來了：

AI造出來的AI，到底能幹什麼？

先看一個最直觀的場景——桌寵。

這個1B引數規模的小模型，它可以常駐在電腦桌面上，變成一個隨時響應的AI小夥伴。你可以跟它聊天，讓它根據上下文接話，也可以給它設定不同的人格。

影片地址：

https://mp.weixin.qq.com/s/Ci0BXKMJHy086MycdqH77w

（本專案基於clawd-on-desk專案二次開發：

https://github.com/OpenBMB/MiniCPM-Desk-Pet）

這個桌寵的重點在於，它不是一定要跑在雲端的大模型服務，1B規模意味著它足夠小，部署門檻也足夠低。

按照面壁智慧官方的說法，MiniCPM5-1B在FP16精度下權重體積約2GB，適合GPU、高階筆電和伺服器；INT4/Q4精度約0.5GB，可以面向手機、平板、車機等裝置。

MiniCPM5-1B想證明的，是1B模型也可以更能打。

在綜合知識、數學推理、程式碼推理、工具呼叫等方向上，MiniCPM5-1B都拿出了面向同尺寸端側模型的對比結果。

公開評測中，MiniCPM5-1B/think平均分為42.57；在MMLU-Pro、MMLU-Redux、AIME-2025、AIME-2026、BFCL-v4、AA榜單等專案上，也給出了對應成績。

尤其值得一提的是，MiniCPM5-1B再次重新整理了小模型的智慧密度上限。

僅以1B引數規模，它就在國際知名榜單AA-Index上超越了所有2B引數以下模型。相比3個月前釋出的Qwen3.5-2B，MiniCPM5-1B不僅效果更優，引數量還減少了一半。

這背後其實指向一個越來越清晰的趨勢：模型能力提升，不再只靠把引數規模越堆越大。更小的模型，也正在承載更高的智慧密度。按照這一趨勢觀察，大模型的智慧密度正在以約每3.5個月翻一番的速度持續提升。

這也讓MiniCPM5-1B的價值更明確了，它不只是一個小尺寸模型，而是一個在引數規模、部署成本和實際能力之間重新找平衡點的端側模型。

除此之外，它還可以自定義人格：

影片地址：

https://mp.weixin.qq.com/s/Ci0BXKMJHy086MycdqH77w

雖然這聽起來像聊天產品裡的基礎功能，但在端側模型上意義更大，因為端側模型離使用者更近，更容易成為本地裝置上的輕量級智慧入口。

它可以記住使用者偏好的互動方式，也可以根據不同場景切換風格。

如果大模型要從雲端走向每個人的裝置，模型必須足夠小、足夠便宜、足夠好用，還要有完整工具鏈。

這也是它強調開發者友好的原因。

MiniCPM5-1B提供了模型、推理、微調相關工具鏈。推理側支援SGLang、vLLM、llama.cpp、Ollama、Hugging Face、ArcLight等；微調側支援LLaMA-Factory、ms-swift等工具。

對開發者來說，這比單純給一個模型權重更重要。

因為模型能不能被用起來，往往不只取決於模型本身，也取決於部署、推理、量化、微調、接入工作流是不是順手。

還超過了輝達Megatron

如果說MiniCPM5-1B是AI製造AI的產品，那麼ForgeTrain就是AI製造AI的工廠。而這個工廠，本身也是AI造出來的。

面壁智慧把AI製造AI分成了L1到L5五個階段：

L1：AI 只給建議，人類執行所有操作（代表：Github Copilot）

L2：AI 輔助研發，完成具體環節（代表：Cursor，Claude Code）

L3：AI 端到端產出下一代模型（代表：ForgeTrain）

L4：AI 遞迴自改進，改造訓練管線和自身

L5：AI 自主設定研究議程，開放式探索

ForgeTrain對應的正是L3-L4這個階段。它還沒有到AI自己發明下一代Transformer的程度，但它已經進入了大模型研發最核心的基礎設施層——預訓練框架。

在此之前，全世界很多大模型預訓練框架，都是人類程式設計師一行一行寫出來的。輝達的Megatron、Meta的 Fairseq、谷歌的TensorFlow，無一不是如此。

但面壁智慧提出了一個完全不同的思路，Forge Engineering。

過去的軟體工程強調通用框架，一個框架要相容各種模型、各種硬體、各種訓練任務。好處是程式碼可以複用，代價是很難把每個具體場景都壓榨到極致。就像一件均碼的衣服，誰都能穿，但誰都穿不合身。

Forge Engineering的思路則激進得多：既然AI寫程式碼越來越快，程式碼生產成本越來越低，那我們為什麼還要追求通用？我們完全可以給不同的模型、不同的硬體、不同的任務，分別寫專用的程式碼。

這就像從工業化的批次生產，回到了高階定製。AI就是那個不知疲倦的頂級工匠，可以為每一個需求量身打造最適合的程式碼。

但AI自己寫預訓練框架，難點不只在寫程式碼。更難的是：它怎麼知道自己寫對了？怎麼知道速度夠不夠快？怎麼知道視訊記憶體、並行、通訊、穩定性有沒有問題？

這就需要Harness。

咱們可以把Harness理解成一個考場，AI被放進這個考場裡，一輪輪生成程式碼、執行測試、拿到反饋、繼續修改。這個過程完全自動，不需要人類干預。

面壁智慧採用了三階段構建方法論：

從現有預訓練框架採集關鍵資料，形成評測標準和Harness

從評測Harness構建二進位制一致的預訓練框架版本

解除二進位制一致的限制，迭代最佳化到超越參考實現

最終的結果是，ForgeTrain不僅在功能上完全對齊了輝達Megatron，而且在相同的硬體條件下，訓練速度還要快10%。

這意味著，同樣的算力，用ForgeTrain可以節省10%的訓練時間和成本。

這是一件值得被重視的事情

看到這裡，你可能覺得這是一場很酷的技術秀。但透過現象看本質，面壁智慧的這次釋出，正在揭示大模型行業正在發生的一場劇變。

首先，大模型的競爭，正在從堆資源走向極致提效率。

過去幾年，所有大模型廠商都在拼大力出奇跡，拼引數、拼語料、拼算力、拼十萬卡叢集。但這條Scaling Law的路，它是有盡頭的。

當堆料走到天花板，接下來的勝負手是什麼？是效率。

在同樣的算力預算下，誰能產出更多的研發迭代？誰的單代研發週期更短？面壁智慧的AI製造AI給出了答案：

用AI去替代人類研發管線中的重複勞動，把人類數週的程式碼開發壓縮到幾十分鐘。這是唯一能對抗資源瓶頸，實現大模型能力繼續指數級攀升的解法。

其次，AI研究員的角色，正在發生不可逆轉的改變。

在ForgeTrain這樣的系統裡，人類的角色正在發生遷移。從Human in the loop（在迴圈中執行具體程式碼）變成了Human on the loop（在迴圈外進行監督和設計）。

未來的AI科學家，不再需要親自去寫那無窮無盡的CUDA運算元和底層通訊邏輯。他們將變成研發系統的設計者和守界者。他們只需要定義目標、搭建Harness，剩下的髒活累活，全交給不知疲倦的AI去完成。

最後，對於國產大模型和國產晶片而言，這是彎道超車的絕佳契機。

過去，我們評價國產大模型，眼睛總是盯著引數大小、榜單跑分、長文本能力。但真正決定一家公司、一個生態長期核心競爭力的，其實是底層系統——生產模型的能力。

誰能更快地訓練出模型，誰能以更低的成本試錯，誰就能在殘酷的百模大戰中活到最後。

更深遠的戰略意義在於國產算力生態。眾所周知，華為昇騰等國產晶片在硬體算力上正在瘋狂追趕，但最大的短板在於軟體生態。輝達有數以百萬計的開發者花了十五年時間踩坑、最佳化，這是國產晶片靠人力很難在短時間內抹平的差距。

但ForgeTrain提供了一種破局的可能。

如果人不夠，那就用AI來湊！透過AI自動生成適配各種新模型、新硬體的專屬預訓練框架，國產晶片將有機會藉由AI的生產力，極大縮短追趕國際頂尖生態的時間差。

當AI學會了造AI，齒輪就已經開始加速轉動。一個新的紀元，正在我們眼前展開。

MiniCPM5-1B 現已全面開源：

Hugging Face連結：

https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B

GitHub連結：

https://github.com/OpenBMB/MiniCPM

ModelScope連結：

https://modelscope.cn/models/OpenBMB/MiniCPM5-1B

AtomGit：https://ai.gitcode.com/OpenBMB/MiniCPM5-1B

魔樂社群：

https://modelers.cn/models/OpenBMB/MiniCPM5-1B

ForgeTrain開源連結：

https://github.com/OpenBMB/ForgeTrain（5.26晚後上線）

AI製造AI 國產AI 面壁智慧預訓練模型框架

十三

頂流裡最快！智譜，你是在「噴」程式碼吧2026-05-22

國產GPU組了個開源局，把SGLang等核心開發者都搖來了！2026-05-14

國產GPU開始造世界！國內首個全棧具身智慧模擬平臺來了2026-05-19

國內首家百億估值純推理GPU獨角獸誕生！專訪曦望聯席CEO王湛：誰的推理成本更低誰就是贏家2026-04-23