剛剛,國產AI自己造了AI,全球首例!
面壁智慧推出全球首個完全由AI編寫的大模型預訓練框架ForgeTrain,效能超越輝達Megatron 10%,並用它訓練出新模型MiniCPM5-1B,該模型在1B引數規模下重新整理智慧密度上限。
文章情報
要點
- 面壁智慧釋出ForgeTrain,全球首個AI編寫的生產級預訓練框架。
- ForgeTrain在華為昇騰上比原框架加速10%,超越輝達Megatron。
- 用ForgeTrain訓練的MiniCPM5-1B在AA-Index上超越所有2B以下模型。
- 提出Forge Engineering正規化,AI為不同場景定製專用程式碼。
為什麼重要
這條新聞值得關注,因為面壁智慧釋出ForgeTrain,全球首個AI編寫的生產級預訓練框架。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
剛剛,國產AI自己造了AI,全球首例! – 量子位
剛剛,國產AI自己造了AI,全球首例!
十三 2026-05-26 16:46:15
來源:量子位
訓練速度比輝達Megatron快10%
金磊 發自 凹非寺
量子位 | 公眾號 QbitAI
造AI這件事,現在的主角變成了AI。
因為就在剛剛,一個國產AI先自己寫出了一套大模型預訓練框架,然後再用這套預訓練框架,訓練出了一個新的小尺寸模型!
這就是面壁智慧搞出來的big news。
這套由AI寫出來的預訓練框架叫做ForgeTrain,它是全球首個完全由AI編寫的生產級大模型預訓練框架,效能甚至超越了輝達的Megatron。
並且ForgeTrain在華為昇騰上預訓練MiniCPM5-1B,相比昇騰的框架也有10%的加速。
圍繞它,面壁智慧還提出了一套新的軟體程式設計正規化,叫Forge Engineering。
更直白一點說,就是當AI寫程式碼的成本越來越低,未來軟體不一定非要做成一套通用大框架,也可以針對不同模型、不同硬體、不同任務,現場鍛造一套專用程式碼。
而被ForgeTrain訓練出來的新模型,就是MiniCPM5-1B。
至於三者的關係,我們用一張圖來解釋:
雖然過去行業裡關於“AI製造AI”的聲音不斷,但總歸來說,都還停留在特定的環節,比如寫一段函式、改一個指令碼、調一組引數等等。
不過這一次,中國大模型公司第一次把“AI製造AI”從概念,推進到了可展示、可評測、可復現的工程樣本。
AI造出來的AI,能幹啥?
既然MiniCPM5-1B是ForgeTrain訓練出來的模型,最直接的問題來了:
AI造出來的AI,到底能幹什麼?
先看一個最直觀的場景——桌寵。
這個1B引數規模的小模型,它可以常駐在電腦桌面上,變成一個隨時響應的AI小夥伴。你可以跟它聊天,讓它根據上下文接話,也可以給它設定不同的人格。
影片地址:
https://mp.weixin.qq.com/s/Ci0BXKMJHy086MycdqH77w
(本專案基於clawd-on-desk專案二次開發:
https://github.com/OpenBMB/MiniCPM-Desk-Pet)
這個桌寵的重點在於,它不是一定要跑在雲端的大模型服務,1B規模意味著它足夠小,部署門檻也足夠低。
按照面壁智慧官方的說法,MiniCPM5-1B在FP16精度下權重體積約2GB,適合GPU、高階筆電和伺服器;INT4/Q4精度約0.5GB,可以面向手機、平板、車機等裝置。
MiniCPM5-1B想證明的,是1B模型也可以更能打。
在綜合知識、數學推理、程式碼推理、工具呼叫等方向上,MiniCPM5-1B都拿出了面向同尺寸端側模型的對比結果。
公開評測中,MiniCPM5-1B/think平均分為42.57;在MMLU-Pro、MMLU-Redux、AIME-2025、AIME-2026、BFCL-v4、AA榜單等專案上,也給出了對應成績。
尤其值得一提的是,MiniCPM5-1B再次重新整理了小模型的智慧密度上限。
僅以1B引數規模,它就在國際知名榜單AA-Index上超越了所有2B引數以下模型。相比3個月前釋出的Qwen3.5-2B,MiniCPM5-1B不僅效果更優,引數量還減少了一半。
這背後其實指向一個越來越清晰的趨勢:模型能力提升,不再只靠把引數規模越堆越大。更小的模型,也正在承載更高的智慧密度。按照這一趨勢觀察,大模型的智慧密度正在以約每3.5個月翻一番的速度持續提升。
這也讓MiniCPM5-1B的價值更明確了,它不只是一個小尺寸模型,而是一個在引數規模、部署成本和實際能力之間重新找平衡點的端側模型。
除此之外,它還可以自定義人格:
影片地址:
https://mp.weixin.qq.com/s/Ci0BXKMJHy086MycdqH77w
雖然這聽起來像聊天產品裡的基礎功能,但在端側模型上意義更大,因為端側模型離使用者更近,更容易成為本地裝置上的輕量級智慧入口。
它可以記住使用者偏好的互動方式,也可以根據不同場景切換風格。
如果大模型要從雲端走向每個人的裝置,模型必須足夠小、足夠便宜、足夠好用,還要有完整工具鏈。
這也是它強調開發者友好的原因。
MiniCPM5-1B提供了模型、推理、微調相關工具鏈。推理側支援SGLang、vLLM、llama.cpp、Ollama、Hugging Face、ArcLight等;微調側支援LLaMA-Factory、ms-swift等工具。
對開發者來說,這比單純給一個模型權重更重要。
因為模型能不能被用起來,往往不只取決於模型本身,也取決於部署、推理、量化、微調、接入工作流是不是順手。
還超過了輝達Megatron
如果說MiniCPM5-1B是AI製造AI的產品,那麼ForgeTrain就是AI製造AI的工廠。而這個工廠,本身也是AI造出來的。
面壁智慧把AI製造AI分成了L1到L5五個階段:
L1:AI 只給建議,人類執行所有操作(代表:Github Copilot)
L2:AI 輔助研發,完成具體環節(代表:Cursor,Claude Code)
L3:AI 端到端產出下一代模型(代表:ForgeTrain)
L4:AI 遞迴自改進,改造訓練管線和自身
L5:AI 自主設定研究議程,開放式探索
ForgeTrain對應的正是L3-L4這個階段。它還沒有到AI自己發明下一代Transformer的程度,但它已經進入了大模型研發最核心的基礎設施層——預訓練框架。
在此之前,全世界很多大模型預訓練框架,都是人類程式設計師一行一行寫出來的。輝達的Megatron、Meta的 Fairseq、谷歌的TensorFlow,無一不是如此。
但面壁智慧提出了一個完全不同的思路,Forge Engineering。
過去的軟體工程強調通用框架,一個框架要相容各種模型、各種硬體、各種訓練任務。好處是程式碼可以複用,代價是很難把每個具體場景都壓榨到極致。就像一件均碼的衣服,誰都能穿,但誰都穿不合身。
Forge Engineering的思路則激進得多:既然AI寫程式碼越來越快,程式碼生產成本越來越低,那我們為什麼還要追求通用?我們完全可以給不同的模型、不同的硬體、不同的任務,分別寫專用的程式碼。
這就像從工業化的批次生產,回到了高階定製。AI就是那個不知疲倦的頂級工匠,可以為每一個需求量身打造最適合的程式碼。
但AI自己寫預訓練框架,難點不只在寫程式碼。更難的是:它怎麼知道自己寫對了?怎麼知道速度夠不夠快?怎麼知道視訊記憶體、並行、通訊、穩定性有沒有問題?
這就需要Harness。
咱們可以把Harness理解成一個考場,AI被放進這個考場裡,一輪輪生成程式碼、執行測試、拿到反饋、繼續修改。這個過程完全自動,不需要人類干預。
面壁智慧採用了三階段構建方法論:
從現有預訓練框架採集關鍵資料,形成評測標準和Harness
從評測Harness構建二進位制一致的預訓練框架版本
解除二進位制一致的限制,迭代最佳化到超越參考實現
最終的結果是,ForgeTrain不僅在功能上完全對齊了輝達Megatron,而且在相同的硬體條件下,訓練速度還要快10%。
這意味著,同樣的算力,用ForgeTrain可以節省10%的訓練時間和成本。
這是一件值得被重視的事情
看到這裡,你可能覺得這是一場很酷的技術秀。但透過現象看本質,面壁智慧的這次釋出,正在揭示大模型行業正在發生的一場劇變。
首先,大模型的競爭,正在從堆資源走向極致提效率。
過去幾年,所有大模型廠商都在拼大力出奇跡,拼引數、拼語料、拼算力、拼十萬卡叢集。但這條Scaling Law的路,它是有盡頭的。
當堆料走到天花板,接下來的勝負手是什麼?是效率。
在同樣的算力預算下,誰能產出更多的研發迭代?誰的單代研發週期更短?面壁智慧的AI製造AI給出了答案:
用AI去替代人類研發管線中的重複勞動,把人類數週的程式碼開發壓縮到幾十分鐘。這是唯一能對抗資源瓶頸,實現大模型能力繼續指數級攀升的解法。
其次,AI研究員的角色,正在發生不可逆轉的改變。
在ForgeTrain這樣的系統裡,人類的角色正在發生遷移。從Human in the loop(在迴圈中執行具體程式碼)變成了Human on the loop(在迴圈外進行監督和設計)。
未來的AI科學家,不再需要親自去寫那無窮無盡的CUDA運算元和底層通訊邏輯。他們將變成研發系統的設計者和守界者。他們只需要定義目標、搭建Harness,剩下的髒活累活,全交給不知疲倦的AI去完成。
最後,對於國產大模型和國產晶片而言,這是彎道超車的絕佳契機。
過去,我們評價國產大模型,眼睛總是盯著引數大小、榜單跑分、長文本能力。但真正決定一家公司、一個生態長期核心競爭力的,其實是底層系統——生產模型的能力。
誰能更快地訓練出模型,誰能以更低的成本試錯,誰就能在殘酷的百模大戰中活到最後。
更深遠的戰略意義在於國產算力生態。眾所周知,華為昇騰等國產晶片在硬體算力上正在瘋狂追趕,但最大的短板在於軟體生態。輝達有數以百萬計的開發者花了十五年時間踩坑、最佳化,這是國產晶片靠人力很難在短時間內抹平的差距。
但ForgeTrain提供了一種破局的可能。
如果人不夠,那就用AI來湊!透過AI自動生成適配各種新模型、新硬體的專屬預訓練框架,國產晶片將有機會藉由AI的生產力,極大縮短追趕國際頂尖生態的時間差。
當AI學會了造AI,齒輪就已經開始加速轉動。一個新的紀元,正在我們眼前展開。
MiniCPM5-1B 現已全面開源:
Hugging Face連結:
https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B
GitHub連結:
https://github.com/OpenBMB/MiniCPM
ModelScope連結:
https://modelscope.cn/models/OpenBMB/MiniCPM5-1B
AtomGit:https://ai.gitcode.com/OpenBMB/MiniCPM5-1B
魔樂社群:
https://modelers.cn/models/OpenBMB/MiniCPM5-1B
ForgeTrain開源連結:
https://github.com/OpenBMB/ForgeTrain(5.26晚後上線)
版權所有,未經授權不得以任何形式轉載及使用,違者必究。
AI製造AI 國產AI 面壁智慧 預訓練模型框架
十三
頂流裡最快!智譜,你是在「噴」程式碼吧2026-05-22
國產GPU組了個開源局,把SGLang等核心開發者都搖來了!2026-05-14
國產GPU開始造世界!國內首個全棧具身智慧模擬平臺來了2026-05-19
國內首家百億估值純推理GPU獨角獸誕生!專訪曦望聯席CEO王湛:誰的推理成本更低誰就是贏家2026-04-23
相關閱讀
面壁智慧完成新一輪數億元融資,繼續面向AGI的高效大模型征程
由春華創投、華為哈勃領投
十三2024-04-12
清華大學 融資 面壁智慧
知乎大模型「知海圖AI」上線!產品官宣即內測,為4億使用者摘取「熱榜摘要」
與面壁智慧深度合作
白交2023-04-14
ChatGPT 大模型 知乎 面壁智慧
面壁CEO李大海:物理世界要實現AGI,一定是透過端側智慧
大模型“知識密度”是智慧的核心指標
白交2025-05-09
面壁智慧
面壁智慧大模型即日起開放公眾服務
開啟 Luca 最新體驗
量子位2023-11-04
面壁智慧
成本2元開發遊戲,最快3分鐘完成!全程都是AI智慧體“打工”,大模型加持的那種
首個“大模型+Agent”SaaS級產品ChatDev來了
十三2023-11-15
AI智慧體 大語言模型 面壁智慧
面壁智慧對齊技術UltraFeedback如何讓7B模型打敗70B LLaMA2?
效能 超越引數十倍之大的 LLaMA2-70B-Chat。
量子位2023-10-14
面壁智慧
熱門文章
菲爾茲獎得主都看懵了:OpenAI非數學模型首次自主突破80年未解數學難題
2026-05-21
智象未來超兩千億引數影像大模型HiDream-O1-Image-Pro釋出,融資持續提速
2026-05-20
太初元碁洪源:異構計算能力將成為未來AI算力基礎設施的重要方向|AIGC2026
2026-05-20
騰訊混元開源全新翻譯模型Hy-MT2 ,上線小程式「騰訊Hy翻譯」
2026-05-21
Artificial Analysis放榜:千問3.7問鼎國產模型冠軍,全球前五
2026-05-21
掃碼關注量子位
量子位 QbitAI 版權所有©北京極客夥伴科技有限公司 京ICP備17005886號-1