AI News HubLIVE
站內改寫2 分鐘閱讀

AI革命不會在電視上播出——它將量化

中國AI實驗室正在引領量化和開放權重模型的發展,使前沿AI變得可訪問且成本低廉。專家討論這如何將權力從專有的美國模型轉移到本地可定製的解決方案,可能推動原始模型智慧的商品化。

來源The New Stack AI作者: Adrian Bridgwater

借用吉爾·斯科特-赫倫1971年的抗議歌曲,如果說AI革命不會被量化,那可能就錯了。在中國,一場文化變革正在進行,量化確實在推動變化。

量化是壓縮AI模型權重至更低數值精度的過程,使模型更小、執行成本更低。它與開放權重模型的提供並行,開發者可以公開訪問模型的訓練引數,然後定製模型並在本地或選擇的雲上執行。RQR Intelligence指出,“中國AI生態系統的巨大優勢在於其對開放權重的堅定承諾。”

軟體工程師能夠使用Qwen、小米的MiMo或DeepSeek V4 Pro等模型,下載權重,經過量化過程,然後在本地機器或選擇的雲服務上執行和託管,從而獲得前沿智慧。Sonar的首席工程師Gautam Korlam表示:“中國前沿模型如Z.AI、Qwen、GLM和DeepSeek已成為當今軟體開發的實用工具。它們適用於測試生成、重構、倉庫分析、文件和初步除錯。但需要注意的是,它們仍需驗證。它們是有用的工程工具,但不是自主的高階工程師。”

Korlam進一步指出,中國前沿模型的最大優勢不僅僅是基準測試的提升,而是從不同角度的實力展示。“有了這些中國前沿模型,開發者可以檢查、微調、本地執行,並將其整合到僅透過API部署難以實現的工作流程中。這使團隊對成本和智慧有更多控制。”

對專有封閉權重AI前沿模型公司的革命,部分源於對美國GPU硬體出口管制的戰略回應。這些約束促使中國AI實驗室透過使用各種編碼方法進行創新。Index.dev指出,阿里巴巴雲的Qwen透過稀疏模型方法實現效率,在推理時僅啟用部分引數。“與傳統AI模型一次啟用所有引數不同,Qwen3-Max僅使用與給定任務相關的部分。這使得推理效率提高約30%,在不消耗大量計算能力的情況下實現高效能。”

Quesma的創始工程師Piotr Migdał表示:“事情變得有趣了,但這是雙刃劍。對公司和開發者來說是福音。同時,這意味著工具可以被任何一方——國家或私人——用於防禦或攻擊。”他認為Z.ai的GLM 5.2等模型的釋出表明AI競賽不再只是美國的事情。Migdał指出:“雖然競爭激烈,但可以期待更多中國模型領先。”

隨著中國前沿AI模型被廣泛基準測試、評論,並且很少因幻覺受到指責,下一個轉折點可能帶來新的標準化、透明度,甚至是商品化。OC&C戰略諮詢公司的合夥人James McGibney認為:“原始模型智慧已經開始商品化,更便宜的中國開放權重和量化模型將加速這一轉變。”其結果是企業可能逐案選擇模型。當商品化開花時,將推動前沿AI公司向上游移動,專注於軟體、工作流整合、治理和實施層,使AI在真實商業環境中可靠且有價值。

回到吉爾·斯科特-赫倫,他說革命不會在電視上播出,意思是真正的變化是內在的,不會被贊助或商業化,沒有人應該坐以待斃。如果他今天還在,並關注中國前沿模型的發展,他可能會同意AI模型革命很可能被量化。也許唯一的區別是,在軟體開發者的參與下,這場革命幾乎肯定會伴隨可樂進行得更好。