AI News HubLIVE
站內改寫2 分鐘閱讀

智譜AI開源高速GLM模型:推理速度提升8倍,推出Z.ai平臺,全球化擴張或為IPO鋪路

中國AI公司智譜AI宣佈開源其新一代GLM模型系列,包括推理速度達DeepSeek-R1八倍的GLM-Z1、具備自主推理能力的Rumination模型GLM-Z1-Rumination-32B-0414,以及增強智慧體能力的GLM-4-32B-0414。同時推出國際平臺Z.ai,並透過MaaS平臺提供企業級服務。此舉展示了其技術實力和全球野心,可能為潛在IPO做準備。

來源Synced Review作者: Synced

2025年4月15日,中國人工智慧公司智譜AI宣佈全面開源其新一代通用語言模型(GLM)系列,包括進階版GLM-4系列和突破性的GLM-Z1推理模型。這一舉措不僅展示了其技術實力,更凸顯了其全球化野心,並可能為未來的首次公開募股(IPO)鋪平道路。同時,智譜AI推出了專用國際域名Z.ai,作為開源模型的全球體驗平臺。

GLM-Z1推理模型是此次釋出的亮點。智譜聲稱,透過最佳化GQA引數、採用量化技術和投機取樣,GLM-Z1-32B-0414的推理速度是DeepSeek-R1的八倍,在消費級GPU上可實現每秒200個token的處理速度,相當於人類閱讀速度的50倍。這種卓越的響應能力使其在高效AI推理領域佔據領先地位,為智譜未來的市場擴張提供了關鍵優勢。

此外,智譜還推出了名為“Rumination”的模型——GLM-Z1-Rumination-32B-0414。該模型標誌著向更自主的AI代理邁出了一步,能夠主動搜尋網際網路、使用工具、進行深入分析並自我驗證資訊,以處理複雜的開放式問題。這超越了純反應型AI,彰顯了智譜的前沿研究實力。

開源產品組合還包括基礎模型GLM-4-32B-0414,該模型針對智慧體能力進行了特別增強,在工具使用、網路搜尋和程式碼生成方面表現出色。其能在對話中即時生成HTML、CSS、JS和SVG等語言程式碼,顯著提升了開發者的生產力。

考慮到AI社群的多樣化需求,智譜還開源了GLM-4和GLM-Z1的小型9B引數版本。這些緊湊而強大的模型在數學推理和通用任務中展現了令人印象深刻的效能,為資源受限環境提供了高效解決方案,進一步擴大了智譜的吸引力。所有模型均採用寬鬆的MIT許可證釋出。

這一戰略性的開源舉措,加上國際平臺Z.ai的上線,強烈表明了智譜AI致力於全球可訪問性和培育開放開源AI生態系統的決心。新域名Z.ai作為全球使用者自由體驗這些先進模型的核心樞紐,提供網頁介面和專用應用。

對於企業客戶,智譜繼續提供其強大的模型即服務(MaaS)平臺,現已整合新開源的基礎模型和推理模型。該平臺提供具有分層定價的API訪問,包括超高速的GLM-Z1-AirX、高價效比的GLM-Z1-Air以及免費的GLM-Z1-Flash,滿足各種商業應用需求。基礎模型GLM-4-Air-250414和免費的GLM-4-Flash-250414也在MaaS平臺上可用。

隨著智譜AI透過這次重要的開源釋出和Z.ai的推出戰略性地擴充套件其全球足跡並展示其技術領導力,此舉可能被解讀為公司為近期潛在IPO做好準備和抱負的有力訊號。透過民主化地提供其尖端AI技術,智譜不僅促進了創新,還建立了強大的全球影響力和使用者基礎。

免費體驗新GLM模型:https://chat.z.ai/ 開源下載:https://huggingface.co/collections/THUDM/glm-4-0414-67f3cbcb34dd9d252707cb2e