AI News HubLIVE
站內改寫2 分鐘閱讀

智譜AI開源高速GLM模型:推理速度提升8倍,推出Z.ai平台,全球化擴張或為IPO鋪路

中國AI公司智譜AI宣佈開源其新一代GLM模型系列,包括推理速度達DeepSeek-R1八倍的GLM-Z1、具備自主推理能力的Rumination模型GLM-Z1-Rumination-32B-0414,以及增強智能體能力的GLM-4-32B-0414。同時推出國際平台Z.ai,並通過MaaS平台提供企業級服務。此舉展示了其技術實力和全球野心,可能為潛在IPO做準備。

來源Synced Review作者: Synced

2025年4月15日,中國人工智能公司智譜AI宣佈全面開源其新一代通用語言模型(GLM)系列,包括進階版GLM-4系列和突破性的GLM-Z1推理模型。這一舉措不僅展示了其技術實力,更凸顯了其全球化野心,並可能為未來的首次公開募股(IPO)鋪平道路。同時,智譜AI推出了專用國際域名Z.ai,作為開源模型的全球體驗平台。

GLM-Z1推理模型是此次發佈的亮點。智譜聲稱,通過優化GQA參數、採用量化技術和投機採樣,GLM-Z1-32B-0414的推理速度是DeepSeek-R1的八倍,在消費級GPU上可實現每秒200個token的處理速度,相當於人類閲讀速度的50倍。這種卓越的響應能力使其在高效AI推理領域佔據領先地位,為智譜未來的市場擴張提供了關鍵優勢。

此外,智譜還推出了名為“Rumination”的模型——GLM-Z1-Rumination-32B-0414。該模型標誌着向更自主的AI代理邁出了一步,能夠主動搜索互聯網、使用工具、進行深入分析並自我驗證信息,以處理複雜的開放式問題。這超越了純反應型AI,彰顯了智譜的前沿研究實力。

開源產品組合還包括基礎模型GLM-4-32B-0414,該模型針對智能體能力進行了特別增強,在工具使用、網絡搜索和代碼生成方面表現出色。其能在對話中實時生成HTML、CSS、JS和SVG等語言代碼,顯著提升了開發者的生產力。

考慮到AI社區的多樣化需求,智譜還開源了GLM-4和GLM-Z1的小型9B參數版本。這些緊湊而強大的模型在數學推理和通用任務中展現了令人印象深刻的性能,為資源受限環境提供了高效解決方案,進一步擴大了智譜的吸引力。所有模型均採用寬鬆的MIT許可證發佈。

這一戰略性的開源舉措,加上國際平台Z.ai的上線,強烈表明了智譜AI致力於全球可訪問性和培育開放開源AI生態系統的決心。新域名Z.ai作為全球用户自由體驗這些先進模型的核心樞紐,提供網頁界面和專用應用。

對於企業客户,智譜繼續提供其強大的模型即服務(MaaS)平台,現已集成新開源的基礎模型和推理模型。該平台提供具有分層定價的API訪問,包括超高速的GLM-Z1-AirX、高性價比的GLM-Z1-Air以及免費的GLM-Z1-Flash,滿足各種商業應用需求。基礎模型GLM-4-Air-250414和免費的GLM-4-Flash-250414也在MaaS平台上可用。

隨着智譜AI通過這次重要的開源發佈和Z.ai的推出戰略性地擴展其全球足跡並展示其技術領導力,此舉可能被解讀為公司為近期潛在IPO做好準備和抱負的有力信號。通過民主化地提供其尖端AI技術,智譜不僅促進了創新,還建立了強大的全球影響力和用户基礎。

免費體驗新GLM模型:https://chat.z.ai/ 開源下載:https://huggingface.co/collections/THUDM/glm-4-0414-67f3cbcb34dd9d252707cb2e