智谱AI开源高速GLM模型:推理速度提升8倍,推出Z.ai平台,全球化扩张或为IPO铺路
中国AI公司智谱AI宣布开源其新一代GLM模型系列,包括推理速度达DeepSeek-R1八倍的GLM-Z1、具备自主推理能力的Rumination模型GLM-Z1-Rumination-32B-0414,以及增强智能体能力的GLM-4-32B-0414。同时推出国际平台Z.ai,并通过MaaS平台提供企业级服务。此举展示了其技术实力和全球野心,可能为潜在IPO做准备。
2025年4月15日,中国人工智能公司智谱AI宣布全面开源其新一代通用语言模型(GLM)系列,包括进阶版GLM-4系列和突破性的GLM-Z1推理模型。这一举措不仅展示了其技术实力,更凸显了其全球化野心,并可能为未来的首次公开募股(IPO)铺平道路。同时,智谱AI推出了专用国际域名Z.ai,作为开源模型的全球体验平台。
GLM-Z1推理模型是此次发布的亮点。智谱声称,通过优化GQA参数、采用量化技术和投机采样,GLM-Z1-32B-0414的推理速度是DeepSeek-R1的八倍,在消费级GPU上可实现每秒200个token的处理速度,相当于人类阅读速度的50倍。这种卓越的响应能力使其在高效AI推理领域占据领先地位,为智谱未来的市场扩张提供了关键优势。
此外,智谱还推出了名为“Rumination”的模型——GLM-Z1-Rumination-32B-0414。该模型标志着向更自主的AI代理迈出了一步,能够主动搜索互联网、使用工具、进行深入分析并自我验证信息,以处理复杂的开放式问题。这超越了纯反应型AI,彰显了智谱的前沿研究实力。
开源产品组合还包括基础模型GLM-4-32B-0414,该模型针对智能体能力进行了特别增强,在工具使用、网络搜索和代码生成方面表现出色。其能在对话中实时生成HTML、CSS、JS和SVG等语言代码,显著提升了开发者的生产力。
考虑到AI社区的多样化需求,智谱还开源了GLM-4和GLM-Z1的小型9B参数版本。这些紧凑而强大的模型在数学推理和通用任务中展现了令人印象深刻的性能,为资源受限环境提供了高效解决方案,进一步扩大了智谱的吸引力。所有模型均采用宽松的MIT许可证发布。
这一战略性的开源举措,加上国际平台Z.ai的上线,强烈表明了智谱AI致力于全球可访问性和培育开放开源AI生态系统的决心。新域名Z.ai作为全球用户自由体验这些先进模型的核心枢纽,提供网页界面和专用应用。
对于企业客户,智谱继续提供其强大的模型即服务(MaaS)平台,现已集成新开源的基础模型和推理模型。该平台提供具有分层定价的API访问,包括超高速的GLM-Z1-AirX、高性价比的GLM-Z1-Air以及免费的GLM-Z1-Flash,满足各种商业应用需求。基础模型GLM-4-Air-250414和免费的GLM-4-Flash-250414也在MaaS平台上可用。
随着智谱AI通过这次重要的开源发布和Z.ai的推出战略性地扩展其全球足迹并展示其技术领导力,此举可能被解读为公司为近期潜在IPO做好准备和抱负的有力信号。通过民主化地提供其尖端AI技术,智谱不仅促进了创新,还建立了强大的全球影响力和用户基础。
免费体验新GLM模型:https://chat.z.ai/ 开源下载:https://huggingface.co/collections/THUDM/glm-4-0414-67f3cbcb34dd9d252707cb2e