郭震 AI公众号:郭震AI

实时 AI 消息

智谱AI正式发布GLM-5.2开源模型,同时提供FP8量化版本

智谱AI(Zhipu AI)在Hugging Face上正式发布了GLM-5.2基础模型及其FP8量化版本GLM-5.2-FP8。两款模型均为文本生成对话模型,采用MoE架构,支持中英文,已在社区获得广泛关注。

发布时间阅读: --

7月2日,智谱AI在Hugging Face模型社区正式上线了GLM-5.2系列模型,包含基础版GLM-5.2和FP8量化版GLM-5.2-FP8。这是智谱在开源大模型方向上的又一重要发布。

GLM-5.2为文本生成对话模型,基于transformers库构建,采用glm_moe_dsa的混合专家(MoE)架构设计,同时支持中文和英文。模型的相关技术论文已在arXiv上公开(编号2602.15763),为开发者提供了完整的参考。

与基础版同时发布的GLM-5.2-FP8是经过FP8量化的高效版本。FP8量化在保持模型推理质量的同时,显著降低了显存占用和推理延迟,更适合生产环境的低成本部署。

智谱AI正式发布GLM-5.2开源模型,同时提供FP8量化版本
图源: huggingface.co

从社区反馈来看,GLM-5.2基础版在Hugging Face上获得了超过3197次点赞,下载量突破17.6万次;而FP8版本的下载量更是超过105万次,反映出开发者对量化部署版本的强烈需求。

GLM系列一直是中国开源大模型的重要代表。GLM-5.2的发布延续了智谱在开源生态中的布局,其MoE架构和双语能力使其在中文场景下的应用潜力值得关注。

值得留意的是,FP8量化版的下载量远超基础版,这暗示开发者社区对高效推理、低成本的模型部署方案有迫切需求,也为其他模型厂商的发布策略提供了参考。

接下来,外界将关注GLM-5.2在各类基准评测上的实际表现,以及智谱是否会进一步推出更大参数规模的版本或针对特定场景的微调版。

为什么重要

GLM-5.2的开源发布增强了中国AI公司在开源大模型领域的影响力,其FP8量化版的高下载量表明社区对高效推理方案需求旺盛,可能推动更多模型厂商拥抱量化策略。

GLMZhipu AIOpen-Source ModelHugging Face