智谱AI于2025年9月30日正式发布新一代旗舰大模型GLM-4.6,该模型在代码能力、推理效率及国产芯片适配方面实现多项突破,标志着国产大模型技术生态的进一步成熟。
核心性能提升
GLM-4.6作为GLM系列最新版本,代码生成能力较前代GLM-4.5提升27%,在公开基准测试中表现对齐国际先进模型Claude Sonnet 4,并在74项真实编程任务中超越同类国产模型。模型总参数量达3550亿,激活参数320亿,上下文窗口由128K扩展至200K,支持更复杂的代码序列与智能体交互任务。此外,其推理过程新增工具调用与搜索强化能力,平均token处理成本降低30%以上,为行业最低水平。
国产芯片深度适配
发布当日,寒武纪与摩尔线程同步宣布完成对GLM-4.6的适配。寒武纪通过FP8+Int4混合量化技术实现模型部署,其中核心参数采用Int4量化压缩至FP16体积的1/4,关键模块保留FP8精度以维持语义准确性。该方案在保持模型精度的同时显著降低显存占用,成为国产芯片首例模型-芯片一体化推理解决方案。摩尔线程则基于vLLM框架实现原生FP8精度支持,验证了其MUSA架构的生态兼容性。
商业化与开源进展
GLM-4.6已上线智谱MaaS平台bigmodel.cn,并将通过Hugging Face、ModelScope开源。智谱表示,该模型与国产芯片的组合将优先通过MaaS平台向企业提供服务,推动国产技术栈在训练推理环节的闭环应用。此前,GLM-4.5的API商业化已实现10倍增长,GLM-4.6有望进一步拓展在智能体开发、长文本处理等企业场景的落地空间。
此次发布凸显国产AI软硬件协同能力,为千亿参数大模型的低成本本地化部署提供实践样本,加速自主可控技术生态的构建。
© 版权声明
文章版权归作者所有,未经允许请勿转载。