智谱AI发布GLM-4.6大模型：代码能力提升27%，实现国产芯片深度适配

智谱AI于2025年9月30日正式发布新一代旗舰大模型 GLM-4.6，该模型在代码能力、推理效率及国产芯片适配方面实现多项突破，标志着国产大模型技术生态的进一步成熟。

核心性能提升
GLM-4.6作为GLM系列最新版本，代码生成能力较前代GLM-4.5提升27%，在公开基准测试中表现对齐国际先进模型Claude Sonnet 4，并在74项真实编程任务中超越同类国产模型。模型总参数量达3550亿，激活参数320亿，上下文窗口由128K扩展至200K，支持更复杂的代码序列与智能体交互任务。此外，其推理过程新增工具调用与搜索强化能力，平均token处理成本降低30%以上，为行业最低水平。

国产芯片深度适配
发布当日，寒武纪与摩尔线程同步宣布完成对GLM-4.6的适配。寒武纪通过FP8+Int4混合量化技术实现模型部署，其中核心参数采用Int4量化压缩至FP16体积的1/4，关键模块保留FP8精度以维持语义准确性。该方案在保持模型精度的同时显著降低显存占用，成为国产芯片首例模型-芯片一体化推理解决方案。摩尔线程则基于vLLM框架实现原生FP8精度支持，验证了其MUSA架构的生态兼容性。

商业化与开源进展
GLM-4.6已上线智谱MaaS平台bigmodel.cn，并将通过Hugging Face、ModelScope开源。智谱表示，该模型与国产芯片的组合将优先通过MaaS平台向企业提供服务，推动国产技术栈在训练推理环节的闭环应用。此前，GLM-4.5的API商业化已实现10倍增长，GLM-4.6有望进一步拓展在智能体开发、长文本处理等企业场景的落地空间。

此次发布凸显国产AI软硬件协同能力，为千亿参数大模型的低成本本地化部署提供实践样本，加速自主可控技术生态的构建。

文章版权归作者所有，未经允许请勿转载。

智谱AI发布GLM-4.6大模型：代码能力提升27%，实现国产芯片深度适配

蚂蚁集团开源全球首个万亿参数推理大模型Ring-1T-preview，多项测试超越GPT-5

微软发布Microsoft Agent Framework公开预览版：重构AI智能体开发新范式

相关文章

理想同学更新 DeepSeek R1-0528 模型，提高数学编程推理能力和创意写作能力

360开源FG-CLIP2视觉模型，29项测试超越谷歌Meta，实现AI细粒度识别突破

字节跳动TRAE SOLO正式版发布：响应式编程助手开启AI全流程开发新时代

OpenAI GPT-5模型即将发布：多模态整合与深度推理能力重新定义AI边界

最新资讯

热门AI工具

热门资讯