智谱GLM-4.5模型服务稳定性问题及解决方案

7月29日晚间,智谱GLM团队发布公开声明,就近期GLM-4.5模型服务出现的稳定性问题向用户致歉。声明指出,由于用户量激增导致智谱清言、z.ai及BigModel开放平台相继出现响应延迟、任务中断及部署异常等情况,此前推出的50元包月限量活动也因并发压力面临服务保障挑战。

技术团队目前正紧急扩容计算资源以缓解服务压力,同时提出两项过渡方案:针对已获取限量券的用户,承诺在系统稳定后延续服务权益,并将活动期限延长一周;对于智谱清言与z.ai的体验用户,推荐优先使用轻量化版本GLM-4.5-Air。该版本虽参数规模缩减至1060亿(激活参数120亿),但仍保持网页生成、PPT制作等核心功能,且API调用成本显著降低,输入输出分别仅需0.8元/百万tokens和2元/百万tokens。

此次服务波动源于7月28日GLM-4.5系列模型的突然发布。该系列采用混合专家架构,其中旗舰版GLM-4.5以3550亿参数实现多项性能突破,在开源模型评测中位列全球第三、国产模型第一。其高速版生成速度达100tokens/秒,编程能力接近Claude-4-Sonnet水平。团队表示,资源调度优化工作预计将在未来数日内完成,届时将恢复全部服务的稳定运行。

© 版权声明

相关文章