智谱GLM-4.5模型服务稳定性问题及解决方案

AI产品动态9个月前发布 AI视野

7月29日晚间，智谱GLM团队发布公开声明，就近期GLM-4.5 模型服务出现的稳定性问题向用户致歉。声明指出，由于用户量激增导致智谱清言、z.ai及BigModel开放平台相继出现响应延迟、任务中断及部署异常等情况，此前推出的50元包月限量活动也因并发压力面临服务保障挑战。

技术团队目前正紧急扩容计算资源以缓解服务压力，同时提出两项过渡方案：针对已获取限量券的用户，承诺在系统稳定后延续服务权益，并将活动期限延长一周；对于智谱清言与z.ai的体验用户，推荐优先使用轻量化版本GLM-4.5-Air。该版本虽参数规模缩减至1060亿（激活参数120亿），但仍保持网页生成、PPT制作等核心功能，且API调用成本显著降低，输入输出分别仅需0.8元/百万tokens和2元/百万tokens。

此次服务波动源于7月28日GLM-4.5系列模型的突然发布。该系列采用混合专家架构，其中旗舰版GLM-4.5以3550亿参数实现多项性能突破，在开源模型评测中位列全球第三、国产模型第一。其高速版生成速度达100tokens/秒，编程能力接近Claude-4-Sonnet水平。团队表示，资源调度优化工作预计将在未来数日内完成，届时将恢复全部服务的稳定运行。

AI产品动态 # AI # GLM-4.5 # 智谱GLM # 模型服务 # 稳定性问题

文章版权归作者所有，未经允许请勿转载。

智谱GLM-4.5模型服务稳定性问题及解决方案

金山办公发布WPS AI 3.0版本WPS灵犀，实现办公AI从工具向助理演进

1688全面AI化战略落地：推出独立AI版App及免费企业查询工具

相关文章

英伟达开源Nemotron-Nano-9B-V2模型：90亿参数性能比肩主流，吞吐量达6.3倍

富士康联手英伟达：2026年在美国工厂部署人形机器人生产AI服务器

可灵AI 2.1首尾帧功能重磅发布，视频生成效果提升235%突破技术瓶颈

天太机器人签署全球首个万台具身智能人形机器人订单，开启规模化商用新时代

最新资讯

热门AI工具

热门资讯