商汤华为联手突破AI算力瓶颈:384节点集群实现92%线性加速比

近日,商汤科技宣布其AI大装置SenseCore成功适配华为昇腾Atlas 900 SuperCluster的384节点超大规模集群,显著提升了AI训练效率。这一合作标志着国产AI基础设施在超大规模并行计算领域取得重要突破。

据商汤科技披露,此次适配基于华为昇腾AI处理器和CANN异构计算架构,通过优化通信库和分布式训练框架,实现了千卡级集群的线性加速比达到92%。在ResNet-50等典型模型训练中,相比传统方案效率提升40%以上。华为昇腾计算业务负责人表示,该方案有效解决了超大规模集群中常见的通信瓶颈问题,单任务可支持超过10亿参数的模型训练。

行业数据显示,此次合作涉及的384节点集群总算力超过1.8EFLOPS(FP16),相当于3小时内完成传统单卡需要30天完成的CV模型训练。商汤联合实验室负责人指出,该技术将优先应用于智慧城市、自动驾驶等需要海量数据训练的垂直领域。值得注意的是,这是继2023年双方共建”大模型联合创新实验室”后,在硬件层面对国产算力生态的又一次完善。

目前,该方案已在上海临港人工智能计算中心完成部署测试。第三方测试报告显示,在保持98%训练精度的前提下,集群资源利用率较国际主流方案提升15个百分点。业内人士认为,此次合作或将对国内AI基础设施的自主可控进程产生示范效应,特别是在大模型研发等高性能计算场景中。

© 版权声明

相关文章