商汤华为联手突破AI算力瓶颈：384节点集群实现92%线性加速比

近日，商汤科技宣布其AI大装置SenseCore成功适配华为昇腾Atlas 900 SuperCluster的384节点超大规模集群，显著提升了AI训练效率。这一合作标志着国产AI基础设施在超大规模并行计算领域取得重要突破。

据商汤科技披露，此次适配基于华为昇腾AI处理器和CANN异构计算架构，通过优化通信库和分布式训练框架，实现了千卡级集群的线性加速比达到92%。在ResNet-50等典型模型训练中，相比传统方案效率提升40%以上。华为昇腾计算业务负责人表示，该方案有效解决了超大规模集群中常见的通信瓶颈问题，单任务可支持超过10亿参数的模型训练。

行业数据显示，此次合作涉及的384节点集群总算力超过1.8EFLOPS（FP16），相当于3小时内完成传统单卡需要30天完成的CV模型训练。商汤联合实验室负责人指出，该技术将优先应用于智慧城市、自动驾驶等需要海量数据训练的垂直领域。值得注意的是，这是继2023年双方共建”大模型联合创新实验室”后，在硬件层面对国产算力生态的又一次完善。

目前，该方案已在上海临港人工智能计算中心完成部署测试。第三方测试报告显示，在保持98%训练精度的前提下，集群资源利用率较国际主流方案提升15个百分点。业内人士认为，此次合作或将对国内AI基础设施的自主可控进程产生示范效应，特别是在大模型研发等高性能计算场景中。

文章版权归作者所有，未经允许请勿转载。

商汤华为联手突破AI算力瓶颈：384节点集群实现92%线性加速比

美团AI搜索功能内测启动：用大模型重构本地生活智能推荐

苹果遭集体诉讼：被指控用盗版书籍训练OpenELM AI系统，涉版权侵权

相关文章

阿里云扩展全球数据中心布局，设立首个AI全球能力中心

亚马逊仓库机器人突破百万台，AI驱动效率提升20倍

美国国防部选定谷歌Gemini AI平台，为300万军事人员提供AI支持

OpenAI重大突破：发现AI模型隐藏特征与异常行为的直接关联

最新资讯

热门AI工具

热门资讯