商汤科技SenseCore与华为昇腾384超节点完成全面适配,国产AI算力基础设施获关键突破

AI产品动态21小时前发布 AI视野

近日,商汤科技宣布其AI云原生平台商汤大装置SenseCore与华为昇腾384超节点(Atlas 900 A3 SuperPoD)完成全面适配,在功能与性能验证中均达到预期目标。这一合作标志着国产AI算力基础设施取得关键突破,为大规模AI模型训练与推理提供了更高效的算力支撑。

超节点(SuperPod)是一种通过高速互联技术整合多GPU/NPU的新型架构,旨在解决大模型训练中的算力协同与通信效率问题。昇腾384超节点作为华为推出的业界最大规模方案,采用创新的“全对等架构”,将总线从服务器内部扩展至整机柜甚至跨机柜,实现CPU、NPU、存储等资源的全互联与池化,形成具备更高算力密度和带宽的“超级计算机”。

此次适配中,商汤与华为联合攻关,在调度优化、系统稳定性及故障恢复等方面实现多项创新。SenseCore团队通过修复跨POD场景下的任务rank乱序问题,显著提升训练稳定性;同时构建覆盖硬件、网络到任务进程的多维度故障检测与恢复机制,使系统具备Job/Pod/进程多级容错能力。目前,商汤已完成某客户基于昇腾384超节点的端到端交付,涵盖液冷集群至AI平台全链路。

商汤科技大装置事业群CTO宣善明表示,此次合作是国产AI基础设施融合发展的重要里程碑。SenseCore通过深度释放昇腾算力潜能,将为产业界提供敏捷、智能、可靠的算力底座。未来,双方计划拓展大模型推理加速、智能体部署及垂直行业模型优化等场景,推动昇腾384超节点在金融、制造、医疗等领域的规模化应用。

此次适配不仅实现多租户弹性AI云服务的技术可行性,也为国产AI生态从“可用”到“好用”转型提供了实践范本。分析人士指出,随着商汤与华为在底层架构上的协同深化,国产AI基础设施的自主创新与商用落地进程将进一步提速。

© 版权声明

相关文章