2025世界人工智能大会(WAIC)即将于7月26日至29日在上海举行,华为作为核心参展商,将首次线下展示其昇腾384超节点真机。这一技术突破源自今年5月鲲鹏昇腾开发者大会上发布的昇腾超节点技术,其通过业界最大规模的384卡高速总线互联,解决了传统服务器跨机通信的带宽瓶颈。
华为展区面积超过800平方米,设置60余个展点,全面展示昇腾软硬件能力及开源生态。昇腾384超节点由12个计算柜和4个总线柜构成,采用创新的对等计算架构,将高速总线从单服务器扩展至整机柜甚至跨机柜互联。实测数据显示,其通信带宽较传统以太网提升15倍,单跳时延从2微秒降至200纳秒,使大规模集群能像单台计算机般协同工作。
性能方面,该方案在LLaMA3等千亿参数模型训练中较传统集群提升2.5倍性能,对Qwen等多模态模型的加速比达3倍。观察者网报道称,其算力总规模达300Pflops,为英伟达NVL72系统的1.7倍,内存带宽更高出113%。通过MatrixLink全对等互联技术,384颗昇腾NPU与192颗鲲鹏CPU可形成超级AI服务器,单卡推理吞吐量达2300 Tokens/s。
值得注意的是,该架构特别适配混合专家(MoE)模型,支持”一卡一专家”并行推理模式,算力有效利用率提升50%以上。华为表示,该技术可进一步扩展为包含数万卡的Atlas 900 SuperCluster集群,为未来更大规模AI模型演进提供基础设施支撑。此次展示标志着中国企业在高性能AI计算领域取得的重要突破。
© 版权声明
文章版权归作者所有,未经允许请勿转载。