上海AI实验室开源XTuner V1训练引擎,昇腾联合优化助力大模型效率突破

上海人工智能实验室(上海AI实验室)于2025年9月8日正式开源新一代书生大模型训练引擎XTuner V1,该引擎在昇腾384超节点(Atlas 900 A3 SuperPoD)的联合优化下,性能实现显著突破。XTuner V1作为实验室“通专融合”技术路线的重要成果,专为超大规模稀疏混合专家(MoE)模型设计,相较于传统3D并行训练引擎,具备更快的训练速度和更高的场景适应性。

技术测试显示,XTuner V1在昇腾384超节点上的训练吞吐量提升超过5%,模型算力利用率(MFU)提升达20%以上。这一优化充分利用了昇腾硬件特性,相关技术细节将于近期发布的技术报告中披露。实验室同步开源了配套的AIOps工具DeepTrace与ClusterX,为分布式训练提供全链路支持,包括性能监控和集群管理功能。

XTuner V1的开源标志着国产大模型训练基础设施的进一步成熟。该引擎支持GitHub开源社区直接下载,其设计兼顾灵活性与扩展性,尤其适合需要高算力利用率的复杂训练场景。业界分析认为,此类技术创新将加速AI大模型研发效率,并为全球开发者提供更具竞争力的训练解决方案。

© 版权声明

相关文章