华为开源盘古大模型核心产品,推动昇腾生态战略加速AI产业落地

AI产品动态13小时前发布 AI视野

华为近日正式开源了其盘古系列大模型中的两款核心产品——70亿参数的稠密模型“盘古Embedded 7B”和720亿参数的混合专家模型“盘古Pro MoE”,同时发布了基于昇腾平台的模型推理技术。这一举措被视为华为推动昇腾生态战略的关键步骤,旨在加速人工智能技术在产业端的应用落地。

盘古Pro MoE作为全球首个专为昇腾硬件平台设计的同规格混合专家模型,采用了创新的分组混合专家架构(MoGE)。该架构通过优化专家负载分布,有效解决了大规模分布式训练中的负载均衡问题。技术报告显示,该模型在昇腾800I A2设备上单卡推理吞吐性能达到1528 tokens/s,显著优于同规模稠密模型。在MMLU、C-Eval等权威基准测试中,其性能超越多款主流开源模型。

针对开源社区关于代码合规性的讨论,华为诺亚方舟实验室于7月5日连续发布多份声明强调,盘古Pro MoE是独立开发的基础大模型,其架构设计和技术特性均基于昇腾平台实现原创创新。团队承认部分基础组件参考了业界开源实践,但严格遵循开源许可证要求,对所有引用代码均进行明确标注。声明指出,这种实践符合开源社区协作规范,并非外界质疑的“增量训练”或抄袭行为。

技术细节显示,该模型采用4000颗昇腾NPU完成训练,总参数量720亿,激活参数量160亿。在昇腾300I Duo和800I A2设备上分别实现每秒321和1528个token的处理效率。目前模型权重、基础推理代码及大规模MoE推理方案已通过Ascend Tribe开源平台发布。

华为在声明中重申了对开源协作精神的承诺,表示将持续优化模型能力,并欢迎开发者通过官方社区进行技术交流。此次开源被视为中国企业在AI基础架构领域的重要突破,其技术路线选择与合规实践将为行业提供新的参考范式。

© 版权声明

相关文章