华为开源盘古大模型核心产品，推动昇腾生态战略加速AI产业落地

AI产品动态11个月前发布 AI视野

华为近日正式开源了其盘古系列大模型中的两款核心产品——70亿参数的稠密模型“盘古Embedded 7B”和720亿参数的混合专家模型“盘古Pro MoE”，同时发布了基于昇腾平台的模型推理技术。这一举措被视为华为推动昇腾生态战略的关键步骤，旨在加速人工智能技术在产业端的应用落地。

盘古Pro MoE作为全球首个专为昇腾硬件平台设计的同规格混合专家模型，采用了创新的分组混合专家架构（MoGE）。该架构通过优化专家负载分布，有效解决了大规模分布式训练中的负载均衡问题。技术报告显示，该模型在昇腾800I A2设备上单卡推理吞吐性能达到1528 tokens/s，显著优于同规模稠密模型。在MMLU、C-Eval等权威基准测试中，其性能超越多款主流开源模型。

针对开源社区关于代码合规性的讨论，华为诺亚方舟实验室于7月5日连续发布多份声明强调，盘古Pro MoE是独立开发的基础大模型，其架构设计和技术特性均基于昇腾平台实现原创创新。团队承认部分基础组件参考了业界开源实践，但严格遵循开源许可证要求，对所有引用代码均进行明确标注。声明指出，这种实践符合开源社区协作规范，并非外界质疑的“增量训练”或抄袭行为。

技术细节显示，该模型采用4000颗昇腾NPU完成训练，总参数量720亿，激活参数量160亿。在昇腾300I Duo和800I A2设备上分别实现每秒321和1528个token的处理效率。目前模型权重、基础推理代码及大规模MoE推理方案已通过Ascend Tribe开源平台发布。

华为在声明中重申了对开源协作精神的承诺，表示将持续优化模型能力，并欢迎开发者通过官方社区进行技术交流。此次开源被视为中国企业在AI基础架构领域的重要突破，其技术路线选择与合规实践将为行业提供新的参考范式。

AI产品动态 # AI技术 # 华为 # 开源 # 昇腾平台 # 混合专家模型 # 盘古大模型

文章版权归作者所有，未经允许请勿转载。

华为开源盘古大模型核心产品，推动昇腾生态战略加速AI产业落地

Grok-4大语言模型测试数据泄露，多项基准测试成绩超越主流模型

上海交大发布MAS-GPT突破性成果：单轮生成实现多智能体系统普惠化应用

相关文章

全球首款超仿生具身智能体亮相！越疆科技中华龙鸟机器人实现商业化突破

浪潮信息发布超节点AI服务器“元脑SD200”，支持万亿参数大模型

Adobe推出Project Graph：可视化节点编辑重塑AI设计工作流程

抖音生活服务推出“私信获客”与“AI即用”方案，助力商家高效拓展客户

最新资讯

热门AI工具

热门资讯