华为盘古大模型与阿里通义千问陷技术争议:参数相似性引抄袭质疑

近日,人工智能领域爆发一起技术争议事件。7月4日,GitHub平台一项由研究人员发布的分析报告显示,华为盘古大模型(Pangu Pro MoE)与阿里巴巴通义千问Qwen-2.5 14B模型在参数结构上存在高度相似性。该研究采用”LLM指纹”技术进行比对,测得两者在注意力参数分布上的平均相关性系数达0.927,显著超出业界常规模型对比范围。

研究指出,盘古大模型官方仓库中异常包含通义千问2024版权的许可文件,这一发现加剧了外界质疑。上海大学研究人员Zhiguang Yang和Hanzhou Wu在arXiv平台发表的论文《A Fingerprint for Large Language Models》中,首次系统化提出大模型参数相似性检测方法,并以此技术为基础展开分析。

针对抄袭指控,盘古大模型开发团队通过GitHub作出正式回应,强调研究采用的评估方法存在科学性缺陷,参数相似性结论不能作为抄袭依据。团队声明称,大模型开发过程中存在通用架构设计的合理借鉴,但核心训练数据和算法均为自主研发。截至7月5日上午,华为公司尚未就此事发布官方声明。

公开资料显示,盘古大模型是由华为云、循环智能和鹏城实验室联合开发的多模态AI系统,自2021年4月发布以来已迭代至5.0版本,涵盖自然语言处理、机器视觉及科学计算等多个领域。阿里巴巴通义千问系列则是达摩院研发的大语言模型,最新版本于2024年发布。

此次争议引发业内对AI模型知识产权保护的热议。部分专家认为,当前大模型技术发展存在架构趋同现象,单纯参数相似性难以构成侵权判定标准;也有观点指出,头部企业应建立更透明的技术披露机制,避免同业竞争中的知识产权纠纷。目前尚未有第三方权威机构对涉事模型进行技术鉴定。

© 版权声明

相关文章