华为盘古大模型“抄袭”阿里Qwen?官方回应

今日霍州(www.jrhz.info)©️

2025年6月30日,华为正式宣布开源盘古7B参数的稠密模型、盘古Pro MoE 72B混合专家模型和基于昇腾的模型推理技术。随后一项由@HonestAGI 发布于GitHub的针对盘古大模型的研究引发业界热议,该研究的作者认为,华为推出的盘古大模型(Pangu Pro MoE)与阿里巴巴发布的『通义千问』Qwen-2.5 14B模型在参数结构上存在高相似度。

HonestAGI 通过测试比较称,Pangu Pro MoE模型与Qwen-2.5 14B模型在注意力参数分布上的平均相关性高达0.927,远超其他模型对比的正常范围(业内同类模型对比通常不超过0.7)。

今日霍州(www.jrhz.info)©️

由于深度学习模型的训练具有高度随机性,涉及复杂的数据采样、权重初始化及优化路径。两个模型在众多注意力参数上呈现近乎一致的分布,其自然发生的概率极低。因此,这种极高的相似度,立即引发其涉嫌“抄袭”的质疑。

随后,有自称是盘古大模型团队的人在GitHub上进行了回应,否认抄袭指控,并且认为该作者的评估方法不科学。

该用户表示,使用论文中描述的方法,评估了以下模型比较:

pangu-72b-a16b vs. Qwen2.5-14b = 0.92baichuan2-13b vs. Qwen1.5-14b = 0.87baichuan2-13b vs. pangu-72b-a16b = 0.84baichuan2-13b vs. Qwen2.5-14b = 0.86

可以看到不同其他相近参数规模的模型在该评估方法下也得到了与Qwen-2.5 14B模型高度相似的结果。这表明该论文和指标缺乏实际意义。盘古团队进一步重申没有抄袭。

对于该回应,HonestAGI 表示,其无法信服盘古大模型团队的说法。HonestAGI 称,“盘古仍然显示出最高的相似度,对吧?我们很高兴看到您成功复现了我们的结果!事实上,任何分类问题都有一个阈值来识别决策边界(例如,本例中疑似值为0.9)。这主要是一个用于初步比较的工具,而盘古‘不幸地’在我们开始进一步调查之前触发了这个警告⚠️信号。我们并非仅仅基于注意力参数就做出判断。这只是动机。……”

随后,HonestAGI 还提供了 Qwen 和 Hunyuan A13B 之间的比,结果显示二者在不同层级上展现出截然不同的内部模式,这表明它们拥有截然不同的架构和学习到的表征。显然,HonestAGI提供该对比数据是想说明其测试方法没有问题。

今日霍州(www.jrhz.info)©️

不过,目前HonestAGI似乎已经下线了之前关于盘古大模型的研究报告。但是,HonestAGI 在最新的回应中表示,“我们计划在论文最终定稿并提交所有代码后,将其提交给同行评审会议(可能是 ICLR 或之后的会议?)。”

另外,值得注意但是,通过查询盘古大模型团队官方发布在国内代码托管平台Gitcode(类似国外的Github)的“盘古Pro”大模型代码,可以发现其“'Open Source Software Notice”当中的赫然出现了关于“transformers”组件的版权©️声明“Copyright notice:Copyright 2024 The Qwen team, Alibaba Group and the HuggingFace Team. All rights reserved.” 显然这段说明的意思是,其所用到的“transformers”组件的版权©️所有人是Qwen团队、阿里巴巴集团和HuggingFace团队。

今日霍州(www.jrhz.info)©️

需要指出的是,该代码是由“Ascend Tribe”——盘古大模型团队官方发布,并不是其他第三方进行发布的。由此也有不少网友认为这是“实锤”抄袭的证据。

不过,业内人士表示,这是一份标准的开源声明,当盘古大模型团队使用了第三方开发的开源软件时,根据开源许可要求,是必须需要向用户说明的法律义务。而在这份声明当中,只能表明盘古大模型当中用了阿里巴巴Qwen团队 和 HuggingFace共同开发的“transformers”组件,并且使用的是“Apache License 2.0”协议。该协议它允许任何人自由地使用、修改和分发该软件,甚至用于商业产品中。所以,这份声明只反应了盘古大模型团队用了一些开源代码,并且遵守了开源协议,并不能证明抄袭。

盘古大模型团队正式回应

7月5日下午16:59分,隶属于华为的负责开发盘古大模型的诺亚方舟实验室发布声明对于“抄袭”指控进行了官方回应。

诺亚方舟实验室表示,盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来,在架构设计、技术特性等方面做了关键创新,是全球首个面向昇腾硬件平台设计的同规格混合专家模型,创新性地提出了分组混合专家模型(MoGE)架构,有效解决了大规模分布式训练的『负载均衡』难题,提升训练效率。

不过,诺亚方舟实验室也承认,“盘古Pro MoE开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权©️声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。我们始终坚持开放创新,尊重第三方知识产权,同时提倡包容、公平、开放、团结和可持续的开源理念。”

今日霍州(www.jrhz.info)©️

此外,芯智讯发现,有百度贴吧网友爆料称,负责盘古大模型的开发的诺亚方舟负责人王云鹤在内网也针对此事做了回应,回应内容的核心是两个:1、盘古大模型是基于昇腾『芯片』进行训练的,与Qwen所用的训练硬件是不同的;2、盘古大模型当中所使用的Llama和Qwen的组件都是已经开源的,并不是抄袭。

今日霍州(www.jrhz.info)©️

总结来看,目前尚无证据证实盘古大模型存在抄袭阿里Qwen的“实锤”证据,HonestAGI 所发布的质疑论文所采用的测试方法的可靠性也有待进一步验证,毕竟其并未完全公开其测试代码,更何况HonestAGI 已经下线了之前的质疑论文。至于盘古大模型当中确实有采用Qwen的开源代码,但这部分的代码本就是开源代码,盘古大模型团队的相关的声明做法也是合规的,只能说盘古大模型并不是从零起步的绝对原创,如果只是用了部分开源组件,也并不属于抄袭。

编辑:芯智讯-浪客剑

特别声明:[华为盘古大模型“抄袭”阿里Qwen?官方回应] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

后遗症明显!48岁夏琳王妃陪同亲王出席弥撒活动,脸部细节引关注(后遗症表现)

她搭配了透明丝袜和高跟鞋👠,巧妙地延展了腿部线条,而她那款盘发上的同色系发带则为整体造型增添了一抹亮色,既不张扬却又恰到好处地突出了她的高贵气质。他唯一给出的解释是,夏琳王妃从运动员转型为王妃,进入王室之后,专…

后遗症明显!48岁夏琳王妃陪同亲王出席弥撒活动,脸部细节引关注(后遗症表现)

『章子怡』、『曾黎』惊喜偶遇,相识30年中戏老同学贴脸合影,直呼好久不见(『章子怡』『曾黎』秦海璐『袁泉』)

1月26日,『章子怡』在『社交媒体』上分享了一则令人感慨的动态,她发布了一张照片,并附文说道:老同学偶遇,谢谢坐在圆桌对面拍下这一瞬间的没有微博的尹力导演@『曾黎』。 不久后,『曾黎』也在评论区留下了一段回复:好久不见,…

『章子怡』、『曾黎』惊喜偶遇,相识30年中戏老同学贴脸合影,直呼好久不见(『章子怡』『曾黎』秦海璐『袁泉』)

救命!孔雪儿彻底封神 从甜妹变民国名伶,老上海百乐门氛围感拉满(孔雪儿被骗500)

质疑派网友表示:“她还是更适合甜妹造型,强行凹民国名伶人设,显得很生硬,没有那种骨子里的年代感”“所谓的复古氛围感,全靠光影和后期,生图里的她软组织流失明显,颧骨突出,根本撑不起这种温婉造型”“现在内娱扎堆…

救命!孔雪儿彻底封神 从甜妹变民国名伶,老上海百乐门氛围感拉满(孔雪儿被骗500)

达式常:妻子已离世,独自在上海居住,女儿定居海外时常回国看望(达式常妻子王文晧身高)

尽管这个角色并不讨喜,很多人都担心观众会不喜欢这个角色并对其产生负面评价,然而,达式常却凭借出色的演绎,让这个角色深得观众的喜爱,也因此逐渐积累了自己的知名度。 1981年,他在电影《燕归来》中饰演了一位…

达式常:妻子已离世,独自在上海居住,女儿定居海外时常回国看望(达式常妻子王文晧身高)

孩子读《洋葱头历险记》能收获哪些成长?2026亲子共读必备指南(读《洋葱头历险记》有感)

洋葱头历险记》是一本深受孩子喜爱的经典儿童文学作品,它以幽默风趣的方式传递了许多人生哲理。本文为您详细解读这本书的价值所在,帮助家长选择适合孩子的优质读物。从故事内容、艺术特色到教育意义,全方位解析这本书的独特魅力。

孩子读《<strong>洋葱头历险记</strong>》能收获哪些成长?2026亲子共读必备指南(读《<strong>洋葱头历险记</strong>》有感)