出品|搜狐科技
作者|张雅婷
在AI大模型领域稍显低调的华为,今天主动“亮剑”。
在华为开发者大会(HDC 2026)上,华为常务董事、产品投资评审委员会主任、终端BG董事长余承东正式发布开源盘古openPangu 2.0大模型,并放话未来将带领盘古大模型走向世界第一。
“之前盘古大模型因为各种各样的原因没做好,不应该。”余承东坦言,他去年国庆节前夕开始负责大模型,会带领大家一路赶超,从中国第一,走向世界第一。
在余承东之前,华为盘古大模型由王云鹤执掌。王云鹤博士毕业于北京大学智能科学系,2018年正式加入华为,去年3月接任华为诺亚方舟实验室主任、华为盘古大模型负责人。
不过,在去年7月,华为盘古Pro MoE开源模型陷入“抄袭风波”。有GitHub用户发现,盘古Pro MoE与阿里Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0为完全一致),引发外界对华为大模型能力的质疑。
这场风波最后以主帅易位收场。当盘古迎来了一位敢说真话、也敢打硬仗的指挥官,又将如何在DeepSeek、豆包等大模型的包围中走出一条属于自己的路?
余承东执掌大模型团队,目标是世界第一
在本次开发者大会上,余承东正式对外宣布接手盘古大模型团队,目标是世界第一。
他表示,此前在全世界都不知道大模型为何物的时候,华为就发布了盘古大模型,可以说是这个行业绝对的全球先驱者。但后来因为各种各样的原因,没做好,不应该。
“去年国庆节前夕,公司又让我来负责这个大模型,我会带领团队一路赶超,我的字典里没有第二、只有第一。我们会从中国第一,走向将来的世界第一。从追赶到超越需要时间,但在过去我所带领的所有业务都实现了这一目标。”
他还提到,华为虽然比不了互联网公司上亿的超高薪水,但也是汇集了一批优秀AI人才。他们不是特别关注个人利益,而是更有理想、有追求、有梦想,敢于不断奉献和努力。
此外,在AI领域,算法、算力、数据三样缺一不可,需要强大的工程能力来支撑和保障,而华为有强大的工程能力。
不过,为什么华为没有像美国一些厂家那样,发布上万亿甚至几十万亿参数的更大规模模型呢?
余承东坦言,第一个原因是算力,美国一些企业拥有几十万卡甚至上百万卡的高性能算力资源”。华为虽然有昇腾算力,但华为的算力大部分支持了国内企业的需要,留给自己的数量非常有限,算力不足以支撑几十万亿参数模型的训练。
第二个原因是内存价格大涨,AI算力成本非常高。非常大的模型做推理,吞吐率和时延就会急速发展。所以华为开发几百B的模型,就更加高效。
据了解,在本次发布会上,华为正式发布开源盘古openPangu 2.0大模型。openPangu 2.0采用稀疏MoE架构,搭载512K上下文窗口,分为Pro和Flash两个版本。
其中,旗舰级的openPangu 2.0 Pro总参数量达到505B,激活参数量为18B;而面向轻量化部署的openPangu 2.0 Flash总参数量为92B,激活参数仅为6B。
在硬件生态协同方面,openPangu 2.0原生针对昇腾芯片进行了深度调优,单卡推理吞吐率可达业界主流开源模型的2倍。
在鸿蒙体系中,openPangu 2.0对Agent任务进行了专项优化,执行速度与精准度更优,资源消耗更低。开源方面,华为计划从6月30日起分批开放7大核心组件。
盘古大模型此前为何“掉队”?
在余承东执掌之前,盘古大模型由王云鹤负责。
王云鹤在2018年博士毕业后正式入职华为,2021年底升任算法应用部部长,后于2025年3月接棒姚骏,成为诺亚方舟实验室主任,全面负责盘古大模型的研发。
不过在王云鹤主导的这一年来,盘古大模型的成果相较于国内其他公司而言并没有特别惊艳。并且在去年的套壳事件中,外界对王云鹤以及盘古大模型的质疑更是达到了顶峰。
去年6月30日,华为宣布开源其盘古大模型核心组件(Pangu Pro MoE),包括70亿参数稠密模型和720亿参数的混合专家模型,表示这是构建昇腾生态的关键举措。
然而仅隔四天,有GitHub用户发布报告指出:通过“LLM指纹”技术分析,盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0表示完全一致),远超业内0.7以下的正常差异范围,且在开源代码中发现了阿里的版权声明。
面对质疑,当时盘古团队回应表示,“盘古开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。”
然而在7月6日凌晨,一位自称是盘古大模型团队的员工在GitHub上发布长文《盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑暗》,表示盘古大模型在开发过程中确实存在套壳、续训、洗水印的现象。
该员工表示,王云鹤领导的小模型实验室多次通过套壳其他公司开源模型,包括Qwen、DeepSeek等,来冒充盘古自研成果。“外行领导内行,使得领导完全对于这种扯淡的事情没有概念,他们只会觉得肯定是有什么算法创新。”
比如,将Qwen 1.5 110B续训、加层后包装成盘古135B V2,连代码类名都未改。盘古Pro MoE 72B是套壳Qwen 2.5的14B续训,为了洗掉千问的水印,团队还故意训练了脏数据。
在盘古抄袭风波之后,华为云进行大规模组织架构调整。去年8月,华为云CEO张平安发文宣布组织架构调整,重点围绕产品部、公有云服务部及研发部等核心团队,涉及数十个下层部门与组织。有媒体称,云EI(企业智能)产品线下的盘古大模型相关部门被明确撤销。
身处风暴眼中,王云鹤同样难以在华为继续“立足”。今年3月,王云鹤在朋友圈发文官宣离职,后投身于Agent创业。
而随着王云鹤的离开、华为老将余承东的接手,盘古大模型也顺势迎来了一段新的征程。