余承东亲管华为大模型团队:我的字典里没有第二、只有第一
创始人
2026-06-12 20:38:49

出品|搜狐科技

作者|张雅婷

在AI大模型领域稍显低调的华为,今天主动“亮剑”。

在华为开发者大会(HDC 2026)上,华为常务董事、产品投资评审委员会主任、终端BG董事长余承东正式发布开源盘古openPangu 2.0大模型,并放话未来将带领盘古大模型走向世界第一。

“之前盘古大模型因为各种各样的原因没做好,不应该。”余承东坦言,他去年国庆节前夕开始负责大模型,会带领大家一路赶超,从中国第一,走向世界第一。

在余承东之前,华为盘古大模型由王云鹤执掌。王云鹤博士毕业于北京大学智能科学系,2018年正式加入华为,去年3月接任华为诺亚方舟实验室主任、华为盘古大模型负责人。

不过,在去年7月,华为盘古Pro MoE开源模型陷入“抄袭风波”。有GitHub用户发现,盘古Pro MoE与阿里Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0为完全一致),引发外界对华为大模型能力的质疑。

这场风波最后以主帅易位收场。当盘古迎来了一位敢说真话、也敢打硬仗的指挥官,又将如何在DeepSeek、豆包等大模型的包围中走出一条属于自己的路?

余承东执掌大模型团队,目标是世界第一

在本次开发者大会上,余承东正式对外宣布接手盘古大模型团队,目标是世界第一。

他表示,此前在全世界都不知道大模型为何物的时候,华为就发布了盘古大模型,可以说是这个行业绝对的全球先驱者。但后来因为各种各样的原因,没做好,不应该。

“去年国庆节前夕,公司又让我来负责这个大模型,我会带领团队一路赶超,我的字典里没有第二、只有第一。我们会从中国第一,走向将来的世界第一。从追赶到超越需要时间,但在过去我所带领的所有业务都实现了这一目标。”

他还提到,华为虽然比不了互联网公司上亿的超高薪水,但也是汇集了一批优秀AI人才。他们不是特别关注个人利益,而是更有理想、有追求、有梦想,敢于不断奉献和努力。

此外,在AI领域,算法、算力、数据三样缺一不可,需要强大的工程能力来支撑和保障,而华为有强大的工程能力。

不过,为什么华为没有像美国一些厂家那样,发布上万亿甚至几十万亿参数的更大规模模型呢?

余承东坦言,第一个原因是算力,美国一些企业拥有几十万卡甚至上百万卡的高性能算力资源”。华为虽然有昇腾算力,但华为的算力大部分支持了国内企业的需要,留给自己的数量非常有限,算力不足以支撑几十万亿参数模型的训练。

第二个原因是内存价格大涨,AI算力成本非常高。非常大的模型做推理,吞吐率和时延就会急速发展。所以华为开发几百B的模型,就更加高效。

据了解,在本次发布会上,华为正式发布开源盘古openPangu 2.0大模型。openPangu 2.0采用稀疏MoE架构,搭载512K上下文窗口,分为Pro和Flash两个版本。

其中,旗舰级的openPangu 2.0 Pro总参数量达到505B,激活参数量为18B;而面向轻量化部署的openPangu 2.0 Flash总参数量为92B,激活参数仅为6B。

在硬件生态协同方面,openPangu 2.0原生针对昇腾芯片进行了深度调优,单卡推理吞吐率可达业界主流开源模型的2倍。

在鸿蒙体系中,openPangu 2.0对Agent任务进行了专项优化,执行速度与精准度更优,资源消耗更低。开源方面,华为计划从6月30日起分批开放7大核心组件。

盘古大模型此前为何“掉队”?

在余承东执掌之前,盘古大模型由王云鹤负责。

王云鹤在2018年博士毕业后正式入职华为,2021年底升任算法应用部部长,后于2025年3月接棒姚骏,成为诺亚方舟实验室主任,全面负责盘古大模型的研发。

不过在王云鹤主导的这一年来,盘古大模型的成果相较于国内其他公司而言并没有特别惊艳。并且在去年的套壳事件中,外界对王云鹤以及盘古大模型的质疑更是达到了顶峰。

去年6月30日,华为宣布开源其盘古大模型核心组件(Pangu Pro MoE),包括70亿参数稠密模型和720亿参数的混合专家模型,表示这是构建昇腾生态的关键举措。

然而仅隔四天,有GitHub用户发布报告指出:通过“LLM指纹”技术分析,盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0表示完全一致),远超业内0.7以下的正常差异范围,且在开源代码中发现了阿里的版权声明。

面对质疑,当时盘古团队回应表示,“盘古开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。”

然而在7月6日凌晨,一位自称是盘古大模型团队的员工在GitHub上发布长文《盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑暗》,表示盘古大模型在开发过程中确实存在套壳、续训、洗水印的现象。

该员工表示,王云鹤领导的小模型实验室多次通过套壳其他公司开源模型,包括Qwen、DeepSeek等,来冒充盘古自研成果。“外行领导内行,使得领导完全对于这种扯淡的事情没有概念,他们只会觉得肯定是有什么算法创新。”

比如,将Qwen 1.5 110B续训、加层后包装成盘古135B V2,连代码类名都未改。盘古Pro MoE 72B是套壳Qwen 2.5的14B续训,为了洗掉千问的水印,团队还故意训练了脏数据。

在盘古抄袭风波之后,华为云进行大规模组织架构调整。去年8月,华为云CEO张平安发文宣布组织架构调整,重点围绕产品部、公有云服务部及研发部等核心团队,涉及数十个下层部门与组织。有媒体称,云EI(企业智能)产品线下的盘古大模型相关部门被明确撤销。

身处风暴眼中,王云鹤同样难以在华为继续“立足”。今年3月,王云鹤在朋友圈发文官宣离职,后投身于Agent创业。

而随着王云鹤的离开、华为老将余承东的接手,盘古大模型也顺势迎来了一段新的征程。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

Block, Inc.(原Sq... 公司概况Block, Inc.(原名为Square, Inc.)是一家总部位于美国加利福尼亚州旧金山...
肖特韦尔谈及潜在经营风险:没有... 来源:环球市场播报 2026 年 6 月 12 日,美国纽约纳斯达克交易广场,SpaceX 首次公...
马斯克正式成为人类首个1000... 当地时间12日上午,美国太空探索技术公司(SpaceX)在纳斯达克证券交易所开始交易。据财闻海外资讯...
糖尿病患者的日常保健要点(运动... 运动是管理血糖的另一个重要方面。在您运动和活动时,血糖为肌肉提供能量。定期的体力活动还有助于身体于减...
欧洲主要股指收盘上涨 德国DAX30指数涨1.71%,英国富时100指数涨1.64%,法国CAC40指数涨1.83%。 (...
SpaceX上市 公司估值约1... 当日,美国太空探索技术公司(SpaceX)股票在纳斯达克证券交易所开始上市交易。SpaceX首次公开...
盛和资源:稀土行业供需格局有望... 6月12日晚,盛和资源在披露的《投资者关系活动记录表》中表示,公司稀土冶炼分离业务严格遵循国家产业政...
史上最大IPO!54岁马斯克成... 新智元报道 【新智元导读】今晚见证历史!SpaceX正式敲钟纳斯达克,以750亿美元创全球最大IP...
“国家队”联手“先行军”:央地... 本报(chinatimes.net.cn)记者刘昱汝 徐芸茜 北京报道 当前,全球产业变革进入加速迭...
科技微创新:驱动农业生产多环节... 多项科技微创新,正在重塑农业生产的各环节,驱动生产发生“智变”。近日,记者在山东济宁泗水县华村镇的露...