电厂 | 李彦宏走向自己的反面
创始人
2025-02-14 19:41:43

“我们将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。”

从2023年3月16日文心一言启动邀测至今的约两年时间里,百度创始人李彦宏始终站在“大模型闭源”的一端,在多个公开场合表达自己“开源会越来越落后”“开源就是智商税”的理念。

李彦宏于2024百度世界大会,图源/百度 「电厂」查阅公开资料发现,最晚在2024年下半年的一次百度内部讲话中,李彦宏还公开重申了自己对闭源的坚持,“效率上开源模型是不行的”,闭源模型才是“商业模型”。

在百度坚持闭源的时间里,李彦宏的观点也曾引起多番业界讨论,如360创始人周鸿祎就公开呛声。在2024年4月举办的第二十七届哈佛中国论坛上,周鸿祎曾讲道:“我是一直相信开源的力量,至于说网上有些名人胡说八道,你们别被忽悠了。他说开源不如闭源好?连说这话的公司自己都是借助了开源的力量才成长到今天。”

没人能预料到,短短几个月后,百度和李彦宏悄然调转了船头,这场曾在国内AI市场持续的口水战也有了阶段性答案。而这种转变很难说是出于主动还是被动。

DeepSeek技惊四座,百度被动防御?

2024年12月26日、2025年1月20日,由创企深度求索开发的DeepSeek-V3、DeepSeek模型分别上线并开源。两款模型在性能与成本方面都达到了全球领先水平,因此一经亮相,就吸引了AI圈乃至整个用户市场的注意力。

与此同时,面向普通C端用户的DeepSeek App也迎来了破天流量,1月27日,DeepSeek的下载量在中外苹果App Store免费榜登顶。另据QuestMobile统计,1月28日,DeepSeek App日活超越字节跳动旗下豆包,成为国内日活用户最多的大模型对话产品;2月1日,其日活突破3000万大关,成为了市场最快达到这一里程碑的应用。凡此种种,引来了行业的关注与忌惮。

比如,当地时间1月31日,OpenAI创始人Sam Altman首次提及了对闭源模式的反思,作为一家从GPT3开始坚持模型闭源的公司,称“我们可能站在了历史错误的一边”;OpenAI首席研究官Mark Chen也承认DeepSeek在独立研究的情况下发现了一些OpenAI o1 的核心idea,但同时指出外部反应是夸大的,OpenAI未来将在成本与性能两端持续优化。

另一家AI大模型领军企业,同样坚持闭源的Claude大模型母公司Athotipic的CEO则于1月底发布万字长文,分析了DeepSeek带来的影响,认为DeepSeek威胁了美国在AI界领导地位的说法是夸大的。

然而,不同于海外大模型巨头等企业在第一时间就对DeepSeek表态及强调自己仍有竞争力,包括百度在内的国内大模型玩家则沉默了许多。直到近日,百度才开始做出反应。

在2月11日开幕的2025迪拜世界政府高峰峰会上,李彦宏开始侧面回应DeepSeek的爆火,他讲道:“我们到处都能看到创新,我们必须适应这种快速变化的创新。”

同一天,百度宣布文小言App(原“文心一言”) 更新4.9.0版本,并接入DeepSeek R1模型。

2月12日,百度智能云事业群总裁沈抖在事业群全员会上提到:“每当科技的发展走到瓶颈期,总会有一个引领性的组织制造出拐点,而DeepSeek就是这个拐点。”他认为DeepSeek会促进开发生态会进一步繁荣,肯定了DeepSeek带来的影响。

2月13日,百度官宣文心一言将从4月1日起全面免费,允许PC端与App端用户体验文心系列最新模型。

不过百度并未提及接下来面向企业客户与开发者的Token收费规则是否变化,「电厂」就此询问百度官方,截至发稿暂无回复。

2月14日,百度最终官宣了计划为文心大模型新版本开源的消息。

百度开源能做到什么程度?

DeepSeek的官网中写有这样一句话:“‘以开源精神和长期主义追求普惠 AGI’是DeepSeek一直以来的坚定信念。”

而这一点正与百度过往尝试走通的大模型之路相悖。但在不到一个月的时间里,DeepSeek迅猛增长、甚至被称为展现了AGI的曙光之时,所有人都不得不停下来重新思考开闭源之间的选择,以及重新检视过往两年的大模型研发范式。

而在公众眼里,百度则在短短数天之内,以一种戏剧化的方式倒向了自己的反面。

不过,百度并没有给出有关文心一言开源的更多细致信息。曾就职于一家大模型公司的Lily(化名)告诉「电厂」:“目前开源社区中的中文大模型多数并非是完全可商用,一般开源社区用户通常需要进行复杂的商用授权申请流程,在某些情况,甚至有对公司规模、所在行业、用户数等维度有明确规定不给予商业授权。”

而现有的开源协议繁多,较为常见的有GPL、LGPL、BSD、Apache、Mozilla、MIT等,对于是否包含源代码、是否允许商业使用、是否授权转售等规定不尽相同。

常见开源协议,图源/CSDN GitCode开源社区 根据官方信息,DeepSeek-V3及R1模型均采用MIT协议开源,这是一种较为宽松的开源协议,意味着任何人都可以自由使用该模型,用于包括商业用途并进行模型蒸馏,无需申请。

(注:模型蒸馏是一种模型压缩技术,可以将大型模型中的知识转移到小型模型中。)

正因如此,DeepSeek堪称最为强大和开放的开源模型之一。作为对比,Meta旗下Llama系列模型并未采取公开的开源协议,而是定制了许可协议。

其中Llama 1在发布时仅许可了研究用途;Llama 2支持产品活跃用户小于7亿的商业使用(如果超过7亿需另向Meta进行申请);Llama 3.2系列模型的许可证中则写道“任何居住在欧盟的个人或在欧盟有主要营业地点的公司不被授予使用 Llama 3.2 中包含的多模态模型的许可权”。

而百度的大模型开源能够做到什么程度,是否能够刺激到足够数目的开发者共建生态,或许要到其新模型发布的那一天才有答案。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

黄金跳水 连续四日下挫!今日跌... 财联社5月15日讯(编辑 王蔚)今日,黄金价格跳水,日内跌幅超2%,已连续四个交易日走低,截至发稿日...
佳源服务股东大会全票反对重选阮... 观点网讯:5月15日,佳源服务控股有限公司召开2026年股东周年大会,其中重选阮红女士为非执行董事的...
小米开源自动驾驶模型 Xiao... 5月14日消息,小米正式开源自动驾驶模型Xiaomi OneVL。小米CEO雷军亲自解读了该模型的技...
李彦宏首提 DAA,需问 DA... 5 月 13 日,Create2026 百度 AI 开发者大会在北京开幕。李彦宏在开幕演讲中提出了一...
跨境贸易便利化行动再升级!国际... 5月15日凌晨,一批来自孟加拉国达卡的3150公斤服装产品,在双流国际机场空侧快速完成换单后,直接搭...
股价位列A股第四!科创板“新秀... 财联社5月15日讯(编辑 梓隆),今日(5月15日),联讯仪器长阳攀升,截至收盘,其大涨超6%,盘中...
八年后,他再次站在甲醛仪前,关... 我干了八年空气检测,钻过上千户人家的新房子,拧开过几万支采样管。今天,我想讲几个故事,关于那些“免费...
年销7亿却没有工厂,互联网老兵... 舒义在快消品圈子里算个“异类”。 早年踩着互联网风口,舒义大学没毕业就赚了第一桶金500万,后来创立...
最强二代!万向集团鲁伟鼎接班九... 在中美顶级企业晚宴中,坐着一位低调的浙商大佬。 5月14日晚间,在美国总统特朗普访华的欢迎宴会上,与...
国家电网公司举办控股上市公司2... 5月15日,国家电网公司在上海证券交易所举办控股上市公司2025年度暨2026年第一季度集体业绩说明...