1月27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。近日,DeepSeek-R1 模型重磅发布,迅速吸引了各界目光,成为各行各业热议的焦点话题。DeepSeek 将对产业生态造成哪些影响?伏羲智库数字发展研究中心进行解读。
DeepSeek 对产业生态的五大影响
文 / 陈蓓
伏羲智库数字发展研究中心研究员
近日,DeepSeek-R1模型发布,引发国内国际的广泛关注与讨论。北京大学终身讲席教授饶毅将DeepSeek喻为“鸦片战争以来,中国对人类最大的科技震撼”,游戏科学创始人冯骥认为“DeepSeek可能是国运级别的科技成果”。下沉市场对DeepSeek的叙事多与中美科技竞争、“爱国情怀”相绑定,或许有失客观,但该事件对人工智能的科普力度毋庸置疑。
各类市场主体从各自的业务视角对DeepSeek事件进行解读,但是,由于该事件仍处于发酵阶段,对中长期产业影响的分析尚且不足,本文从该视角进行切入,仅做抛砖引玉,供市场批评发展。
一、数据战略价值倍增
算力、算法、数据是人工智能发展的能力三角。2024年6月,Etched公司发布“Sohu”AI芯片,已经能够一定程度上降低算力成本。DeepSeek则使用蒸馏技术优化模型的知识获取方式和训练过程,放弃Scaling Law,用最少的算力进行策略优化,选用开源模式,使算法不再成为发展壁垒,证明了高性能模型不一定需要很高的算力支撑。这些事件共同预示着算力和算法将不再成为制约人工智能发展的瓶颈,高质量、多样化数据的战略价值成倍放大,成为当前各方关注的焦点。
在算法和算力的壁垒崩塌的情况下,数据成为限制人工智能发展的主要门槛,通用模型训练对高质量、多样化、多模态的数据集需要进一步提升,在这一形势下,组建行业算料联盟训练高性能行业通用大模型存在明显的正外部性,可能成为未来一段时间的发展趋势。行业通用大模型可以采用联邦学习框架进行分布式训练,不涉及原始数据的跨域互通,能够在一定程度上规避数据跨域风险。
二、新型数字基础设施加速演进
伏羲智库发布的《新型数字基础设施助推互联网创新发展》白皮书指出,互联网应用发展需求推动数字基础设施快速演进、范围不断扩大,网络基础设施、算力基础设施迭代升级,市场对数据基础设施的需求增加,包含人工智能能力、数据治理能力在内的共性服务逐渐基础设施化。
对于数据基础设施而言,由于通用大模型训练是对大规模原始数据集的重要需求场景,分布式模型训练也将成为数据基础设施的重要应用场景,该场景对数据标识、数据目录、隐私计算、智能合约、安全防护、预处理标准等技术功能的需求增加。
行业通用大模型将逐渐基础设施化。行业通用大模型具有基础性、非排他性、非竞争性,且存在明显的正外部性与规模效应,具备成为基础设施的潜力。为进一步降低大模型的接入门槛,为市场主体提供平等的发展机会,谨防大型企业与中小型企业之间的数字鸿沟,推动大模型广泛服务于经济社会的数字发展,可能需要政府进行适度引导。
三、数据价值以模型形态呈现
行业通用大模型基础设施化后,中小企业应当更专注于真实用户需求、具体使用场景和基于场景的数据积累,使用基于具体场景的数据积累,训练校准行业通用大模型,使之在具体场景的准确度进一步提升,在这一模式下,数据持有方将普遍部署私有化模型。
一方面,由于大模型极大降低了对数据价值的挖掘成本,数据价值的挖掘成本可能低于数据集的合规成本,企业将倾向于对外提供模型本身或模型处理后的结果,使数据价值形态发生变化。另一方面,企业数据治理的重要程度将进一步提升,并在数字化转型中处于核心地位,为此,企业数据治理工具的标准化及其在中小企业中的推广仍有发展空间,面向细分垂直场景的数据标注需要高素质人才加入。
四、政策技术为产业发展服务
完善的产权制度是市场机制发挥作用的前提,一般认为,使用权、收益分配权(收益权)和转让权是产权的三大核心要素。2024年7月,二十届三中全会通过的《中共中央关于进一步全面深化改革 推进中国式现代化的决定》,提出加快建立数据产权归属认定。
大模型发展带来的产业增量空间,为数据产权的认定与落实提供保障。改革总会产生受益者和受损者,如果改革释放出充足的增长红利,并能够在一定程度上弥补受损者的损失,那么改革的过程将更加顺利。根据科斯定理提供的视角,数据资源将最终流向能够充分释放其价值的使用者(模型方),产业发展需求将倒推相关政策、技术落实到位。例如,数据可携权的落实,包括高质量版权数据的授权转移,在征得个人同意的情况下适度放宽信息采集的“最小必要原则”等。
五、产业生态持续丰富
在DeepSeek-R1模型发布前,开源模型与闭源模型的性能效果仍然存在一定差距,模型训练高成本,使得业界普遍预期大模型的发展不以开源模式为主流,但是这一发展趋势违反了互联网的分布式原则,不利于响应算法透明、平等互利等倡议,故而引发业界担忧。DeepSeek-R1的发布扭转了模型闭源的发展态势,有助于产业生态的持续丰富,丰富的产业生态将反作用于DeepSeek的技术影响力和不可替代性,并推动相关技术成为行业事实标准。
广大发展中国家对低成本人工智能的需求日益迫切,在粮食安全、医疗健康、气候变化、生物多样性等与人类共同福祉息息相关的领域,“人工智能+”的推广阻力较小,产业链的国际延伸有很大机遇。
【展望】
DeepSeek引起广泛关注前,市场发展大模型的热情略微回落,主要出于对大模型实际用途和厂商生存压力的担忧,DeepSeek的发布为市场注入强心剂,市场将在一致预期中逐步“自我实现”。当然,发展过程仍考验多方智慧,尤其是在大模型的正外部性使开放合作愈加迫切的情况下,政府对市场的适时引导有助于加快模式演进。此外,在大模型国际化进程中,应着眼中外产业生态差异,丰富发展开源社区、技术社群、行业协会、合作联盟等民间组织,充分发挥其在国际标准制定、产业治理等方面的作用。