来源:财联社
《科创板日报》1月10日讯(记者 杨小小 张洋洋)智谱、MiniMax 相继登陆公开资本市场,让国产大模型当前最主要的商业化路径,完成了一次“明牌式”的公开检验。
从已披露的财务数据来看,无论是偏向 B 端路径的智谱,还是更强调 C 端商业化能力的 MiniMax,其收入规模、成本结构与盈利能力,都还处在高投入,长兑现周期的阶段。
在这一节点上,AGI的梦想叙事,开始让位于更清晰的财务逻辑和资本回报要求。如果说,2025 年初的DeepSeek时刻带来的是全行业技术层面转折,如今智谱与MiniMax的上市,带来的或是各家仍在牌桌上的企业更清晰的一次战略边界校准。
国产大模型战事,正在走向终局。
小虎存亡
在行业此前津津乐道的“大模型六小虎”中,除了已经“上岸”的智谱和MiniMax,还留在基模牌桌的,大概就只剩下月之暗面和阶跃了。
月之暗面在智谱和MiniMax激烈争夺大模型第一股的同期,发布了一则融资资讯:其完成了5亿美元规模的C轮融资,由IDG领投,阿里、腾讯、王慧文等老股东超额认购,投后估值43亿美元。同步被披露的,还有月之暗面创始人、CEO杨植麟发布的内部信,其中最引人瞩目的无疑是,月之暗面当前有超过100亿元人民币现金储备。这一规模比智谱、MiniMax在二级市场公开招股募得的资金还要多。也由此,月之暗面表示自己并不着急上市。
在商业化路径上,杨植麟表示将聚焦 Agent,“不以绝对用户数量为目标,而是追求智能上限”。
一个值得注意的细节是,《科创板日报》记者了解到,近期多位投资和AI行业领域的KOL,均接到来自月之暗面方面关于融资信息及内部信内容的发布邀约。从这个角度看,这封内部信除了是一份稳定内部团队的战略宣示,也构成了一次面向外部的预期管理行为。
在长期高投入、商业化仍处爬坡阶段的大模型行业中,市场信心本身,正在成为一种需要被精心管理的变量。这并非大模型行业独有,而是所有长周期、重资本技术赛道在进入深水区后的共同特征。
至少从结果来看,资本仍愿意为月之暗面继续探索未来留出空间。
相比之下,“六小虎”中其余两家,即百川智能与零一万物,则已基本不再被视为通用基础模型的直接竞争者。
一名此前曾在百川本地化部署服务板块任职的人士告诉《科创板日报》记者,百川在战略上的明显摇摆出现在2024年底。“下面的人想推进工作,决策层不置可否,大概有一个多月的时间都处于这种状态。”
在其看来,对于仅仅三年就经历了从无到有、再到剧烈洗牌的大模型赛道而言,这样一段决策停滞期,对一家初创公司本身就是一种高昂的沉没成本。
而在这一个月后的2025年初,包括其在内的百川智能接近70%的员工,收到了公司发出的裁撤通知。这也意味着,包括本地化部署服务在内的原有业务板块,最终在百川体系内被整体取消。裁员完成后,百川智能剩余的大约百人团队,已全部围绕其最终收敛的医疗AI方向展开工作。
该人士认为,本地化部署、定制化服务之所以被放弃,核心并不在于短期现金问题,而在于这类业务本身“太重”。“云对我们来说是成本”,每推进一个定制化项目,背后都需要持续投入算力、工程和运维资源,“无论是人力还是整体投入,成本都比较高。”
这点也在智谱的招股材料中得到一定程度的印证。
招股书显示,2025年上半年,智谱本地化部署业务实现收入约1.62亿元,但对应营业成本达0.66亿元,占当期总营业成本近七成。相关算力、工程及运维投入需在项目执行阶段持续发生,难以随回款同步释放。与此同时,随着本地化部署项目占比提升、定制化服务更多采用里程碑式付款结构,公司回款节奏明显放缓,其平均贸易应收款项周转天数已由2022年的23天、2023年的21天,上升至2024年的58天,并在2025年上半年进一步拉长至112天。这也是为什么智谱在未来战略规划中,反复强调向云端MaaS等更具可扩展性的业务形态转型。
该人士于2023年下旬加入百川。回顾在百川的任职经历,他坦言,早期百川发展势头迅猛,直到2024年中对外官宣完成50亿元融资,公司整体运行仍较为平稳。在他看来,百川的收缩与聚焦,更像是在环境剧烈变化下的一次提前选择。“从资金情况看,至少在两到三年的维度内,百川不至于倒闭,但医疗这个方向能走多远,现在也很难看到一个清晰的趋势。”
2025年下半年以来,百川已很少再对外主动曝光,公开动态主要集中在开源医疗推理模型 Baichuan-M2-32B,以及清华大学百川楼启用等事项上。
大厂攻坚
同样面对大模型浪潮,大厂与创业公司似乎一直处在不同的竞争曲线上。
在云启资本管理合伙人陈昱于近日一档播客的讲述中,字节是直到2024年中才正式决定全力自研大模型。这个时间比大模型创业企业争相成立的窗口期,足足晚了一年3个月。
而在此之前,字节采取的策略是收购。陈昱在上述播客中透露,字节曾对MiniMax、阶跃都曾抛出过收购的橄榄枝,但都被后者拒绝了。
从公开信息来看,也确实是在上述时间点之后,字节在模型研发上开始更密集地发布成果,包括在2024年5月首次发布“豆包大模型”家族;8月升级了图生图等多模态生成和理解能力。
进入2025年,字节豆包模型能力再度跃迁,其打法也开始显著转向进攻型。这不仅体现在对AI对话应用本身的持续升级,以及通过内部流量打通迅速推高月活等动作上,还包括以低价策略抢占B端市场,以及向硬件领域展开的激进生态扩张。
尤其是在硬件层面的动作,多次引发市场震荡。先是与中兴合作推出的努比亚AI手机,在互联网大厂和手机厂商中引发强烈反应;随后,字节计划推出AI眼镜的消息再度发酵。同期,市场还一度传出字节将与车企联合造车的消息。对此,字节方面随后辟谣称并无造车计划。
一位接近字节的人士对《科创板日报》记者表示,字节在硬件领域的一系列动作,本质上仍然是为了牢牢占领C端市场的心智,强化“字节AI能力可以接入一切终端”的认知。“字节本身并没有下场直接做硬件的计划,内部甚至也没有专门的硬件部门。”
回过头来看,DeepSeek 的强势崛起,对大模型创业公司而言无疑是一场生死存亡的拷问;但对字节、阿里、腾讯等互联网大厂来说,却更像是一个明确分化路径、并坚定继续加码投入的信号。
阿里就是在之后加快了对C端的布局节奏,而在此之前的很长一段时间里,阿里对大模型的战略定位,都是优先嵌入云计算与企业服务体系,试图延续其在云计算时代“卖底座”的路径。直到2024年,随着Qwen系列模型持续迭代、并选择全面开源,阿里才逐步将竞争重心从单一模型能力,前移至开发者生态与平台层面。
而随着DeepSeek时刻的到来,开源模型能力迅速下沉,更庞大的用户规模形成了AI助手的使用习惯,阿里意识到仅依托云与 To B 体系,已难以覆盖大模型竞争的全部战场。随后,阿里开始明显加快C端布局节奏,推动“通义”向“千问”统一品牌演进,并将更多资源投入到面向用户的AI助手形态之中。
而和字节、阿里的激进不同,DeepSeek的出现似乎仍未让腾讯在模型叙事上展开正面回应,而是对模型来源和使用方式进行了重新权衡,在保证可控性的前提下,快速吸收成熟模型能力,并嵌入到自身的成熟产品中。
而随着大厂策略的持续激进,腾讯一贯的后发制人战略,似乎也不再“从从容容,游刃有余”。高薪挖掘OpenAI前研究员姚顺雨,并进行了大刀阔斧的组织架构调整,被外界解读为腾讯“急了”。
从大模型行业三年来的发展轨迹看,在新的技术周期中,字节等大厂拥有更长的时间周期和更大的容错空间,可以先观望、再 All in,在既有体系中保持持续推进的决心与组织适配能力;而对创业公司来说,每一步都必须踩准行业节律,不仅需要足够的资源,还需要领导层在关键节点作出果断决策,并由组织高效执行,否则就会被迫在中场提前出局。
而大模型当前的终局,也并非胜负已定,而是竞争的模式又进行了一轮迭代:不再奖励想象力本身,而只留给那些能够长期承受投入、并将技术嵌入真实需求体系的玩家。