Token成为“吞金兽”,大厂算力涨疯了
创始人
2026-04-07 17:52:35

作者|川 川

编辑|大 风

有没有发现,这半年AI圈的画风变得有点快?

去年这个时候,大家还在为算力降价狂欢。阿里云带头喊出“最高降幅60%”,腾讯云、华为云、百度云齐刷刷跟上,那阵仗,简直像双十一大促。创业群里天天有人晒账单:“看,我这一百万Token才花了几毛钱!”那会儿人人都觉得,AI创业的春天来了,算力跟白菜一样便宜,谁还做不起大模型应用啊?

结果呢?打脸来得太快。

就上个月,风向一百八十度大转弯。谷歌、亚马逊、腾讯、阿里、百度,10天之内全发了涨价公告。涨多少?普遍30%到50%。最狠的是腾讯云,有个核心产品直接涨了400%。

从“跳楼大甩卖”到“坐火箭式涨价”,前后不到一年。到底发生了什么?谁在背后推着价格往上走?更重要的是,这波涨价潮里,谁最惨,谁在偷笑?

去年还在“打骨折”,今年为什么集体涨价?

先简单回顾一下这出“反转大戏”。

2025年4月,阿里云率先扔出一颗重磅炸弹:核心产品最高降价60%。这可不是小打小闹,是实打实的“腰斩再打折”。紧接着,京东云说“随便降,我跟”,腾讯云、华为云、百度云全部跟进。一时间,算力市场硝烟弥漫,价格战打得那叫一个热闹。

那会儿的口号是什么?“让AI用得起”“算力普惠”。很多创业公司真的信了,开始大张旗鼓地烧Token、跑模型。

然而,免费的午餐从来吃不长久。

2026年1月,亚马逊AWS悄悄干了件事——没有任何发布会,没有任何预告,直接把EC2服务器价格上调了15%左右。别看幅度不大,意义可大了:这是云服务行业近二十年来第一次涨价。要知道,过去二十年,AWS降价的次数超过一百次,从来只有往下走,没有往上调的道理。

这一下,像是推倒了多米诺骨牌。

3月11日,腾讯云跟进,旗下Tencent HY2.0 Instruct模型输入价格从0.0008元/千tokens涨到0.004505元/千tokens——涨幅463%,四倍多。3月18日,阿里云宣布算力卡产品上涨5%到34%,百度智能云也跟着涨了5%到30%。那些之前免费公测的大模型,比如GLM 5、MiniMax 2.5、Kimi 2.5,全部结束“白嫖期”,转入正式计费。

从“抢着降价”到“抢着涨价”,为什么变化这么快?

表面看是云厂商扛不住了。GPU芯片越买越贵,数据中心的电费占运营成本的40%到60%,再加上2025年下半年存储芯片也开始涨价,成本端的压力实实在在地压过来了。但真正让涨价变成“不得不做”的,是另一个更根本的原因——算力,真的不够用了。

谁在疯狂“吃”Token?140万亿的真相

之前不是说算力过剩吗?怎么突然就不够用了?

答案是:Token被“吃”得太快了。

根据国家数据局局长刘烈宏在今年3月披露的数据:到2026年3月,中国每天的Token调用量已经突破了140万亿。

这个数字有多夸张?给你两个参照:

· 2024年初,这个数字只有1000亿。两年时间,涨了一千多倍。

· 2025年底,这个数字是100万亿。也就是说,仅仅过去三个月,又涨了40%——光这三个月新增的量(40万亿),就是2024年初全天的400倍。

这不是线性增长,这是海啸。

那么问题来了:谁在疯狂消耗Token?

答案就一个词:智能体(Agent)。

去年开始,以开源智能体OpenClaw(江湖人称“龙虾”)为代表的产品火得一塌糊涂。AI从一个只会“聊天”的机器人,变成了一个能“干活”的助手——帮你订机票、写代码、做PPT、分析数据……听起来很酷对吧?但代价是,智能体干一件简单的事,消耗的Token量是普通对话的10倍到100倍。

举个例子:让AI帮你写一个爬虫脚本。如果是普通对话,它给你一段代码,你复制走人,消耗几百个Token。但如果是智能体,它要自己跑代码、报错、调试、再跑、再调……来来回回十几轮,Token消耗直接奔着几万去了。

更别提视频生成这种“吞金兽”。有分析指出,生成1分钟的视频大约要消耗10万亿Token。而现在的视频模型,生成5秒的视频才收你几毛钱到几块钱——这哪是赚钱,这分明是赔本赚吆喝。但架不住用的人多啊,视频、音乐、代码、数据分析……每个方向都在疯狂“吃”Token。

供给跟不上需求,算力自然就涨价了。这不是阴谋,是赤裸裸的供需失衡。

算力排位赛:大厂吃肉,小玩家连汤都喝不上

涨价这件事,对不同的人,意味完全不同。

对云厂商来说,涨价其实是好事。有券商算过一笔账:阿里云每提价1%,它的利润率就能提升1个百分点。所以你看到的数据是,阿里云的份额不降反升,已经占到了中国AI云市场的36%。而在AI调用量这个更细的赛道里,火山引擎(字节旗下)更是占了将近50%——也就是说,全中国一半的Token调用,走的是火山引擎的管道。

与此同时,华为云、腾讯云的份额在微幅下滑。头部效应越来越明显:大厂越做越强,资源越聚越集中。

那谁最惨?

中小AI创业公司,以及那些刚入局的小玩家。

原因很简单:涨价直接推高了他们的运营成本。以前Token便宜的时候,你可以随便跑实验、随便调模型,反正花不了几个钱。现在价格翻了几倍甚至十几倍,每一轮训练、每一次推理都要掂量掂量。

更麻烦的是,小玩家没有议价能力。大客户可以跟云厂商签长期协议,锁定一个相对优惠的价格。你一个初创公司,一年才花几万块钱的算力费,谁跟你谈折扣?只能老老实实按涨价后的价格付钱。

很多原本打算做AI应用的项目,算了一笔账之后,默默搁置了。还有一些已经在做的,要么缩减规模,要么自己扛着亏损硬撑。偏偏终端市场竞争又激烈,你不敢轻易给用户涨价——隔壁家还免费呢,你一收费用户全跑了。最后所有的成本压力,只能自己咽下去。

一位从业者跟我吐槽:“以前觉得算力便宜,创业门槛低了。现在才发现,门槛不是低了,是先让你进来,再把门关上。”

这其实是一场残酷的排位赛。过去二十年,云厂商靠“低价走量、先圈地再盈利”的打法活得很滋润。但那个时代结束了。算力正式告别补贴期,进入商业化定价阶段。未来比拼的不再是谁更便宜,而是谁的服务更稳定、谁的生态更完善、谁能帮企业真正用好每一分算力。

而在这场排位赛里,小玩家大概率要被甩下车。

回头看看这一年多的过山车,你会发现一个挺扎心的真相:

算力从“白菜价”到“火箭价”,本质上是AI行业从野蛮生长走向成熟的一个缩影。免费时代结束了,价值竞争开始了。那些靠补贴活着的商业模式会死掉,而那些真正有技术、有场景、有用户的产品,会在算力成本上升的环境中活下来,甚至活得更好。

AI创业的核心竞争力,从来不是算力有多便宜,而是你拿算力来干什么。

算力时代,Token确实贵。但比Token更贵的,是一个知道怎么用好Token的脑子。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

原创 多... 曾经,银行理财是市场上的“香饽饽”,只要推出甚至不少都会出现抢购的现象,但是就在最近多款银行理财发行...
河北护航民营经济高质量发展(“... 石家庄,数字化智慧包装产业园项目建设如火如荼,预计年营收10亿元;雄安新区,卫星智能制造中试基地落成...
纽泰格:尚未有相关产品给机器人... 纽泰格在互动平台表示,截至目前,公司尚未有相关产品给机器人公司送样验证。 (本文来自第一财经)
马云雷军罕见联手,千寻智能完成... 瑞财经 王敏 4月7日,千寻智能官微宣布完成新一轮10亿元融资,由顺为资本、云锋基金联合领投,达晨财...
原创 今... 北京菜市口百货商场,投资金条柜台前挤满了人。 刘大爷攥着刚买的10克金条,脸上带着笑意。 他说,前些...
史上最快造富风口,量产百亿富豪 文 | 每日人物社 谢韫力 编辑 | 西打 互联网兴起的时期,财富积累某种程度上还是长期主义,马...
陈丽华逝世,享年85岁,曾以5... 今天,富华国际集团发布讣告: 延伸阅读>> 陈丽华,富华国际集团主席、中国紫檀博物馆馆长。 194...
原创 降... “降息?不存在的。” 这句话,正在从“段子”变成“现实”。 就在半年前,市场还在热烈讨论“2026年...
原创 匈... 最近欧洲的局势一下子被推到了风口浪尖,匈牙利总理欧尔班直接在社交媒体上发出警告,语气罕见地强硬:一场...
杏花村汾酒专业镇的破局之路 在成都举办的第114届全国糖酒商品交易会上,汾阳清香型白酒展区吸引了众多市民。郝建摄 阅读提示 ...