词元消耗量增长,“龙虾”等智能体如何能好用、不贵
创始人
2026-04-03 13:10:06

最近,随着人工智能应用场景不断深化,有关Token消耗与使用成本的讨论也越来越多。Token也叫词元,所谓词元,是大模型处理信息的最小信息单元,日常工作生活中每一次向AI提问、使用AI生成内容,都是在调用词元。特别是,今年以来“龙虾”等智能体的爆发,带动词元消耗量显著增长。那么,真实开销究竟如何?

“龙虾”智能体普及深度使用成本逐步显现

记者调查发现,随着智能体产品广泛落地,日常简单交互时,成本变化并不明显;可一旦进入深度使用,Token消耗就会显著增加,相关支出也随之上升。

用户 秦先生:稍微多用一点成本就上来了,消耗Token数量会随着任务难度指数性上涨,使用成本确实有点超预期。

采访中,不少消费者告诉记者,个人用户对成本上升的感受直接;而在一些已经实现规模化部署并将AI真正应用到生产一线的企业,Token的消耗体量更为突出。

中交AI中心首席科学家 王晶:从设计、施工、养护到运营,已经开发了数千个智能体都会对大模型进行调用,日均Token消耗已经达到上百亿,相当于十万元左右的成本。

持续增长的Token消耗,也给算力系统带来不小压力。

MiniMax稀宇科技副总裁 严奕骏:每个礼拜都要进行算力扩容,算力相对来说是“紧平衡”的状态。

中国电信北京公司AI技术负责人 陈哲诗:随着大模型技术的演进,对应用层的需求拉动非常大,算力租赁量也非常大。客户对成本的担忧目前还是存在的,我们也需要去优化基础设施效率,降低Token的成本。

Token不是流量成本逻辑不一样

为什么越深度使用,花费越明显?很多人习惯把Token和手机流量放在一起比较,其实两者的计费逻辑并不一样。

手机流量主要用于数据传输,购买后按使用量扣除,缓存内容还能重复使用,消耗相对清晰可控。

Token是AI处理信息的基本计量单位,用户不仅需要占用模型空间、选择服务套餐,每执行一条指令、完成一项任务,都会实时产生消耗。如果需要扩展功能、开放更多权限,还会带来额外支出。

成本居高不下

Token降价之路如何走?

AI用得越深,Token花费越高,这让不少普通用户和中小企业倍感压力。即便对大型企业而言,这也是一笔不容忽视的开支。早年手机流量资费曾一路下降,那么Token的成本未来能不能降、又该如何降呢?

采访中,业内专家告诉记者,Token成本具备下降空间,也必然会逐步下降。当前成本偏高,主要是行业仍处在发展初期,高端算力硬件成本较高、资源利用不充分等多重因素叠加。随着技术不断成熟、算力供给持续优化,单位Token的使用成本将会逐步走低。

中国信息通信研究院云计算与数字化研究所云计算部主任 马飞:随着算力技术越来越成熟,单位Token成本会越来越低,需求爆发也会倒逼产业加速技术迭代、扩大供给、提升使用效率。

在记者走访的多家企业中可以看到,不少企业正通过优化模型结构、提升运行效率等方式缓解成本压力。与此同时,也有企业加快算力扩容,积极与更多硬件厂商开展适配,拓宽算力供给渠道。

月之暗面Kimi企业业务负责人 黄震昕:努力把我们的模型效率做提升,通过底层模型架构的创新,来达到Token成本下降。

阶跃星辰首席技术官 朱亦博:我们现在对模型关注的一个指标叫“智价比”,也就是说模型达到一定智力,成本越低越好。

在Token的全流程使用中,云端部署、云上存储和统一调度同样至关重要。不少云服务机构也在通过优化资源配置、提升调度效率,来降低使用成本、提升服务稳定性。

天翼云智算平台事业部产品专家 王曼:模型的效果、成本、性能以及安全各个方面都是用户非常关心的。结合我们的算电协同、算网融合调度优势,我们在持续降低Token的成本。

着眼长远布局

算力一体促普惠

要让人工智能真正用得起、用得长久,还需要从长远层面系统谋划。目前,国家正大力推进算力一体化布局,为AI产业实现普惠可持续发展提供支撑。

不久前,中国信息通信研究院发布的《算力互联网体系架构研究报告》显示,我国算力基础设施需求正持续增长。针对Token经济,相关专家组也已启动多个专题研究。

中国信息通信研究院云计算与数字化研究所副所长 栗蔚:Token已经成为AI产业的重要度量衡,Token的消耗总量体现了智能体等创新AI应用的运用深度和广度,Token成本则体现了算法算力的效率。

一边是算力需求持续攀升,另一边从中央到地方,一系列支持政策也在密集出台落地。

总台央视记者 张丛婧:今年以来出台的算力相关政策,从建设国家算力互联互通节点,到各地发放算力券、建设算力枢纽等,尤其是今年政府工作报告首次把算电协同纳入国家新基建。可以看到,各地都在推动算力互联互通、绿色发展与场景落地。

统计数据显示,截至2025年12月,我国智能算力总规模位居全球第二,全国算力供需比总体合理,但在高端算力、核心算法方面仍存在一定外部依赖。当前,国家正加快推进全国一体化算力网络布局,通过统一调度、优化资源配置,让算力服务更加普惠。

中国信息通信研究院云计算与数字化研究所副所长 栗蔚:依托国家算力互联网服务节点,加快推动区域和行业节点建设,构建形成具备智能感知、实时发现、随需获取的算力互联一张网。

与此同时,我国也在加快发展轻量化、低功耗、高性价比的本土大模型,让更多普通用户能用得上、用得起、用得长久。

中国信息通信研究院云计算与数字化研究所副所长 栗蔚:要想让Token成为普惠公共服务,要构建优质高效的算法,持续推进模型优化,降低单Token算力消耗,搭建随时随地、随需接入的算力节点,让AI服务触达更多用户。

Token降本增效

让用户用得起 不心疼

AI好用不假,可Token花钱快的问题也着实让人头疼。说到底,成本能不能降下来,既要靠国家把算力这盘大棋统筹好,也需要企业在技术上多精打细算。

让用户用得起、不心疼,AI才算是真正走进了普通人的生活。

编辑/汪浩舟

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

“少爷兵”腾讯,被AI揪出空调... 作者|略大参考 杨知潮 如果拿战争做比喻,腾讯有点像“少爷兵”。靠着火力优势和资源优势,它能在自己...
邑文科技启动IPO辅导,加码设... 4月2日,证监会辅导备案信息显示,无锡邑文微电子科技股份有限公司(以下简称“邑文科技”)已正式启动首...
分享广东做符合大厂标准手机取卡... 近年来,随着国内3C数码产业的快速迭代,手机作为国民级电子产品的保有量持续攀升,与之配套的精密五金零...
一言不合又拆车?小米直播拆解新... 汽车圈论整活儿,还得是小米。 没租场馆,没请媒体,依然老板亲自上阵,将新一代SU7给拆了。 昨晚,...
上海交大与蚂蚁健康成立联合实验... 封面新闻记者 张越熙 为推动人工智能在医疗健康领域的深度应用和创新突破,近日,上海交通大学人工智能学...
微软推出全球最精准转录AI模型... IT之家 4 月 3 日消息,微软昨日(4 月 2 日)发布公告,持续扩充自研 AI 模型版图,继 ...
关停Sora后,OpenAI为... OpenAI买下TBPN 凤凰网科技讯 北京时间4月3日,OpenAI最近作出战略调整,全力聚焦核心...
中电信人工智能科技公司增资至约... 天眼查App显示,近日,中电信人工智能科技(北京)有限公司发生工商变更,新增北京市人工智能产业投资基...
词元消耗量增长,“龙虾”等智能... 最近,随着人工智能应用场景不断深化,有关Token消耗与使用成本的讨论也越来越多。Token也叫词元...
全国网络安全标准化技术委员会2... 3月31日至4月3日,全国网络安全标准化技术委员会(以下称“网安标委”)2026年第一次“标准周”活...