来源:环球网
前言:1986年,中共中央、国务院批准了《高技术研究发展计划纲要》,863计划应运而生。从“曙光一号”高性能计算机打破封锁,到超算跻身世界前列,再到2026年3月底,全国智能算力规模已达 1882 EFLOPS,中国算力基础设施走过了从追赶到并跑的四十年。
算力决定了AI能跑多快,但决定它能否跑远的是存力。当算力不再是唯一瓶颈,“存力”正成为制约算力高质量发展的关键环节。带着这个问题,我们走进了中国移动呼和浩特数据中心,与业内专家和企业代表展开了一场关于“先进存力如何助力算力高质量发展”的对话。
【环球网科技报道 记者 李文瑶】5月15日,中国电子工业标准化技术协会数据存储专业委员会组织的一场“凝共识、探未来,走进先进存力”活动,将业内目光引向了位于内蒙古呼和浩特的中国移动呼和浩特数据中心。这里总算力规模达19000PFlops,智能算力达到82%,被视为观察当前中国AI基础设施演进的一个典型样本。
与会专家释放了一个明确信号:当大模型参数迈进万亿级、上下文长度突破百万级之后,单纯堆砌算力的时代正在过去,存储——或者说“先进存力”——正从配角走向舞台中央。
从“算力不足”到“存力跟不上”
过去两年,国内智算中心建设狂飙突进,高端算力供给不足是行业公认的痛点。但在中国电子工业标准化技术协会副理事长兼秘书长丁然看来,一个新的瓶颈已经浮出水面。
“当前系统的瓶颈已经从计算密度转向了数据搬运效率。”丁然在采访中指出,GPU、HBM带宽和容量有限,而模型的参数规模仍在膨胀,很多时候计算芯片处于“等数据”的状态,闲置现象客观存在。
这一判断得到了产业研究数据的支撑。赛迪顾问电子信息产业研究中心副总经理袁钰表示,随着智能体(Agent)和AI推理应用的普及,用户对响应速度、调用质量的要求大幅提升,“你打了一段话之后它回答很慢,或者回答得很偏,体验感就大打折扣”。而这些体验的背后,恰恰是存储系统能否快速、高效地调取历史数据。
中电标协数据存储专委会秘书长孙钢用了一个更直白的比喻:“原先的存储是被调用的保险柜,现在存储的角色变了:从辅助运算,被动调用转向存算共生的关系。如:“KV Cache”技术——一种在推理过程中缓存中间结果以提升效率的机制——正在成为大模型推理性能的关键变量。存储不够强大,计算就可能空转,这个逻辑正在被越来越多的行业实践验证。
存算关系重建:从“辅助”到“共生”
存储地位的上升,背后还是存算关系的重建。
中科曙光北京公司总裁助理、分布式存储产品部总经理石静从技术演进的角度拆解了这一变化。她依托五层蛋糕理论:从底层的能源、芯片,到基础设施、模型,再到最上层的应用,存储作为基础设施的一部分,正在同时“向下沉”和“向上延展”。
在她看来,向下,存储需要与芯片更紧密地结合。一方面,通过优化数据通路来支撑计算芯片发挥更高效率;另一方面,存算一体芯片的出现,让存储单元也具备了计算能力。向上,存储需要无缝嵌入到AI模型和应用的流水线中,在数据编排、标注、检索等环节发挥作用。
“存储从上到下贯穿了整个五层蛋糕。”石静说。这种贯穿性,意味着存储不再是孤立的硬件层,而是与算力形成了一种“共生”关系。
一个具体的技术佐证是GPU Direct Storage(GDS)。这项技术允许GPU绕过CPU和内存,直接访问存储中的数据。石静透露,在实际的自动驾驶万卡集群案例中,采用GDS技术可以将GPU使用效率提升30%以上。而在AI for Science的应用场景中,通过本地NVMe构建共享缓存层,可以将训练时间缩短20%至30%。
这些数字背后是一个清晰的产业信号:在算力硬件短期难以实现颠覆性突破的前提下,优化存储系统来释放算力潜能,正在成为一条性价比极高的路径。
超大规模集群与“东数西算”的新故事
中国移动呼和浩特数据中心作为此次探访的目的地,其意义不仅在于规模,更在于它在全国算力棋局中的独特定位。
袁钰分析说道,随着AI应用从个人娱乐走向生产生活,任务复杂度呈指数级增长,几十台服务器的集群已无法满足需求,超大规模算力集群应运而生。而呼和浩特节点的特殊之处在于,它虽然算是“东数西算”工程的西部节点,但主要服务对象却是京津冀地区。
“我有问过相关负责人,主要服务的对象其实就是京津冀地区。”袁钰说。这种跨区域的服务模式,一方面验证了经济发达地区的算力需求可以通过西部资源来满足,另一方面也为呼和浩特乃至内蒙古的经济发展注入了新动力。
他进一步展望:“京津冀的企业会不会有一些转移?新来的企业和本地传统的牧业、矿产等业态会不会产生碰撞?这些都是未来可能的新故事。”
从产业视角看,这种跨区域协同对存储提出了更高要求。数据需要在几百甚至上千公里的距离上高效、安全、绿色地流动,这恰恰是“先进存力”需要解决的核心问题之一。
标准滞后与产业碎片化:隐忧何在?
尽管先进存力的重要性日益凸显,但行业远未到成熟期。
孙钢在采访中坦言,目前行业对AI存储的挑战和需求有诸多讨论,但存在KVCache管理混乱、RAG知识库碎片化、性能加速路径不统一等问题。
为此,中电标协数据存储专委会正在推动一系列标准建设。据孙钢介绍,目前重点方向包括AI加速能力、存储扩展能力、大规模吞吐下的性能能力,以及兼容性、可靠性、安全性等。目标是形成一套“价值评估体系”——不能像以前那样只看可靠性、容量、扩展性,而要综合评估存储在大模型推理、知识库等场景中的实际表现。
丁然则从更宏观的层面补充了标准工作的紧迫性:“我们要以标准为抓手,打破各个厂商之间的技术壁垒,实现多云的互联互通以及资源共享。”她还提到,绿色低碳存储的能效标准、设备易购与兼容标准,都是当前的工作重点。
2026年的存储市场:窗口期很短,竞争在加剧
站在2026年年中回望,AI给存储产业按下了加速键,但这个窗口期可能比很多人预想的要短。
石静对此有清醒的判断:“AI给分布式存储带来了新技术的拐点,但这个窗口期非常短。从国内AI芯片的发展速度就能看出来,在很短的窗口期内,对于新型存储怎么满足AI要求,每个厂商都面临新挑战。”
她给出的应对策略是:放弃做“大而全”产品的旧思路,每个厂商需要根据自己的核心优势和客户群体,聚焦细分场景,快速迭代。“危机感要有的,”她说:“紧迫程度非常高。”
这种紧迫感并非危言耸听。当算力中心从万卡集群向更大规模演进,当推理业务从云端向边缘和端侧渗透,存储系统的性能、成本、功耗、安全等多维度的约束将同时收紧。能否在窗口期内拿出切实可行的方案,将决定厂商在新一轮竞争中的座次。
存力的下一站:从效率引擎到认知中心?
如果仅仅把存储视为提升算力效率的工具,可能仍然低估了它的未来价值。
石静在采访中分享了一个更前瞻的思考:Mooncake在做推理框架时便已经提出“以KV Cache为中心”来设计系统,那么未来有没有可能“以存储或数据为中心”来重构整个AI生态?
“数据本身就应该是AI训练和推理过程中非常核心的资产。”她说,围绕数据的确权、流动、安全,构建以数据为中心的体系,可能是存储产业跳出“被动优化”逻辑的一条新路。
这个设想能否落地尚需时间检验,但它指向了一个趋势:在AI驱动下,存储的角色正在从“数据容器”升级为“数据引擎”,甚至可能进一步演变为“数据认知中心”。
而丁然对此也有一个概括性的总结:“先进存力之所以能成为国家新型基础设施的重要组成部分,核心原因在于它已经不是简单用来存数据的仓库,而是支撑人工智能发展、实实在在产生价值的核心基础能力。”
丁然强调,先进存力产业的发展离不开完善的标准体系。中电标协将携手全产业链,加速推进先进存力等标准的制定与落地,以统一标准规范行业发展,全面提升中国存力产业的国际竞争力。