今天分享的是:中国移动:云智算技术白皮书(2025)
报告共计:30页
《中国移动:云智算技术白皮书(2025)》聚焦云计算智能化升级,提出云智算技术体系,旨在通过算网基础设施与人工智能深度融合,构建适应智能时代的新型云服务模式。以下从发展背景、体系架构、关键技术及未来展望等方面展开总结:
一、云计算演进与云智算内涵
云计算历经资源云化、云原生化、算力泛在化阶段,当前因千亿参数大模型等AI技术发展,传统云服务在算力调度、网络时延、服务形态等方面面临挑战,亟需向云智算升级。云智算通过算网与AI融合,提供一体化算网资源、全栈开发环境、一站式模型服务及多样化场景应用,是下一代云计算范式,也是未来算网智一体化算力网络的核心载体。其体系架构从传统三层(IaaS、PaaS、SaaS)拓展为四层:AI IaaS(算网一体化基础设施)、AI PaaS(AI开发工具平台)、MaaS(模型即服务)、AI SaaS(AI应用服务),并围绕十大关键技术方向展开布局。
二、云智算关键技术方向
1. 计算技术:针对算力密度、通信效率等挑战,攻关算力芯片、智算超节点、算力原生技术。例如,推出大云磐石DPU优化智算网络性能,基于COCA架构打造开放式智算超节点,推动算力原生技术实现跨芯片统一开发部署。
2. 存储技术:聚焦智算文件存储与训推多级缓存。通过软硬融合架构提升存储性能,构建多级缓存架构解决显存与内存容量限制问题,利用CXL互联技术实现资源共享。
3. 网络技术:构建“卡间-机间”全栈互联体系。卡间采用全向智感互联(OISA)协议实现高带宽低时延互联;机间提出全调度以太网(GSE)架构,革新传统以太网络,解决大规模集群组网问题。
4. 算网一体技术:算力路由技术将算力信息融入路由协议,实现算网联合调度;在网计算技术通过卸载集合通信算子至网络节点,降低传输压力,提升系统性能。
5. AI开发平台技术:涵盖数据处理、训练框架、推理框架、智能体生成及开发工具。例如,通过数据合成、智能标注优化数据处理流程,利用训练并行优化、低精度训练提升模型训练效率,依托向量数据库、低代码开发降低AI开发门槛。
6. 模型服务与算网大脑:MaaS平台汇聚多类型模型与智能体,实现端到端模型交付;算网大脑构建资源、任务、智能体三级编排调度体系,提升算网资源协同效率。
7. 安全可信与绿色节能:安全方面强化计算环境可信、数据安全可用、智算服务可靠;节能方面推进能效管理、数据中心热管理及算电协同,探索液冷技术与余热回收,助力绿色AI发展。
三、未来技术展望与产业倡议
未来,云智算将向存算一体、量子计算、高吞吐抗损传输等前沿领域延伸。存算一体技术有望突破“存储墙”,量子计算可提供指数级算力加速,智算互联网络(UDCI)将解决跨中心数据传输难题。中国移动倡议产学研用各方协同完善技术标准、攻关关键技术、创新应用服务、繁荣产业生态,共同推动云智算技术成熟与规模化应用,赋能千行百业数智化转型。
白皮书系统阐述了云智算的技术框架与实施路径,展现中国移动在算力网络与AI融合领域的探索成果,为行业发展提供重要参考。
以下为报告节选内容