文 | 智能相对论
作者 | 叶远风
AI时代,当算力供给能力逐步提升,且形式和来源都变得更加丰富后,业界的目光开始更多放到了数据上,“AI能力由数据决定”这句话的含金量在进一步提升。优质的数据、强大的数据处理能力等等,已经成为AI大模型创新的必选项。
此时,与“数据”直接相关的存储基础硬件、数据库基础软件的重要性不言而喻。
只不过,既然是乘着AI的东风而来,那么它们也必须进化出适应AI需求的新范式,才能既“不负时代所托”,又能获得自己的市场竞争优势。
12月26日,openGauss Summit 2025在北京举办,作为开源数据库openGauss社区年度旗舰活动,峰会全面展示了过去一段时间社区最新成果,重点解读了openGauss 7.0.0创新版,并宣布正式开放在今年发布的业界首个开源多写数据库oGRAC的代码仓。
以中国领先的数据库根技术社区站位,openGauss始终聚焦数据库最核心、最底层的根技术创新,回顾其历次演进都精准回应了产业发展的现实需求。此次峰会背后,数据库如何适应AI时代需要、打造出新的范式,openGauss又一次给出了行业借鉴。
从记录系统到智能数据引擎,AI对数据库提出了更严苛的需求
区别于过去AI只是作为辅助应用存在,在大模型能力逐步强化后,越来越多的核心生产系统上已经能看到AI应用的身影。如果说过去的数据库底座还能“凑合用”,那么当AI深度嵌入产业生产核心系统后,底座的变革就已经箭在弦上。
对AI来说,它要的已经不是一个被动响应、精准记录、服务于人类决策的“笔记本”式数据库,而是能够全方位支撑AI应用各方面需求的智能数据引擎,来满足多模多态、算力融合、资源池化等技术要求,尤其是深度适配超节点等新兴算力形态。
通俗来说,AI 时代的数据库要具备多个核心能力:
要“懂内容”,具备处理多模态数据与向量数据的原生能力,而不是只记录;
要“反应快”,尤其是要满足低延迟的实时数据处理需求,不能像过去一样慢吞吞;
要“抗压强”,能承载超高吞吐与弹性扩展的业务压力,让企业放心、省心推进大模型项目;
要“能干活”,与AI工作流实现深度集成与协同,而不是被动等待“派活”。
想要在AI时代站稳脚跟,数据库就必须完成这样的从单一功能工具到融合能力平台的跨越,迎来全新范式。
而这,正是openGauss在尝试做的。
与超节点深度协同,openGauss趟出一个AI时代数据库新范式
openGauss在本次大会上系统介绍了多项技术进化成果,如果把视角转到AI大模型发展对数据库的需求上,一个包含了对超节点等新兴算力模式协同与支撑的AI时代数据库新范式,浮出水面。
2025年是超节点产业的“加速渗透年”,从华为昇腾Atlas 900 A3超节点真机在2025世界人工智能大会期间首秀,全球范围内掀起了超节点热,华为等头部企业均发布了自家的超节点产品,这个队伍还在不断扩大。
而超节点不能只有多卡融合的“机柜”,产业生态完善同样是重要任务。操作系统方面已有开源欧拉社区发布全球首个面向超节点的操作系统版本,技术标准方面华为开放灵衢互联协议2.0,这些都在让超节点走向标准化生态。
在数据库方面,openGauss顺应了超节点发展趋势。
这一点,在oGRAC上体现得尤为明显。
这几年,多写数据库发展趋势明朗它告别传统主从架构模式(唯一的主节点既是性能瓶颈也是单点故障源),实现了“民主”集群设计,让每个节点都具备同等读写能力,实现了真正的去中心化,从而保障了系统的极致韧性和高可靠性。
此次峰会上,openGauss正式开放了在今年发布的业界首个开源多写数据库oGRAC的代码仓,oGRAC是一个为企业核心系统准备的、开源免费的、既能顶住突发高压又极其稳定可靠的高性能数据库集群方案。
从官方公布的信息看,oGRAC做到了节点故障自动迁移(任一节点宕机时业务均可在秒级内无缝切换,保障业务连续性)、读写吞吐大幅提升、更高的扩展比(扩展比>0.82,平滑应对业务压力)、更强的性能(领先业界标杆产品5%)、更高的资源利用率(计算节点100%活跃)等特性。
而更重要的是,oGRAC多读多写架构先天需要硬件层面的共享能力,超节点实现了计算、内存、网络、存储的全面池化共享,二者设计理念高度契合,这使得oGRAC能够更好地与超节点协同、产生更好的效能。例如,oGRAC 在普通服务器(鲲鹏+ openEuler2.03)环境中已实现340tpmC 的性能,平移至华为9月发布的TaiShan 950 SuperPoD通用计算超节点后,仅简单适配未做深度开发,性能就达到540万tpmC的惊人水平。
目前,openGauss 社区已经开始针对超节点进行完整的原生开发(而非简单平移现有架构),充分发挥超节点的硬件优势。未来,可以想象,超节点的新接口、新库及新加速能力与oGRAC深度结合,一个“超节点原生数据库(超节点 DB)”的出现将成为必然,这意味着更大的性能提升和创新空间。
当然,oGRAC以开源形式提供也意味着任何企业都可以免费使用、修改和部署这套能支撑高并发写入的集群技术,打破了之前这类高性能技术可能只存在于商业付费产品中的局面,某种程度上也是一种数据库能力的特殊“普惠”。
可以说,革命性的多写架构基础上,oGRAC正在让企业都可以构建起金融级高可用、高弹性数据服务。
更进一步看,openGauss与超节点深度协同是在解决算力瓶颈问题,但作为数据的载体这可能还不够——要真正坐实“AI能力由数据决定”,openGauss还在同步加大对RAG的有效支持、辅助推进AI能力本身的提升。
企业RAG能够有效弥补大模型在知识时效性、专业性、事实准确性以及数据安全等方面的不足。尤其当AI应用切入生产核心系统后,需求从简单的聊天对话,转向客户支持、合规咨询、员工培训、智能投标等严肃业务场景,此时RAG能够满足企业应用对可靠性、精准度和安全性的高要求,因此已经成为行业客户的必选项。
openGauss社区推出的鲲鹏RAG AI解决方案,具备高性能、四库归一(关系型/全文检索/知识图谱/向量检索统一,简化开发/运维/部署)、高安全的一体化特性,最大支撑10TB级数据规模,向量检索性能领先友商30%,且支持对接k8s、ray管理组件,能有效满足资源弹性调度,海量数据高并发处理要求。
协同超节点的同时做好了RAG支持,数据库的时代价值才能体现得更为明显。
当然,在这背后,离不开openGauss将“向量化”能力深度融入数据库内核的创新,其不断迭代进化的DataVec向量引擎正在彻底改变检索模式,让数据库真正成为企业的“智能记忆中枢”。
下一个五年,openGauss的目标是引领技术趋势
就在本次大会上,更高效、更安全、更可靠的openGauss7.0.0 RC3版本进行了展示,这向业界表明了openGauss社区运行卓有成效,数据库技术和版本持续迭代演进,无论是客户还是开发者、伙伴,都将更有信心。
而根据沙利文数据,2024年,在中国范围内选择基于openGauss技术路线发展自身产品的比例已达28.5%,超过了MySQL和PostgreSQL,成为最主流的开源技术路线之一。此次峰会上,沙利文发布了最新数据,2025年基于openGauss系关系型数据库占比达到了29.4%,超过了其他开源数据库版本,蝉联第一。
现在,有15家生态伙伴构建了基于openGauss的数据库商业发型版,20家企业建设了基于openGauss的数据库企业自用版,另外有9家openGauss服务伙伴在提供专业保障服务,商业模式的丰富让openGauss满足了不同类型企业诉求。
总的看来,过去5年,openGauss成功完成了实现了社区有效运营、技术高速进化、商业稳步变现的良性循环,走出了自己的路。
值得一提的是,为发掘超节点与openGauss结合的潜力,大会现场由产学研用多家企业和伙伴共同成立“超节点数据库产学研联盟”,其目标,是打造世界领先的超节点数据库竞争力,推动超节点在通算领域(尤其是数据库)的第一波变革落地。超节点硬件厂商、数据库开发者、行业用户等生态伙伴已经开始行动起来,在openGauss共同探索超节点DB在各行业场景的应用落地。
可以认为,当市场份额再创新高,AI时代的数据库范式建立和完善,未来五年的openGauss很显然将不满足于“走自己的路”,而是要通过把握超节点等时代脉搏,把握伙伴与行业需求,引领数据库技术趋势。
*本文图片均来源于网络