多模多态 智联未来 | 新一代AI原生数据库GBase 8c

发布时间:2026-06-30

6月25日,2026 GBASE技术云享会在天津天开园报告厅盛大启幕。南大通用GBase 8c产品经营部总经理张益应邀出席,并发表《多模多态 智联未来——新一代AI原生数据库GBase 8c》主题演讲。他从AI时代数据库面临的全新挑战出发,系统介绍了GBase 8c在多模存储、多态部署、AI原生能力等方面的技术创新,并通过泸州银行、某运营商结算系统等真实案例,展示了GBase 8c在金融、电信等关键行业的落地实践。

张益在演讲开篇指出,AI时代的到来对数据库提出了全新的要求。大模型训练数据量已达PB级,传统数据库存储扩容困难;AI训练与推理负载波动剧烈,计算资源需要按需扩缩容;模型推理要求毫秒级响应,查询性能要求极高;AI Agent并发访问数据库,带来百万级并发需求;RAG、语义搜索等新场景需要原生向量支持,且大部分AI应用需要标量与向量的混合检索。此外,AI场景对数仓的数据新鲜度提出了更高要求,传统ETL方式数据流转效率已难以满足。

“传统关系型数据库的核心设计,已经无法同时满足这些新需求。”张益说,“数据库必须进化,AI原生数据库正在路上。

GBase 8c:多模多态,一套系统应对多种场景

GBase 8c是南大通用自主研发的新一代AI原生数据库,其核心能力可概括为“多模多态”——多模存储与多态部署。

多模存储:行存、列存、行列混存,一套系统同时服务TP与AP

张益详细介绍了GBase 8c的三种存储模式。行存储按行物理连续存储,通过MVCC与WAL日志支撑高并发事务,适用于OLTP场景。列存储按列物理连续存储,采用CU压缩单元与多种压缩算法,压缩比高、IO开销小,适用于OLAP分析。行列融合存储则让一张表同时拥有行存和列存两种物理形态,通过delta表机制实现行转列,查询优化器自动为OLTP和OLAP选择最优存储路径。HTAP行列融合存储让一套系统同时支撑交易与分析,消除了传统架构中OLTP与OLAP的数据孤岛。

多态部署:主备、分布式、存算分离,灵活适配不同规模

GBase 8c提供三种部署形态。主备部署一主多备,部署简洁交付高效,适用于较低数据量、追求极致单机性能的场景。分布式部署支持全组件冗余高可用与计算存储分离,可对计算和存储能力分别进行水平扩展,适用于大数据量高并发场景。存算分离部署采用共享对象存储,计算层无状态设计,支持秒级扩缩容和Scale-to-Zero,空闲时计算成本趋近于零,特别适合AI训练推理负载波动大的场景。

AI原生能力:向量检索、存算分离、数据分支

原生向量存储与融合检索

GBase 8c内置向量存储与HNSW、IVF、PQ等量化索引,支持向量相似度、标量过滤与全文搜索的混合检索,可直接支撑RAG、推荐系统、相似搜索等AI应用。SQL Join与向量搜索可组合成复杂融合SQL,按标量过滤条件生成位图,再通过ANN检索算法获取向量数据,同时满足位图过滤与向量检索条件。

存算分离与Scale-to-Zero

计算层完全无状态设计,节点不保存持久化数据,状态通过WAL流式同步存储层。AI训练阶段高负载时自动增加计算节点,推理或空闲阶段缩减计算资源,零负载时Scale-to-Zero,计算成本趋近于零,新负载到来时秒级唤醒快速恢复服务。

基于WAL的Copy-on-Write数据分支

创建分支时无需复制实际数据,仅记录WAL日志位置,实现秒级分支创建。新分支与原始数据共享历史页面,写入时才复制被修改页面,多分支完全隔离互不影响,支持并行开展多个AI实验,且支持快速回滚。

湖仓事务/分析处理一体化

在湖仓一体化方面,GBase 8c打破了传统架构中OLTP与数据仓库分离的模式。传统方案需要通过ETL将数据从OLTP系统搬运到数据仓库,延迟数小时,数据已过时;GBase 8c与GBase 8a协同,实现实时数据镜像,同一份新鲜数据同时服务在线交易与数据分析,让AI应用和实时决策基于最新数据。

核心价值:降本、增效、简化架构

张益重点阐述了GBase 8c的三大核心价值。

显著降低硬件投入成本

GBase 8c单节点最大容量可达10TB至30TB,远超传统方案2TB限制,同等数据规模下物理节点更少,硬件成本节约50%至80%,同时节省服务器、机房、电力及运维人力。

大幅降低应用开发与迁移成本

原生分布式架构对业务透明,应用层无需感知底层分布式细节,支持任意复杂的跨节点JOIN查询,打破中间件限制。平滑迁移存量集中式业务,避免大量代码重构,显著降低开发与迁移成本。

极大简化系统架构复杂度

GBase 8c内置行存与列存多存储引擎,通过单一集群即可满足TP高并发交易与AP复杂分析的混合负载需求,真正实现“一份数据,两种服务”,大幅降低系统耦合度。

案例实践:金融与电信核心系统验证

泸州银行信贷系统、电子银行与分布式核心系统

随着业务发展与数据量增大,传统集中式数据库已无法满足高并发与大规模数据处理需求。泸州银行选择以GBase 8c为统一底座,从源头重塑数据架构。项目上线后成效显著,夜间批量作业从2.5至3小时缩短至30分钟左右,数据同步从2-3小时降至数分钟,故障切换从人工操作变为秒级自动。核心查询响应效率提升44%,电子银行各渠道数据链路打通,客户、账户、交易等核心数据实现集中管理与统一规范。

某运营商结算系统

传统集中式架构难以应对结算中心灵活的业务需求,月处理话单量达百亿级。GBase 8c分布式部署后,结算话单实时处理能力达到1800亿条/月,话单上发一级系统处理能力达到150亿条/月;网间、省际业务月账完成时长控制在2小时内,本省SP业务完成时长控制在8小时内;实现对150余项结算业务的覆盖支撑。

某省级全民健康信息平台

平台高度兼容MySQL和Oracle语法,最大限度减少迁移适配工作量。中心系统采用分布式部署,支撑大数据量大并发需求,存储数据量达5PB;医疗机构前置机采用单机部署,最大程度节约软硬件成本;提供统一访问接口,降低业务开发成本。

从多模存储到多态部署,从原生向量检索到存算分离,GBase 8c以“多模多态”为核心,为AI时代的数据管理提供了完整的技术底座。未来,GBase 8c将持续深化AI原生能力,让数据库真正成为AI时代的“数据智能引擎”。