GBase GCDW

云原生数据仓库GCDW

产品简介

产品介绍

南大通用云数据仓库GBase Cloud Data Warehouse(简称 GCDW)是一款自主研发的基于列存储的海量分布式大规模并行处理的多实例弹性云数据仓库。GCDW既支持本地部署(私有云下的计算与存储分离模式)也支持云上部署,采用存算分离架构,支持计算资源和存储资源的无限独立扩展,适用于分析类型的大数据平台、综合性BI系统、数据仓库和集市系统。

产品架构

存储计算分离,统一元数据、无状态计算节点
云服务
  • 负责云数据仓库实例的订购服务
  • 负责创建/删除云数据仓库实例
  • 提供云数据仓库实例访问入口(URL)、鉴权、访问控制、语法解析、生成执行计划、优化、元数据管理与存储、事务管理及执行调度管理、用户及权限管理、Warehouse管理、Database管理和云数据仓库功能服务等
  • 提供管理和运维服务能力,包括订单管理、计费管理、云数据仓库实例账户管理、云服务监控运维管理、云数据仓库实例管理和升级云服务管理、升级云数据仓库管理
虚拟仓库
  • 负责管理不同规格计算资源
  • 负责提供不同规格计算资源的算力
  • 负责缓存临时数据
数据存储
  • 提供分布式对象存储能力,用于持久化云数据仓库数据文件
  • 提供查询过程中临时表数据的缓存
  • 提供结果集缓存的持久化

SAAS服务优质体验

无需安装部署
完成订购后云数仓实例自动后台部署,开箱即用,缩短业务上线时间
自动调优
智能索引自动维护;数据特征相关统计信息自动更新,基于CBO的优化器,保证生成最优执行计划,省去繁复的数据库调优工作
简单易用的Web用户界面
提供丰富的开发、管理功能、工具集成功能,为客户提供简单易用的数据库开发和使用环境
支持多云部署
支持多种公有云环境下的部署,给客户更多选择;支持跨域、跨云的一致性数据服务接口,满足大型用户不同地域的业务运营和监管要求;提供不同公有云间数据仓库的数据复制和迁移工具,支持跨域和跨云的数据查询;支持混合云方式部署,兼顾私有云的自主性和公有云的弹性。
无需维护
节点故障、版本升级、负载均衡均由云数据仓库后台功能提供,无需客户储备专职DBA和系统运维人员,节省运维成本;
按实际使用计费帮助用户降低使用成本
存储资源根据实际使用的存储容量计费;计算资源根据集群的规模和使用时间计费;允许用户在无SQL任务执行的情况下自动关闭计算资源服务。

核心优势

极致弹性

采用K8s部署方式时,GCDW提供极致弹性,可快速扩容和缩容,支持创建多虚拟仓库,支持自动弹性。

秒级扩容缩容

采用存储、计算分离的架构,存算独立部署,独立扩展;统一元数据服务,实现了计算集群、管理集群无状态,可以实现秒级的扩容,无需进行数据重分布。

SaaS 服务

无需安装部署,开箱即用,订购后自动部署,缩短业务上线时间;无需运维,自动调优;提供简单易用的WEB开发、管理功能。

物理多租

租户间资源隔离,租户内通过不同的虚拟仓库计算资源负载不同的业务,多租户资源隔离,支持按需申请计算资源彻底解决传统数仓混合负载问题。

降低成本

在公有云上,采用 SaaS 服务提供方式,无硬件投资和部署成本;云上自动版本更新,故障恢复,服务7*24小时无停机,用户无运维成本,仅需按使用量支付费用。

适用场景

提升算力使用场景:解决计算资源不足问题

业务场景描述:
租户在申请云数仓实例时,申请了一个中等规模的虚拟仓库。在其业务初期,业务负载不高,虚拟仓库的算力可以满足客户的业务请求。随着用户业务规模的扩大,业务数据量不断增加,虚拟仓库对业务请求的响应时间因为数据量的增大而变长,使得客户业务响应变慢。
云数仓解决方案:
可以通过修改虚拟数仓的规格,增加虚拟仓库的算力。该扩容过程,可由用户使用云数仓的界面操作完成,云数仓可以实现秒级扩容,无需数据重新分布

提升吞吐量使用场景:解决并发处理能力不足问题

业务场景描述:
租户在申请云数仓实例时,申请了一个中等规模的虚拟仓库。在其业务初期,虚拟仓库的算力可以满足客户的业务请求。随着用户业务的发展,客户数量不断增加,对虚拟仓库的并发请求量成倍增长,单个虚拟数仓可承载的并发量是有限的,超过部分会排队等待处理造成时间拖延。
云数仓解决方案:
通过创建多个虚拟数仓提升并发访问量和吞吐量。例如在1个虚拟数仓的基础上再新创建两个相同规格的虚拟数仓。 该扩容过程,可由用户使用云数仓的界面操作完成,虚拟数仓秒级创建完成,多个虚拟数仓可以访问相同的业务表。

业务消峰使用场景:解决业务请求存在波峰波谷不平稳问题

业务场景描述:
一天24小时以内,平时总数50个并发左右,总会有1个或者2个业务高峰,超过100并发连续持续1小时左右
云数仓解决方案:
使用云数仓系统的自动弹性功能。在创建虚拟仓库时,配置该虚拟仓库最多有3个计算集群,其中1个计算集群保持一直启动承载业务,两外两个计算集群由业务的并发量自动触发。比如每个计算集群可承载的最大并发量为50,那么,当业务并发量每大于50时,云数仓系统自动调度启动一个新的计算集群开始承接业务请求;业务并发量下降到50以下的时候,自动启动的计算集群在没有业务请求的条件下自动停止。

云数仓实例内多租:解决部门级资源争抢问题

业务场景描述:
一个企业客户A具有多个下属部门,各个部门期望以独立的资源使用数据仓库系统执行各自的业务计算。例如:5个部门,部门1、部门2、部门3各自独立使用计算资源,部门4和部门5共享相同的计算资源。
云数仓解决方案:
企业客户A作为租户申请云数仓实例Ins,该租户在云数仓实例Ins依据自身的组织结构及业务需要规划创建多个数据库角色,然后为每个角色创建响应的计算资源即虚拟数仓和数据库,再分配给对应的部门使用,以满足上述业务场景的使用需要。

混合负载使用场景:解决数据加载和数据分析同时执行导致的资源争抢问题

业务场景描述:
一个企业客户B在仅具有一个数据仓库的情况下,执行加载业务时会因资源争抢而导致查询业务性能下降,甚至影响业务的开展。
云数仓解决方案:
企业客户B可以创建两个虚拟数仓,一个用于业务查询,一个用于数据加载;前者可以始终处于集群启动状态,后者仅在执行加载业务的时候启动,加载完成以后虚拟数仓停止运行,节省系统资源。

下载试用

GBase GCDW

云原生数据仓库