GBase新闻
GBASE闲谈 | 聊金融容灾方案(下)
关于金融行业的容灾方案,上一篇【GBASE闲谈 | 聊金融容灾方案(上)】我们讲述了冗余表现中的存储安全和服务安全,本篇我们来聊一聊传输安全是怎样实现的?
传输安全 - 不中断
传输的中断主要来源于两个原因:网络中断或是物理性机房损毁。在这种情况下,我们需要的是系统级别的冗余,也就是双中心容灾配置。
事务处理引擎:
在事务处理引擎方面,GBase 8s提供同城近距离复制和远程异步复制技术,完成系统损毁级的容灾方案。
同城近距离复制方案我们称之为HAC复制方案。
HAC 工作的基本原理:当主数据库服务器开始将共享内存中的逻辑日志缓冲区的内容刷新到磁盘上的逻辑日志时,数据库服务器也将逻辑日志缓冲区的内容复制到主数据库服务器上的数据复制缓冲区。然后主数据库服务器将这些逻辑日志记录发送至 HAC 辅助数据库服务器。
HAC 辅助数据库服务器将来自主数据库服务器的逻辑日志记录接收到共享内存接收缓冲区(数据库服务器自动将接收缓冲区调节至适当的大小以适合正在发送的数据量)。然后辅助数据库服务器在整个逻辑恢复中应用逻辑日志记录,并将这些记录应用到其自己的数据库空间。
HAC 数据复制支持同步或异步两种方式。
同步更新方式:一旦主数据库服务器将逻辑日志缓冲区内容写入 HAC 缓冲区,它会将那些记录从缓冲区发送至 HAC 辅助数据库服务器。仅当主数据库服务器接收到来自 HAC 辅助数据库服务器的确认(已收到记录)之后,主数据库服务器上的逻辑日志缓冲区清仓才会完成。使用同步更新时,如果发生故障,那么在主数据库服务器上提交的事务在 HAC 辅助数据库服务器上不会仍未提交或部分提交。
异步更新方式:主数据库服务器在将逻辑日志缓冲区内容复制到 HAC 缓冲区之后会清仓逻辑日志缓冲区。(与上述操作无关)当发生以下条件之一时,主数据库服务器在整个网络上发送 HAC 缓冲区的内容:
• HAC 缓冲区变满。
• 自上次将记录发送至辅助数据库服务器以后,配置参数在主数据库服务器上指定的时间间隔已过去。
某头部保险公司国产化OA系统搭建示意图
通过HAC搭建实现了部分关键国产产品的首次适配。东方通中间件与南大通用GBase数据库的适配;OA系统与南大通用GBase数据库保险行业适配。
远程异地复制方案我们称之为RHAC复制方案。
RHAC在很多方面都与 HAC 相似。将日志发送到 RHAC辅节点的方式与主服务器将日志发送到 HAC 辅助服务器的方式很相似。但是,RHAC 采用 SMX 异步通信框架,因此其对主服务器的影响达到最小。出于该原因,主服务器和 RHAC 辅助服务器之间事务落实或检查点是异步进行的。RHAC通过提升为 HAC 辅助服务器,实现最终提升为主服务器,从而接管远端主服务器,完成异地服务接管功能。
某调度云平台通过RHAC实现1600公里容灾的配置方案:
通过上千公里远程异地容灾方案建设,实现本地、异地读写分离双活集群秒级数据同步,产品上线运行至今,在稳定性、高性能、高可用方面完全超预期满足了客户核心业务支撑运行,为远程异地双活国产化建设提供了示范和参考。
分析处理引擎:
在分析处理引擎方面,GBase 8a提供多集群复制技术,完成异地容灾方案。
举一个金融行业唯一上线的利用GBase 8a搭建的高可用MPP数据库双活集群的例子,配置如下图:
• 查询与批量分离设计:
1、业务上实现查询和批量并行,两个集群互不影响;
2、A集群处理批量,B集群进行联机查询。
• 同步方案设计:
1、基于集群间同步工具的一致性方案设计;
2、基于镜像集群的实时一致性方案设计。
通过搭建高可用MPP数据库双活集群,数据查询与批量加工分离,提升数据处理和数据服务能力。通过支持增量数据同步、准实时同步以及文件块同步,提高了系统升级、灾备、异常处理过程中的业务连续性。
总结
容灾全方面解决方案在事务引擎方面通过磁盘保护、服务提供保护和灾难性传输中断保护来提供。以GBase 8s为例,其逻辑配置如下图:
下面是某城商行的配置实践:
在分析引擎方面通过多副本、池化管理节点和多集群同步来提供。以GBase 8a为例,其逻辑配置如下图:
下图是某资金清算中心为全国30家农村合作金融机构及其数万个网点提供汇兑、银行汇票、个人账户通存通兑等业务的资金清算的北京-长沙双中心的配置实践:
通过GBase 8a多集群支持能力,保证两中心数据同步。
天津南大通用数据技术股份有限公司从2004年设立之初,就以数据安全为产品研发的基准。推出的第一款数据库命名就是“安全数据库”。通过近20年的努力,专注于数据库的国产化建设,主线产品全部实施国产生态适配,几乎涵盖了所有的国内通用平台:
由于对数据的全方位呵护,多样化的容灾解决方案。GBASE南大通用提供给客户灵活多变的容灾系统构建方案,受到客户的信任,目前用户已遍及三十余个国家及地区,国内32个省份,运行节点数超过30000个,总数据量>300PB。
我们对容灾的追求不仅仅停留在秒级RTO上,我们的追求是永不中断!