GBase新闻
数据库迁移怎么破?MySQL到南大通用GBase 8c迁移方案来啦
在数字化浪潮席卷而来的今天,出于系统架构、成本以及业务的考量,越来越多企业用户需要完成异构数据库间的适配迁移。南大通用GBase 8c数据库作为第三代智能化数据库产品,具有多模多态、弹性伸缩、强一致性分布式事务等产品特性,能够承载企业海量的数据;将繁重工作负载分配到多台服务器上并行处理,提高系统的吞吐量和响应速度,提供更高的性能、容错性和可靠性。
同时GBase 8c具备高兼容性,提供全套完备的数据迁移方案与工具,实现不同数据库至GBase 8c的平滑迁移。本文以MySQL数据库迁移至GBase 8c数据库为例,介绍迁移工作中的关键步骤。
迁移前的关键准备工作
环境评估与兼容性分析
(1)根据源库特征,来选择GBase 8c目标库兼容模式。本文以MySQL为源库,则目标库应选择B兼容模式,在创建database时指定。
(2)校验对象兼容性,重点检查源库的存储过程、触发器、自定义函数等高级特性,例如MySQL的“ENUM”类型和“TINYINT”已实现原生兼容 。
(3)字符集适配。
需要注意的是GBase 8c默认字符集为“SQL_ASCII”,在创建库时需要显式设置“UTF8MB4”以匹配MySQL标准。
综上因素,创建目标库的database。例如创建mytest库,指定兼容模式为B、设置字符集,执行命令:
CREATE DATABASE mytest WITH DBCOMPATIBILITY='B' ENCODING='UTF8MB4';
对目标库再次确认兼容模式,执行命令:
SELECT datname,datcompatibility FROM pg_database;
2. 迁移工具选型策略
GBase 8c自带的命令行工具链,适用于迁移自动化流水线场景,包含gs_dump逻辑导出工具与gsql数据加载工具等。
配套可视化工具DMT,采用B/S架构,支持Docker一键部署,提供数据迁移、数据同步、数据校验三大核心功能模块。
迁移实施核心步骤详解
1. 数据库对象迁移
(1)表结构转换
通过mysqldump --no-data导出DDL脚本后,GBase 8c可直接执行90%以上的MySQL建表语句。
特殊处理场景例如:
时间精度处理:根据是否有时区,将DATETIME(6)转换为TIMESTAMP(6) WITH TIME ZONE或TIMESTAMP(6) WITHOUT TIME ZONE
索引优化:分布式环境下建议采用哈希分布键替代B树索引
(2)存储过程迁移
该对象可能需要进行语法转换,例如:
MySQL原语句为:
DELIMITER //
CREATE PROCEDURE get_users()
BEGIN
SELECT * FROM users;
END //
DELIMITER ;
GBase 8c适配后语句转换:
CREATE OR REPLACE PROCEDURE get_users()
LANGUAGE plpgsql
AS $$
BEGIN RETURN QUERY SELECT * FROM users;
END;
$$;
2. 数据迁移实施
使用MySQL自带的工具进行数据导出,例如执行:
mysqldump -u root -p --single-transaction --databases db1 > full_backup.sql
数据导出到full_backup.sql文件中。
GBase 8c进行数据加载,例如执行:
gsql -d target_db -p 15400 -f full_backup.sql
将full_backup.sql文件中数据进行导入。
建议:TB级数据采用分片并行加载策略以提升吞吐量
典型问题与解决方案
1. 字符集冲突
例如在迁移时出现错误:ERROR: could not determine collation for view column。
根据错误提示可了解到是由于未指定字符集。
解决方法:
显式指定COLLATE utf8mb4_general_ci,执行:
CREATE VIEW v1 AS SELECT col1 COLLATE "utf8mb4_general_ci" FROM tbl1;
2. 分布式事务优化
在迁移时,如果出现跨节点UPDATE语句性能下降的问题。
解决方法:
启用SET dolphin.b_compatibility_mode = on,开启dolphin兼容性插件,以提升语法兼容性
采用HASH分布优化数据局部性
3. 函数兼容性处理
假如在迁移时出现STR_TO_DATE返回值类型不匹配的问题。
解决方法:
添加显式类型转换,例如执行:
SELECT (STR_TO_DATE('2023-01-01', '%Y-%m-%d')::timestamp) + INTERVAL '1 day';
迁移后验证
在数据迁移完成后需要对其进行校验,确保数据的完整性和准确性,可以通过以下方式进行验证:
比对表行数:比较MySQL和GBase8c中每个表行数是否一致。
随机抽样:随机抽取一部分数据,收到验证数据的一致性。
检查外键约束和索引:确保所有外键约束和索引都已正确迁移。