logo
GBase 8a
安装配置
文章

E01+ GBase 8a MPP Cluster V953 安装和卸载

老好
发表于2024-02-26 10:16:421130次浏览0个评论

GBase 8a MPP Cluster V953 安装和卸载

       GBase 8a MPP Cluster 953 版本,与952版本相比,引擎三大模块gcware、gcluster、gnode均可以实现独立部署,相互独立,不再像952版本gcware和gcluster必须部署在一起,统称管理节点。953版本gcware可以和gcluster部署不一样多的节点数,一般还是建议gcware和gcluster部署一起,gcware可以部署3个或者5个节点;gcluster节点可以根据数据节点多少,部署3、5、7、9等等。因为gcware节点独立,所以启动8a服务需要分别启动 gcware服务和gcluster服务,需要使用不同的命令。

       以下为3节点8a集群953版本的安装示例。

一、集群节点环境设计

IP角色OShostID
10.168.10.26管理、数据、主节点CentOS 7.9node26
10.168.10.27管理、数据节点CentOS 7.9node27
10.168.10.28管理、数据节点CentOS 7.9node28
  1. 操作系统要求:Redhat 7.x(或者CentOS 7.x)。安装系统时建议在“软件选择”中勾选“带GUI的服务器”中的“开发工具”选项。

  2. 推荐硬件配置:CPU 2.0 GHz 以上;内存4G以上,剩余磁盘空间 20G以上,固定IP地址。

  3. 网络要求:各节点IP是同一网段,并互相能连通;开启 SSH 服务;关闭防火墙、关闭seLinux服务。

二、安装前准备工作

  1. 标识符约定:
    # 表示以 root 账户执行
    [26]# 表示在 26 节点以 root 账户执行
    $ 表示以 DBA 账户执行
    [26]$ 表示在 26 节点以 DBA 账户执行

  2. 准备 SSH 工具:
    推荐 XManager 5 以上。使用 XShell 模块分别连接三个 IP 创建三个 Session 窗口,方便在工具底部 Compose Bar中输入命令,同时发送命令到三个 Session 窗口。其他易用的工工具入如,Tabby、SecureCRT 等。

  3. 节点联通测试:
    在 node26 窗口分别执行
    # ssh root@10.168.10.27
    # ssh root@10.168.10.28
    若能成功跳转,则说明节点互通。

  4. 检查所有节点防火墙是否关闭:
    # systemctl status firewalld.service
    如果没关闭,则执行下面命令永久关闭
    # systemctl stop firewalld
    # systemctl disable firewalld

  5. 检查所有节点 selinux 服务是否禁用:
    执行
    # sestatus
    系统提示以下信息说明 selinux 已被禁用
    SELinux status: disabled

    否则修改配置文件/etc/selinux/config,将SELINUX参数设置为 disabled,即 SELINUX=disabled
    保存退出后,需要重新启动才能生效。

  6. 准备安装包:
    请将下载的安装包 GBase8a_MPP_Cluster-NoLicense-FREE-9.5.3.28.12-redhat7-x86_64.tar.bz2 上传到 node26:/opt 下。

三、集群的安装

1、在集群所有节点上创建DBA用户

# useradd gbase
# passwd gbase

本文,gbase 账户密码设置为 dba@gbase8a

2、在集群所有节点上创建安装目录并授权

# mkdir -p /opt/gbase
# chown gbase:gbase /opt/gbase
# chown gbase:gbase /tmp

3、安装包解压缩

[26]# cd /opt
[26]# tar xfj GBase8a_MPP_Cluster-NoLicense-FREE-9.5.3.28.12-redhat7-x86_64.tar.bz2
解压缩完成后,opt 下能看到生成 gcinstall 安装目录。

4、配置安装环境

  • 复制主节点的环境设置脚本(SetSysEnv.py)至从节点
    [27]# scp root@10.168.10.26:/opt/gcinstall/SetSysEnv.py /opt
    [28]# scp root@10.168.10.26:/opt/gcinstall/SetSysEnv.py /opt

  • 运行SetSysEnv.py脚本配置安装环境
    [26]# python SetSysEnv.py --dbaUser=gbase --installPrefix=/opt/gbase --cgroup
    [27]# python SetSysEnv.py --dbaUser=gbase --installPrefix=/opt/gbase --cgroup
    [28]# python SetSysEnv.py --dbaUser=gbase --installPrefix=/opt/gbase --cgroup

如果遇到 IPV6 protocol not supported,please turn it on…的错误提示,
请手动开启 IPV6,执行:
# echo "net.ipv6.conf.all.disable_ipv6 = 0" >> /etc/sysctl.conf
# echo "net.ipv6.conf.default.disable_ipv6 = 0" >> /etc/sysctl.conf
# sysctl -p # 立即生效

5、修改主节点的安装配置文件(demo.options)

  • 切换到 gbase 用户:
    [26]# su - gbase
    [26]$ cd /opt/gcinstall/
    [26]$ vi demo.options

installPrefix= /opt/gbase
coordinateHost = 10.168.10.26,10.168.10.27,10.168.10.28
coordinateHostNodeID = 26,27,28
dataHost = 10.168.10.26,10.168.10.27,10.168.10.28
#existCoordinateHost =
#existDataHost =
#existGcwareHost=
gcwareHost = 10.168.10.26,10.168.10.27,10.168.10.28
gcwareHostNodeID = 26,27,28
dbaUser = gbase
dbaGroup = gbase
dbaPwd = 'dba@gbase8a'
rootPwd = 'peixun'
#rootPwdFile = rootPwd.json
#characterSet = utf8
#dbPort = 5258
#sshPort = 22

说明:V953 和 V952 版本不同在于,gcware 模块可以单独部署,可以不与 gcluster 节点部署在一起了,demo.options 文件中多了gcware 相关参数(gcwareHost 和 gcwareHostNodeID)。
dbaPwd 是 gbase 账户的密码
rootPwd 是 root 账户的密码

6、执行安装脚本

[26]$ ./gcinstall.py --silent=demo.options
备注:在安装过程中,先进行环境检查,可能会有错,列出缺少rpm依赖包名称,说明操作系统没有安装全必须的rpm包,需要根据rpm包的名称去各节点逐个安装。
8a需要的必备依赖包列表,请查看安装目录gcinstall下的 dependRpms 文件
[26]$ cat dependRpms

注意:如果操作系统没cgroup(资源管理)组件,会出现如下警告,输入 Y 回车即可继续执行。
在这里插入图片描述

7、集群状态查看

安装结束之后,查看集群的状态。
$ gcadmin

CLUSTER STATE:         ACTIVE

====================================
| GBASE GCWARE CLUSTER INFORMATION |
====================================
| NodeName |  IpAddress   | gcware |
------------------------------------
| gcware1  | 10.168.10.26 |  OPEN  |
------------------------------------
| gcware2  | 10.168.10.27 |  OPEN  |
------------------------------------
| gcware3  | 10.168.10.28 |  OPEN  |
------------------------------------
======================================================
|       GBASE COORDINATOR CLUSTER INFORMATION        |
======================================================
|   NodeName   |  IpAddress   | gcluster | DataState |
------------------------------------------------------
| coordinator1 | 10.168.10.26 |  OPEN    |     0     |
------------------------------------------------------
| coordinator2 | 10.168.10.27 |  OPEN    |     0     |
------------------------------------------------------
| coordinator3 | 10.168.10.28 |  OPEN    |     0     |
------------------------------------------------------
=============================================================
|         GBASE CLUSTER FREE DATA NODE INFORMATION          |
=============================================================
| NodeName  |  IpAddress   | gnode | syncserver | DataState |
-------------------------------------------------------------
| FreeNode1 | 10.168.10.26 | OPEN  |    OPEN    |     0     |
-------------------------------------------------------------
| FreeNode2 | 10.168.10.27 | OPEN  |    OPEN    |     0     |
-------------------------------------------------------------
| FreeNode3 | 10.168.10.28 | OPEN  |    OPEN    |     0     |
-------------------------------------------------------------

0 virtual cluster
3 coordinator node
3 free data node

执行 gcadmin,如果系统报错“没有找到命令…”,说明环境变量没有生效,可以尝试执行以下命令:

$ exit
# su - gbase
$ gcadmin

8、设置分片信息(创建发布)

在主节点的 /opt/gcinstall 目录中执行:
[26]$ gcadmin distribution gcChangeInfo.xml p 2 d 1 pattern 1

  • gcinstall 下生成 gcChangeInfo.xml 文件

<?xml version="1.0" encoding="utf-8"?>
<servers>
<rack>
<node ip="10.168.10.26"/>
<node ip="10.168.10.27"/>
<node ip="10.168.10.28"/>
</rack>
</servers>
  • 再次查看集群状态
    [26]$ gcadmin

CLUSTER STATE:         ACTIVE
VIRTUAL CLUSTER MODE:  NORMAL

====================================
| GBASE GCWARE CLUSTER INFORMATION |
====================================
| NodeName |  IpAddress   | gcware |
------------------------------------
| gcware1  | 10.168.10.26 |  OPEN  |
------------------------------------
| gcware2  | 10.168.10.27 |  OPEN  |
------------------------------------
| gcware3  | 10.168.10.28 |  OPEN  |
------------------------------------
======================================================
|       GBASE COORDINATOR CLUSTER INFORMATION        |
======================================================
|   NodeName   |  IpAddress   | gcluster | DataState |
------------------------------------------------------
| coordinator1 | 10.168.10.26 |   OPEN   |     0     |
------------------------------------------------------
| coordinator2 | 10.168.10.27 |   OPEN   |     0     |
------------------------------------------------------
| coordinator3 | 10.168.10.28 |   OPEN   |     0     |
------------------------------------------------------
=========================================================================================================
|                                    GBASE DATA CLUSTER INFORMATION                                     |
=========================================================================================================
| NodeName |                IpAddress                 | DistributionId | gnode | syncserver | DataState |
---------------------------------------------------------------------------------------------------------
|  node1   |               10.168.10.26               |       1        | OPEN  |    OPEN    |     0     |
---------------------------------------------------------------------------------------------------------
|  node2   |               10.168.10.27               |       1        | OPEN  |    OPEN    |     0     |
---------------------------------------------------------------------------------------------------------
|  node3   |               10.168.10.28               |       1        | OPEN  |    OPEN    |     0     |
---------------------------------------------------------------------------------------------------------
  • 也可以执行如下命令查看发布信息
    [26]$ gcadmin showdistribution node

    Distribution ID: 1 | State: new | Total segment num: 6

===========================================================
|  nodes   | 10.168.10.26 | 10.168.10.27 | 10.168.10.28 |
-----------------------------------------------------------
| primary  |      1       |      2       |      3       |
| segments |      4       |      5       |      6       |
-----------------------------------------------------------
|duplicate |      3       |      1       |      2       |
|segments 1|      5       |      6       |      4       |
===========================================================

9、数据库初始化

  • 在管理节点上执行如下命令(数据库root密码默认为空,输入密码处直接回车)
    [26]$ gccli -u root -p
    gbase> initnodedatamap;

至此,安装配置GBase 8a所有操作完毕。
后面可以正常使用

10、创建库表

初始化成功,则整个8a集群安装完毕,可以创建第一个库和表。
gbase> create database test;
gbase>show databases;
gbase>use test;
gbase>create table t(id int ,name varchar(20));
gbase>show tables;

四、集群的卸载

  1. 停止所有节点的所有集群服务,在所有节点执行:
    $ gcluster_services all stop

Stopping GCMonit success!
Stopping gcrecover :                                       [  OK  ]
Stopping gcluster :                                        [  OK  ]
Stopping gbase :                                           [  OK  ]
Stopping syncserver :                                      [  OK  ]
  1. 停止 gcware 服务,在安装了 gcaware 服务的节点上执行:
    $ gcware_services all stop

Stopping GCWareMonit success!
Stopping gcware :                                          [  OK  ]
  1. 在主节点上执行卸载命令
    [26]$ cd /opt/gcinstall
    [26]$ ./unInstall.py --silent=demo.options

五、常见问题

Q01. 集群安装成功后,在管理节点执行 gcadmin,系统提示找不到命令

  • 原因:环境变量没有生效

  • 解决方法:切换操作系统账户
    $ exit
    $ su - gbase

Q02. 在管理节点执行 gcadmin,系统提示

Could not initialize CRM instance error: [122]->[can not connect to any server]
  • 原因:集群 gcware 服务没有启动

  • 解决方法:
    [26]$ gcware_services all start
    [27]$ gcware_services all start
    [28]$ gcware_services all start

Q03 SSH 服务确认22端口被禁止,能安装8a集群吗?

  • 解决方法:

  1. 修改 SSH 配置文件。
    [26]# cd /etc/ssh
    [26]# vi ssh_config
    假设,修改配置文件中“Port”的值为 10022

  2. 重启 SSH 服务:
    [26]#service sshd restart

  3. 查看 SSH 监听端口是否修改为 10022
    [26]# netstat -tunlp | grep ssh

  4. 关闭所有管理节点集群服务
    [26]$ gcluster_services all stop
    [27]$ gcluster_services all stop
    [28]$ gcluster_services all stop

  5. 修改所有管理节点$GCWARE_BASE/config/gcware.conf 中的
    gcware 配置文件的 node_ssh_port: 22

  6. 重启所有管理节点集群服务
    [26]$ gcluster_services all start
    [27]$ gcluster_services all start
    [28]$ gcluster_services all start

Q04. 查看安装8a集群的依赖包列表
$ cat /opt/gcinstall/dependRpms

pcre
krb5-libs
libdb
glibc
keyutils-libs
libidn
libuuid
libgpg-error
libgomp
ncurses-libs
libcom_err
libgcc
nss-softokn-freebl
python-libs
libselinux
libgcrypt
libstdc++

在安装脚本执行过程中,如果系统提示缺少rpm依赖包,需要按照以上rpm列表名,在各节点安装缺少的包。

Q05. 通过 gcadmin 命令发现某 gnode 节点状态是 CLOSE:
【排查】打开故障节点 /opt/gbase/gnode/log/gbase/system.log 发现 express total heap size exceeds memory limit!
【解决】修改数据节点配置文件 /opt/gnode/config/gbase_8a_gbase.cnf
#gbase_memory_pct_target=0.8
#gbase_heap_data=512M
#gbase_heap_temp=256M
#gbase_heap_large=256M
四行全部放开,存盘后,重启该节点所有服务。

Q06. 操作系统重启后,需要手动启动数据库服务:
(1) 在安装了 gcware 服务的节点上执行:
# su - gbase
$ gcware_services all start

Starting gcware :                                          [  OK  ]
Starting GCWareMonit success!

(2) 在集群所有节点上执行:
# su - gbase
$ gcluster_services all start

Starting gcluster :                                        [  OK  ]
Starting gcrecover :                                       [  OK  ]
Starting gbase :                                           [  OK  ]
Starting syncserver :                                      [  OK  ]
Starting GCMonit success!

(3) 查看集群状态:
$ gcadmin

CLUSTER STATE:         ACTIVE

====================================
| GBASE GCWARE CLUSTER INFORMATION |
====================================
| NodeName |  IpAddress   | gcware |
------------------------------------
| gcware1  | 10.168.10.26 |  OPEN  |
------------------------------------
| gcware2  | 10.168.10.27 |  OPEN  |
------------------------------------
| gcware3  | 10.168.10.28 |  OPEN  |
------------------------------------
======================================================
|       GBASE COORDINATOR CLUSTER INFORMATION        |
======================================================
|   NodeName   |  IpAddress   | gcluster | DataState |
------------------------------------------------------
| coordinator1 | 10.168.10.26 |   OPEN   |     0     |
------------------------------------------------------
| coordinator2 | 10.168.10.27 |   OPEN   |     0     |
------------------------------------------------------
| coordinator3 | 10.168.10.28 |   OPEN   |     0     |
------------------------------------------------------
=============================================================
|         GBASE CLUSTER FREE DATA NODE INFORMATION          |
=============================================================
| NodeName  |  IpAddress   | gnode | syncserver | DataState |
-------------------------------------------------------------
| node1 | 10.168.10.26 | OPEN  |    OPEN    |     0     |
-------------------------------------------------------------
| node2 | 10.168.10.27 | OPEN  |    OPEN    |     0     |
-------------------------------------------------------------
| node3 | 10.168.10.28 | OPEN  |    OPEN    |     0     |
-------------------------------------------------------------

评论

登录后才可以发表评论
图片
图片

热门帖子