作者:朱超杰

文档编写目的

在前面的文章《如何将CM内嵌PostgreSQL服务迁移至外部PostgreSQL服务》介绍了将CM内嵌的PostgreSQL迁移至外部PostgreSQL,因为CM内嵌的PostgreSQL数据库不支持直接迁移至MySQL。本篇文章Fayson主要介绍如何将集群使用的外部PostgreSQL迁移至MySQL数据库。

注意:不支持直接从Cloudera Manager嵌入式PostgreSQL迁移到MySQL / Oracle数据库。您必须首先从Cloudera Manager嵌入式PostgreSQL数据库服务器迁移到外部PostgreSQL数据库服务器。

只有在成功从嵌入式PostgreSQL数据库服务器迁移到外部PostgreSQL数据库服务器后,才能迁移到外部MySQL或Oracle数据库。

  • 内容概述

1.安装Mariadb服务

2.数据库迁移

3.验证

4.总结

  • 测试环境

1.CM和CDH版本均为5.10.2

2.采用root用户

迁移前集群环境确认

1.CM元数据库类型为postgresql

cat /etc/cloudera-scm-server/db.properties

2.Hue用户及用户组

Hue的数据库类型为PostgreSQL

用户信息

用户组信息

管理员信息

3.Hive数据库及表信息

Hive的数据库类型为PostgreSQL

如下所示,当前hive中有default和test两个数据库;default数据库中有mytest(分区表)和mytest_no_partitions两个表。

查看mytest表的数据

4.Sentry授权信息

Sentry的数据库类型为PostgreSQL

Sentry的授权信息如下

安装MySQL

1.选一台节点安装MariaDB服务

yum -y install mariadb mariadb-server

2.启动mariadb服务并设置为开机自启动

systemctl start mariadbsystemctl enable mariadbsystemctl status mariadb | grep Active

3.初始化MariaDB数据库

/usr/bin/mysql_secure_installation

使用root用户登录查看当前数据库

4.安装MySQL JDBC驱动

将mysql驱动上传至/usr/share/java目录,并以软链接的方式去掉驱动版本号

迁移CM元数据库

1.导出Cloudera Manager配置文件

获取当前支持的API版本

curl -u admin:admin "http://192.168.0.173:7180/api/version"

导出json格式配置文件

curl -u admin:admin "http://192.168.0.173:7180/api/v15/cm/deployment" > /root/cm/cm-deployment.json

2.执行如下命令,保留Cloudera Manager的GUID号

sudo -u postgres psql -qtAX scm -c "select GUID from CM_VERSION" > /etc/cloudera-scm-server/uuid

3.停止集群和Cloudera Management Service服务

4.在CM节点上执行如下命令停止cloudera-scm-server服务

systemctl stop cloudera-scm-serversystemctl status cloudera-scm-server | grep Active

5.登录MySQL执行如下SQL语句创建scm数据库及用户并授权

create database scm default character set utf8;CREATE USER 'scm'@'%' IDENTIFIED BY 'password';GRANT ALL PRIVILEGES ON scm.* TO 'scm'@'%';FLUSH PRIVILEGES;

执行如下命令,初始化Cloudera Manager数据库配置

/usr/share/cmf/schema/scm_prepare_database.sh mysql scm scm password

6.清空所有节点的/var/run/cloudera-scm-agent/process/目录

a.使用批量命令,停止集群所有节点的agent和supervisor服务

batch_cmd.sh node.list " service cloudera-scm-agent next_stop_hard"batch_cmd.sh node.list "service cloudera-scm-agent stop"

查看进程是否已被停止

ps -ef | grep cmf-agentps -ef | grep supervisord

b.使用批量命令,使用mv命令将集群所有节点的agent目录备份

batch_cmd.sh node.list "mv /var/run/cloudera-scm-agent /var/run/cloudera-scm-agent-BU"

batch_cmd.sh node.list "ls /var/run | grep cloudera-scm-agent*"

使用批量命令,启动集群所有节点的cloudera-scm-agent服务

batch_cmd.sh node.list "systemctl start cloudera-scm-agent"batch_cmd.sh node.list "systemctl status cloudera-scm-agent | grep Active"

7.启动Cloudera Manager Server

systemctl start cloudera-scm-servernetstat -lnpt | grep 7180

使用超级管理员用户登录CM

接收许可条款,【继续】

如果有许可证,上传许可证,没有许可证选择企业试用版,【继续】

注意:必须要上传许可证或者选择试用版继续之后再返回主页,否则会导致使用curl导入集群配置时失败。

单击左上角返回CM主页

当前CM主页状态如下:

8.执行如下命令调用CM API接口,恢复Cloudera Manager配置

curl -H "Content-Type: application/json" --upload-file /root/cm/cm-deployment.json -u admin:admin "http://192.168.0.173:7180/api/v15/cm/deployment?deleteCurrentDeployment=true"

再次查看CM主页,CM配置已导入成功

9.启动服务

启动Cloudera Mangement Service

Cloudera Management Service启动成功后,等待parcel分发完成,然后启动集群服务并分发客户端配置。

查看集群CM元数据库使用的数据库服务器,如下所示,此时已迁移至MySQL

cat /etc/cloudera-scm-server/db.properties

迁移集群其他服务元数据库

此时只有CM的数据库scm迁移到了MySQL,集群其他服务的元数据库(Hive、Sentry、Hue、Oozie等)任然配置的为PostgreSQL,接下来主要介绍通过使用工具将PostgreSQL数据库迁移至MySQL数据库,如下示例以迁移Hive元数据库为例。

1.下载安装数据库转换工具 DBConvert for MySQL & PostgreSQL,下载地址如下:

https://dbconvert.com/downloads/dbconvert_mysql_postgresql.zip

下载完成之后解压,执行dbconvert_mysql_postgresql文件夹下的setup.exe进行安装

2.安装完成后打开该软件,选择【Try】使用版

3.这里以hive元数据库转换为例,配置PostgreSQL数据库连接信息

测试连接成功,单击下一步

此时会显示数据库中的所有表,全部勾选;然后单击【OK】

配置目标数据库连接信息(即我们要迁移的MySQL信息)

测试连接成功后单击【Next】

自定义要转换的表,然后单击【Next】

单击【commit】开始进行转换

转换成功后显示如下

然后依次转换其他数据库即可

注意:转换hue数据库时,有些表因为外键的原因不能被转换,根据提示取消相关外键即可

4.数据库迁移完成后,登录mysql查看数据库如下:

创建用户并授予数据库上的权限

CREATE USER 'hive'@'%' IDENTIFIED BY 'password';GRANT ALL PRIVILEGES ON hive.* TO 'hive'@'%';FLUSH PRIVILEGES;CREATE USER 'sentry'@'%' IDENTIFIED BY 'password';   GRANT ALL PRIVILEGES ON sentry. * TO 'sentry'@'%';   FLUSH PRIVILEGES;CREATE USER 'rman'@'%' IDENTIFIED BY 'password';   GRANT ALL PRIVILEGES ON rman. * TO 'rman'@'%';   FLUSH PRIVILEGES;CREATE USER 'hue'@'%' IDENTIFIED BY 'password';   GRANT ALL PRIVILEGES ON hue. * TO 'hue'@'%';   FLUSH PRIVILEGES;CREATE USER 'oozie'@'%' IDENTIFIED BY 'password';   GRANT ALL PRIVILEGES ON oozie. * TO 'oozie'@'%';   FLUSH PRIVILEGES;

更换数据库服务器

5.进入Hive配置页面,修改Hive的Metastore数据库类型为MySQL,然后修改其在 MySQL中的数据库名称

6.完成上述修改后,然后回到CM主页,根据提示重启相关服务

服务重启完成后,此时数据库已迁移至MySQL数据库服务器。

迁移后验证

6.1 Hue验证

1.查看Hue当前数据库类型为MySQL

2.使用管理员账号hive登录Hue验证数据是否完整

hive用户的管理员权限与迁移前一致

迁移后的用户信息与迁移前数据一致

用户组信息与迁移前信息一致

6.2 Hive验证

1.查看Hive当前数据库类型为MySQL

2.通过Hue查看Hive数据库以及表信息如下:

3.查看mytest表数据如下:

查看mytest表结构如下:

由上图可知,数据库迁移完成后Hive的数据库、表、表结构以及表数据均迁移成功。

6.3 Sentry验证

1.查看Sentry当前数据库类型为MySQL

2.通过Hue查看Sentry的授权信息如下:

3.使用hive用户进行建表测试

建表成功

向表中插入数据,数据插入成功

执行查询操作,查询成功

4.使用ldapuser1用户登录Hue,进行建表测试

建表失败,报错如下:

Error while compiling statement: FAILED: SemanticException No valid privileges User ldapuser1 does not have privileges for SWITCHDATABASE The required privileges: Server=server1->Db=*->Table=+->Column=*->action=select;Server=server1->Db=*->Table=+->Column=*->action=insert;

执行数据插入操作,操作失败,报错如下:

Error while compiling statement: FAILED: SemanticException No valid privileges User ldapuser1 does not have privileges for SWITCHDATABASE The required privileges: Server=server1->Db=*->Table=+->Column=*->action=select;Server=server1->Db=*->Table=+->Column=*->action=insert;

执行查询操作,操作失败,报错如下:

Error while compiling statement: FAILED: SemanticException No valid privileges User ldapuser1 does not have privileges for SWITCHDATABASE The required privileges: Server=server1->Db=*->Table=+->Column=*->action=select;Server=server1->Db=*->Table=+->Column=*->action=insert;

由上可知,sentry数据库迁移后,授权信息也迁移成功。

总结

1.将Cloudera Manager服务使用的PostgreSQL迁移至MySQL时,主要通过CM API接口导出集群配置信息json文件,再通过CM API接口导入完成数据库的迁移。

2.集群其它服务(Hive、Sentry、Oozie、Hue等)在迁移时并未相应的API接口实现,主要是通过DBConvert for MySQL & PostgreSQL工具将PostgreSQL数据的数据转换为MySQL数据库的方式解决。

3.在进行Hue数据库转换的过程中由于部分表外键的问题,导致转换失败,需要将报错的外键取消勾选。

4.Oozie服务重启失败,报错如下:

Caused by: com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Table 'oozie.VALIDATE_CONN' doesn't exist

解决方式:为oozie服务创建数据库

将数据导入到mysql_06955.10.2如何将CM的外部PostgreSQL数据库迁移至MySQL服务相关推荐

  1. ef 数据迁移mysql_07116.3.0如何将CM的外部PostgreSQL数据库迁移至MySQL服务

    文档编写目的 在前面的文章<6.3.0-如何将CM内嵌PostgreSQL服务迁移至外部PostgreSQL服务>介绍了将CM内嵌的PostgreSQL迁移至外部PostgreSQL,因为 ...

  2. mysql 修复数据表 批量_MySQL数据库迁移与MySQL数据库批量恢复

    一.MySQL数据库迁移或备份 将相关数据库数据文件直接迁移方式 1. 了解使用InnoDB引擎创建数据库所产生的文件 使用MySQL InnoDB引擎所产生的文件(三个文件都很重要) .ibd:包含 ...

  3. 【StarRocks】StarRocks系统架构和数据导入

    目录 一 系统架构图 1 FE Leader Follower Observer 2 BE 3 数据存储 3 建表语句 4 导入数据 ```Broker Load``` ```Spark Load`` ...

  4. 数据导入时遭遇 ORA-01187 ORA-01110

    最近的数据导入(IMP)时碰到了ORA-01187 ORA-01110 错误,由于这个数据库是使用热备恢复过来的,且恢复也是成功的,因为数据库能够成功open,那到底是哪里有遗漏呢?如你有类似的问题, ...

  5. ClickHouse数据导入(Flink、Spark、Kafka、MySQL、Hive)

    本文分享主要是ClickHouse的数据导入方式,本文主要介绍如何使用Flink.Spark.Kafka.MySQL.Hive将数据导入ClickHouse,具体内容包括: 使用Flink导入数据 使 ...

  6. PostgreSQL数据库导入EXCEL数据表

    气象监测数据下载(可下载最新及每日气象数据) NOAA气象日监测数据均值计算python代码整理 PostgreSQL数据库导入EXCEL数据表 PG数据库版本为10.14.1. 首先,需要在PG数据 ...

  7. GBase 8a 数据导入导出

    目录 表结构导出工具gcdump 数据导出 数据导入 表结构导出工具gcdump -A, --all-databases 导出所有用户数据库结构 -u, --user=name 连接数据库的数据库用户 ...

  8. mysql数据库快速传输方案_MySQL数据库迁移快速导出导入大量数据

    数据库迁移是我们经常可遇到的问题,对于少量的数据,迁移基本上不会有什么问题.生产环境中,有以下情况需要做迁移工作: 磁盘空间不够.比如一些老项目,选用的机型并不一定适用于数据库.随着时间的推移,硬盘很 ...

  9. 数据库实验一 数据库定义及数据导入

    1.实验目的 理解和掌握数据库 DDL 语言,能够熟练使用 SQL DDL 语句,并能够完成数据导入. 2.实验内容和要求 理解和掌握 SQL DDL 语句的语法,特别是各种参数的具体含义和使用方法: ...

最新文章

  1. 重置表单验证 清除表单校验信息
  2. android 调用java webservice_android通过ksoap2调用java写的CXF 的webservice
  3. 计算机网络——HTTP协议和Web
  4. NPM useful library path: request.js
  5. linux之tar命令使用总结
  6. viewDidLoad等相关函数调用
  7. wampserver php扩展openssl 不可用_PHP基础及WAMP集成基础
  8. IoT -- (六) MQTT和CoAP对比分析
  9. VMware虚拟机安装Linux系统(详解版)
  10. ubuntu 14.04 root破解
  11. 从零开始搭建Vue开发环境(windows)
  12. EasyDarwin流媒体云平台:EasyCamera开源摄像机接入海康威视摄像机实时视频
  13. 如何修改域名DNS服务器?修改DNS服务器常见问题汇总
  14. 云盘行业的“冰与火”
  15. idea常用的一些配置信息
  16. Laravel数据库之Seeding
  17. Opencv -- 18图像像素类型转换与归一化
  18. 使用python实现固定效应模型
  19. ​用寄存器HAL库完成LED流水灯程序
  20. android 沉浸式开源库,Android沉浸式状态栏

热门文章

  1. SDN架构的本质属性—Vecloud
  2. 使用aotupep8自动批量调整代码以符合PEP-8规范
  3. 关于权限五张表的独到见解
  4. SphereFace的原理
  5. This Gradle plugin requires Studio 3.0 minimum
  6. 窗体添加阴影效果如此简单
  7. 转代码判断邮箱是否合法
  8. Python的pycurl库升级升级失败的解决方法
  9. 到2020年,将有60%的工作被人工智能取代?
  10. 从GBIP到PXI 的发展简史