0. 前言

DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、SQL Server、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。

DataX Web是在DataX之上开发的分布式数据同步工具,提供简单易用的 操作界面,降低用户使用DataX的学习成本,缩短任务配置时间,避免配置过程中出错。用户可通过页面选择数据源即可创建数据同步任务,支持RDBMS、Hive、HBase、ClickHouse、MongoDB等数据源,RDBMS数据源可批量创建数据同步任务,支持实时查看数据同步进度及日志并提供终止同步功能,集成并二次开发xxl-job可根据时间、自增主键增量同步数据。

为了实现两个数据库之间的数据交换,企业级有ODI等,此处尝试DataX做小型数据交换。

1. 安装DataX

下载并解压

wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz
tar -zxvf datax.tar.gz

需删除脚本,否则启动会报错

位置信息错误,您提供的配置文件[datax/plugin/reader/._xxxx/plugin.json]不存在

操作如下:

cd datax/plugin
find ./* -type f -name "._*er"

如果列出了一堆文件,在plugin文件夹下执行rm -rf */._*【谨慎操作,pwd确认目录】
再次查看没有即可。

具体参考官方安装地址:https://github.com/alibaba/DataX/blob/master/userGuid.md

2. 安装DataX-Web

参考:官方教程

方式一:下载官方提供的版本tar版本包 点击下载 提取码:cpsk
备注:目前200兆,如果百度云太慢,可以自行打包,参考二。

方式二:编译打包(官方提供的tar包跳过)
直接从Git上面获得源代码,在项目的根目录下执行如下命令

mvn clean install

执行成功后将会在工程的build目录下生成安装包

build/datax-web-2.1.2.tar.gz

此处下载版本为2.1.2,实际替换为自己的。

3. 部署和配置

1. 解压

tar -zxvf datax-web-2.1.2.tar.gz
cd datax-web-2.1.2

2. 执行一键安装脚本

./bin/install.sh

一路按y同意即可,或者使用

./bin/install.sh --force

3. 数据库初始化

Scan out mysql command, so begin to initalize the database
Do you want to initalize database with sql: [{INSTALL_PATH}/bin/db/datax-web.sql]? (Y/N)y
Please input the db host(default: 127.0.0.1):
Please input the db port(default: 3306):
Please input the db username(default: root):
Please input the db password(default: ):
Please input the db name(default: dataxweb)

需要提前安装mysql数据库,创建用户,指定数据库,比如dataxweb。
这里有大坑,用户密码不能包含@&这类的特殊字符,否则install不成功或者web端登录不上。为了它重新建了用户,密码只包含数字、字母。

mysql: [Warning] Using a password on the command line interface can be insecure.
ERROR 1698 (28000): Access denied for user 'root'@'localhost'

安装成功提示如下:

2022-07-31 21:11:26.118 [INFO] (14858)  ####### Start To Uncompress Packages ######
2022-07-31 21:11:26.119 [INFO] (14858) Uncompressing....
2022-07-31 21:11:26.122 [INFO] (14858)  Uncompress package: [datax-admin_2.1.2_1.tar.gz] to modules directory
2022-07-31 21:11:27.940 [INFO] (14858)  Uncompress package: [datax-executor_2.1.2_1.tar.gz] to modules directory
2022-07-31 21:11:28.225 [INFO] (14858)  ####### Finish To Umcompress Packages ######
Scan modules directory: [/root/datax-web-2.1.2/bin/../modules] to find server under dataxweb
2022-07-31 21:11:28.227 [INFO] (14858)  ####### Start To Install Modules ######
2022-07-31 21:11:28.229 [INFO] (14858) Module servers could be installed:[datax-admin]  [datax-executor]
2022-07-31 21:11:28.231 [INFO] (14858)  Install module server: [datax-admin]
Start to make directory
2022-07-31 21:11:28.242 [INFO] (14894)  Start to build directory
2022-07-31 21:11:28.244 [INFO] (14894) Directory or file: [/root/datax-web-2.1.2/modules/datax-admin/bin/../logs] has been exist
2022-07-31 21:11:28.245 [INFO] (14894) Directory or file: [/root/datax-web-2.1.2/modules/datax-admin/bin/../conf] has been exist
2022-07-31 21:11:28.247 [INFO] (14894) Directory or file: [/root/datax-web-2.1.2/modules/datax-admin/bin/../data] has been exist
end to make directory
Start to initalize database
2022-07-31 21:11:28.252 [INFO] (14894)  Scan out mysql command, so begin to initalize the database
Do you want to initalize database with sql: [/root/datax-web-2.1.2/bin/db/datax_web.sql]? (Y/N)y
Please input the db host(default: 127.0.0.1):
Please input the db port(default: 3306):
Please input the db username(default: root): dataxweb
Please input the db password(default: ): pwd
Please input the db name(default: dataxweb)dataxweb
mysql: [Warning] Using a password on the command line interface can be insecure.
2022-07-31 21:11:55.151 [INFO] (14858)  Install module server: [datax-executor]
2022-07-31 21:11:55.162 [INFO] (14930)  Start to build directory
2022-07-31 21:11:55.163 [INFO] (14930) Directory or file: [/root/datax-web-2.1.2/modules/datax-executor/bin/../logs] has been exist
2022-07-31 21:11:55.165 [INFO] (14930) Directory or file: [/root/datax-web-2.1.2/modules/datax-executor/bin/../conf] has been exist
2022-07-31 21:11:55.167 [INFO] (14930) Directory or file: [/root/datax-web-2.1.2/modules/datax-executor/bin/../data] has been exist
2022-07-31 21:11:55.168 [INFO] (14930) Directory or file: [/root/datax-web-2.1.2/modules/datax-executor/bin/../json] has been exist
2022-07-31 21:11:55.170 [INFO] (14858)  ####### Finish To Install Modules ######

关于数据库的配置,也可以直接在这里修改,修改之后重启服务即可。

vi ./modules/datax-admin/conf/bootstrap.properties

4. 配置Datax位置

vi ./modules/datax-execute/bin/env.properties### 执行datax的python脚本地址
PYTHON_PATH=datax/bin/datax.py

5. 启动服务

# 启动服务
./bin/start-all.sh2022-07-31 21:32:55.807 [INFO] (16253)  Try To Start Modules In Order
2022-07-31 21:32:55.812 [INFO] (16261)  ####### Begin To Start Module: [datax-admin] ######
2022-07-31 21:32:55.817 [INFO] (16269) load environment variables
2022-07-31 21:32:56.016 [INFO] (16269) java
2022-07-31 21:32:56.018 [INFO] (16269) Waiting DATAX-ADMIN to start complete ...
2022-07-31 21:32:56.137 [INFO] (16269) DATAX-ADMIN start success
2022-07-31 21:32:56.142 [INFO] (16476)  ####### Begin To Start Module: [datax-executor] ######
2022-07-31 21:32:56.146 [INFO] (16484) load environment variables
2022-07-31 21:32:56.524 [INFO] (16484) java
2022-07-31 21:32:56.526 [INFO] (16484) Waiting DATAX-EXEXUTOR to start complete ...
2022-07-31 21:32:56.759 [INFO] (16484) DATAX-EXEXUTOR start success
# 结束服务
./bin/stop-all.sh

运行jps查看状态,如果出现DataXAdminApplication和DataXExecutorApplication进程,这表示项目运行成功

jps
18726 Jps
17575 DataXAdminApplication
17851 DataXExecutorApplication

如果项目启动失败,请检查启动日志:modules/datax-admin/bin/console.out或者modules/datax-executor/bin/console.out

4. 访问

浏览器访问 http://ip:9527/index.html
输入用户名 admin 密码 123456 就可以直接访问系统
注意开启防火墙,ufw allow 9542

参考:https://blog.csdn.net/AnameJL/article/details/119760642

Ubuntu下安装Datax-web数据交换平台相关推荐

  1. Ubuntu 下安装thttpd Web服务器

    不知道大家是不是真的需要用appache这么复杂的功能这么强大的web server,其实有很多时候使用webserver也只是一种远程共享访问的方式.这里,Ubuntu repository的提供了 ...

  2. 在ubuntu下安装minigui并搭建开发平台

    安装: 现在 MiniGUI V1.6.10 版本还是按照 GPL 开源协议发布, 1.6.20 以上版本即为商业 版本,不遵循 GPL 协议.对于个人学习,则最好安装 1.6.10 版本.以下为在 ...

  3. 大数据基础学习三:Ubuntu下安装VMware Tools超详细步骤及需要注意的问题(以ubuntu-18.04.3、Mware Workstation 15.1.0 Pro为例)

    大数据基础学习三:Ubuntu下安装VMware Tools超详细步骤及需要注意的问题 (以ubuntu-18.04.3.Mware Workstation 15.1.0 Pro for Window ...

  4. 物理隔离下的数据交换平台难点解析与实践(一)

    目录 第零章.前言:为什么?做什么?怎么做? 第一章.数据交换平台的一些基本概念 目录 第零章.前言:为什么?做什么?怎么做? 最近带队做了公司的一个项目,叫数据交换平台,旨在物理隔离的情况下对多端业 ...

  5. Cpp web(一) Ubuntu下安装使用Crow服务

    文章目录 Ubuntu下安装Crow #1 环境 #2 安装 #2.1 安装Boost #2.2 安装Crow #3 使用 #3.1 Clion Ubuntu下安装Crow #1 环境 C++11 b ...

  6. (13)达梦DMETL数据交换平台技术原理及应用介绍

    在上一篇博客里,我们对达梦DMHS进行了动手部署实践.本篇文章主要是对达梦DMETL数据交换平台系统框架及核心功能组件等技术方面的学习分享. 一.数据实时同步软件(DMETL)简介 达梦数据交换平台( ...

  7. Ubuntu下安装Nginx服务器并进行优化

    一.Nginx介绍   Nginx是由俄罗斯人开发的一款高性能的Web和反向代理服务器,它也可以作为电子邮件的反向代理服务器.其以稳定.并发能力强.占用资源少等显著特点备受广大互联网公司青睐. Ngi ...

  8. (神州优车)数据交换平台架构分享

    一.数据交换平台定义(百度百科) 数据交换平台是指将分散建设的若干应用信息系统进行整合,通过计算机网络构建的信息交换平台,它使若干个应用子系统进行信息/数据的传输及共享,提高信息资源的利用率,成为进行 ...

  9. 协同数据交换平台详细设计方案(word)

    本资料来源公开网络,仅供个人学习,请勿商用,如有侵权请联系删除 1 架构设计 1.1 总体架构 协同数据交换平台利用企业服务总线.数据抽取ETL.消息中间件.大文件传输等相关技术,包括文件适配器.数据 ...

  10. 对于国内数据交换平台的分析

    数据交换平台应当立足于平台自身所提供的基础设施,在国内大部分的交换平台系统错误地把关注的重点放在数据交换平台所支持传输协议之上(如mq,ftp,webservice),系统所支持的传输协议越多,系统抽 ...

最新文章

  1. 《疯狂java讲义》6
  2. DatagridView 常用功能代码
  3. java像sql一样处理数据_像Excel一样使用SQL进行数据分析
  4. 下一代AirPods可能就可以监测你的健康状况了
  5. 页面库无法捕获到Added事件?
  6. 三网物联卡的优缺点有哪些
  7. ibm服务器操作系统重装步骤,ibm服务器安装 操作系统安装步骤
  8. 解决旅游行业营销人员痛点的作品策划
  9. python开发cms_基于Django的Python CMS---wagtail介绍
  10. 再见北理工:忆北京研究生的编程时光
  11. 慧荣SM3271AD芯片U盘量产
  12. syntastic 和 pathogen 安装使用
  13. 目标端的trail文件损坏或误删除,如何重新进行抽取
  14. 3.4利用单臂路由实现vlan间路由
  15. web字体格式及几种在线格式转换工具介绍
  16. 一千年前的李白早就预言360与腾讯之战
  17. 腾讯优图再创世界纪录 列MegaFace海量人脸识别测试榜首
  18. HDU 3723 Delta Wave(卡特兰数+大数)
  19. 计量经济学五个基本假定
  20. Communication-Efficient Learning of Deep Networks from Decentralized Data 论文笔记

热门文章

  1. 油漆算法问题_不同类型的油漆(以及何时使用它们)
  2. @Component与@Configuration区别
  3. python百度地图标注,Python+百度地图实现地址多点标注--用上BMap了
  4. 锐捷客户端解除禁用多网卡设置(包括虚拟机和移动热点)
  5. 大学必考计算机软件cad,大学CAD考试题目「附答案」
  6. 前端之网站结构语义化
  7. Office 2007重新输入序列号激活
  8. LeetCode刷题(python版)——Topic30串联所有单词的子串
  9. 申宝优配-强者恒强还将继续
  10. 数学分析里面的蕴含(⇒)到底是什么意思