DataX3.0使用手册目录一、dataX概述11dataX作用12DataX3.0框架设计23DataX3.0插件体系2二、dataX安装31创建用户组及用户32环境变量配置43安装python4三、dataX使用41生成配置文件模板42配置定时任务73常见问题及处理8四、dataX插件开发及安装81.Reader插件开发82.Writter插件开发93.插件部署10dataX概述dataX作用DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。为了解决异构数据源同步问题,DataX将复杂的网状的同步链路变成了星型数据链路,DataX作为中间传输载体负责连接各种数据源。当需要接入一个新的数据源的时候,只需要将此数据源对接到DataX,便能跟已有的数据源做到无缝数据同步。DataX3.0框架设计DataX本身作为离线数据同步框架,采用Framework + plugin架构构建。将数据源读取和写入抽象成为Reader/Writer插件,纳入到整个同步框架中。Reader:Reader为数据采集模块,负责采集数据源的数据,将数据发送给Framework。Writer: Writer为数据写入模块,负责不断向Framework取数据,并将数据写入到目的端。Framework:Framework用于连接reader和writer,作为两者的数据传输通道,并处理缓冲,流控,并发,数据转换等核心技术问题。DataX3.0插件体系类型数据源Reader(读)Writer(写)RDBMS 关系型数据库MySQL√√?Oracle√√?SQL Server√√?PostgreSQL√√?达梦√√?通用RDBMS(支持所有关系型数据库)√√阿里云数仓数据存储MaxCompute(原ODPS)√√?Analytic DB(原ADS)?√?OSS√√?云数据库Memcache版(原OCS)√√Hive√NoSQL数据存储Table Store(原OTS)√√?Hbase0.94√√?Hbase1.1√√?MongoDB√√无结构化数据存储TxtFile√√JsonFile√?FTP√√?HDFS√√dataX安装创建用户组及用户root@hmaster-hdfs:/home/ubuntu# groupadd dataxroot@hmaster-hdfs:/home/ubuntu# useradd -g datax datax -m -d /home/dataxroot@hmaster-hdfs:/home/ubuntu# passwd dataxEnter new UNIX password: Retype new UNIX password: passwd: password updated successfullyroot@hmaster-hdfs:/home/ubuntu# usermod -G adm -a dataxroot@hmaster-hdfs:/home/ubuntu# su - dataxdatax@hmaster-hdfs:~$ iduid=1004(datax) gid=1000(ubuntu) groups=1000(ubuntu),4(adm),1002(datax)环境变量配置export JAVA_HOME=/usr/java/jdk1.7.0_80export JRE_HOME=${JAVA_HOME}/jreexport CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/libexport PATH=$JAVA_HOME/binexport LANG=zh_CN.UTF-8安装pythondatax@hmaster-hdfs:/home/ubuntu$ pythonPython 2.7.6 (default, Jun 22 2015, 17:58:13) [GCC 4.8.2] on linux2Type "help", "copyright", "credits" or "license" for more information.dataX使用生成配置文件模板命令:bin/python datax.py -r {YOUR_READER} -w {YOUR_WRITER}案例1:mysqlreader-> mysqlwriterdatax@hmaster-hdfs:~/datax3/datax/bin$ python datax.py -r mysqlreader -w mysqlwriterDataX (DATAX-OPENSOURCE-1

datax 模板_dataX3.0安装使用手册.docx相关推荐

  1. l麒麟安装oracle,中标麒麟5.8x64下64bitOracle11gR2安装配置手册.docx

    中标麒麟5.8x64下64bitOracle11gR2安装配置手册.docx 中标麒麟V5.8 X64下64位Oracle 11g 安装配置手册 安装准备 中标麒麟V5.8 x64安装文件 linux ...

  2. GAppProxy-2.0.0安装使用手册¶

    GAppProxy-2.0.0安装使用手册 GAppProxy基于Google App Engine,所以首先需要准备一个google账号(即gmail账号). 申请GAE空间并创建新的的app_id ...

  3. GAppProxy-2.0.0安装使用手册

    GAppProxy-2.0.0安装使用手册 GAppProxy基于Google App Engine,所以首先需要准备一个google账号(即gmail账号). 申请GAE空间并创建新的的app_id ...

  4. datax 高级_Datax3.0使用说明

    一.datax3.0介绍 1.DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL.Oracle等).HDFS.Hive.ODPS.HBase.FTP等各种异构数据源之间稳 ...

  5. hs8546v虚拟服务器端口,移动光猫(hs8546v)语音+上网 安装操作手册.docx

    移动光猫(hs8546v)语音上网安装操作手册 登陆Wed页面请按下面步骤登陆HS8546V的Wed界面.(用户名为:CMCCAdmin,出厂默认密码为:aDm8H%MdA) 步骤1 设置个人计算机的 ...

  6. Dynamic CRM9.0 环境安装部署手册步骤和遇到的一些问题解决方案(包含ADFS部署)

    Dynamic CRM9.0 环境安装部署手册 Dynamic 365和ADFS配置安装过程踩了一些坑,拿出来和大家记录分享一下. 目录 Dynamic CRM9.0 环境安装部署手册 一.Activ ...

  7. Postgresql 12.2 + PostGIS 3.0.1 安装部署手册

    Postgresql 12.2 + PostGIS 3.0.1 安装部署手册 文章目录 Postgresql 12.2 + PostGIS 3.0.1 安装部署手册 环境说明 注意事项 Postgre ...

  8. 南大通用目录服务系统 GBase 8d v6.0 安装手册(Windows 版)

    1. GBase 8d 简介 南大通用目录服务系统GBase 8d v6.0,是天津南开创元目录服务系统的升级版,包括目录服务器GBase 8d v6.0 Server.客户端 GBase 8d v6 ...

  9. Win7操作系统下安装Visual C++6.0详细操作手册(亲验有效)

    Win7操作系统下安装Visual C++6.0详细操作手册(亲验有效) 一.所需软件及下载地址: Visual C++6.0(win7适用版) https://download.csdn.net/d ...

最新文章

  1. 漫画:什么是二叉堆?(修正版)
  2. 在DOS命令行执行MYSQL语句
  3. 【docker系列】docker基本常用命令
  4. PHP之SimpleXML函数
  5. Check Point截获JavaScript文件隐形攻击
  6. Http压力测试工具HttpTest4Net
  7. 终于完成了一个能够绘制的FireFox插件
  8. 导出数据库设计文档的几种方案
  9. centos php ioncube_Linux安装Zend Guard和ioncube
  10. C# 通过126邮箱发送邮件
  11. IOS 微信端 视频自动播放问题解决方法
  12. ble协议栈从零开始七(linklayer 之 privacy)
  13. WS2812B彩灯 STM32HAL库开发:PWM+DMA(stm32f103c8t6)
  14. swift锁屏播放,音乐进度更新,专辑,歌手名显示
  15. postgresql易学堂_起卦方法需要多少克?_最准确的起卦方法
  16. 【SCSS】常用的SCSS语法
  17. 【华为ensp实战案例——路由网络的构建与配置】
  18. 你的奇思妙想不该只是幻想
  19. EXCEL导入商品资料时出错怎么办
  20. 02136Windows及应用【计算机公共基础习题解答】

热门文章

  1. SAP OData服务性能测量的几种工具和手段
  2. Fiori offline support : overrideRefreshHandling and injectRefreshList
  3. SAP Fiori应用里的get org sales target
  4. 修改Hybris Administration console管理员默认登录密码
  5. SAP Material type mapping
  6. Angular multiple binding debug
  7. Java配置文件的使用
  8. IBASE category 03 download
  9. 使用ST05分析IBASE search identical select
  10. ${project.build.directory}