官方Hello入门例子{ "job": { "content": [ { "reader": { "name": "streamreader", "parameter": { "sliceRecordCount": 10, "column": [ { "type": "long", "value": "10" }, { "type": "string", "value": "hello,你好,世界-DataX" } ] } }, "writer": { "name": "streamwriter", "parameter": { "encoding": "UTF-8", "print": true } } } ], "setting": { "speed": { "channel": 5 } } } }

运行命令:

java调用datax 参考:ublic class TestDatax { public static void main(String[] args) { try { WebLogs.info("start"); String windowcmd = "cmd /c python datax.py D:\\Software\\install\\Environment\\DataX\\datax\\job\\mysql2mysql.json"; WebLogs.info(windowcmd); //.exec("你的命令",null,new File("datax安装路径")); Process pr = Runtime.getRuntime().exec(windowcmd,null,new File("D:\\Software\\install\\Environment\\DataX\\datax\\bin")); BufferedReader in = new BufferedReader(new InputStreamReader(pr.getInputStream())); String line = null; while ((line = in.readLine()) != null) { WebLogs.info(line); } in.close(); pr.waitFor(); WebLogs.info("end"); } catch (Exception e) { e.printStackTrace(); } } }

网上一个mysql2mysql的例子{ "job": { "content": [ { "reader": { "name": "mysqlreader", "parameter": { "column": [ "id", "name" ], "connection": [ { "jdbcUrl": ["jdbc:mysql://127.0.0.1:3306/dq"], "table": ["table1"] } ], "password": "123456", "username": "root" } }, "writer": { "name": "mysqlwriter", "parameter": { "column": [ "id", "name" ], "connection": [ { "jdbcUrl": "jdbc:mysql://ip地址:端口/test", "table": ["table2"] } ], "password": "123456", "username": "root" } } } ], "setting": { "speed": { "channel": "1" } } } }

mysql到本地:{ "job": { "content": [ { "reader": { "name": "mysqlreader", "parameter": { "username": "root", "password": "root", "column": ["ID","VISIT_IP"], "connection": [ { "table": [ "visit_log" ], "jdbcUrl": [ "jdbc:mysql://192.168.0.197:3306/qyyx_test" ] } ] } }, "writer": { "name": "streamwriter", "parameter": { "print": false, "encoding": "UTF-8" } } } ] } }

本地方件到本地文件:{ "setting": {}, "job": { "setting": { "speed": { "channel": 2 } }, "content": [ { "reader": { "name": "txtfilereader", "parameter": { "path": ["/home/haiwei.luo/case00/data"], "encoding": "UTF-8", "column": ["*"], "fieldDelimiter": "," } }, "writer": { "name": "txtfilewriter", "parameter": { "path": "/home/haiwei.luo/case00/result", "fileName": "luohw", "writeMode": "truncate", "format": "yyyy-MM-dd" } } } ] } }HDFS打印到本地控制台

{ "job": { "setting": { "speed": { "channel": 3 } }, "content": [ { "reader": { "name": "hdfsreader", "parameter": { "path": "/user/hive/warehouse/test.db/nnn/*", "defaultFS": "hdfs://192.168.200.45:8020", "column": ["*"], "fileType": "orc", "encoding": "UTF-8", "fieldDelimiter": "," } }, "writer": { "name": "streamwriter", "parameter": { "print": true } } } ] } }oracle到本地文件{ "job": { "content": [ { "reader": { "name": "mysqlreader", "parameter": { "username": "root", "password": "root", "column": ["ID","VISIT_IP","BEF_URL","NOW_URL","CORP_CODE","PROMOTE_NO","PLATFORM","COOKIE_EANBLED","USER_AGENT","APP_VERSION","APP_NAME","COLOR","SCREEN","JAVA_ENABLED","JS_VERSION","SID","CREATE_BY","CREATE_TIME","MODIFY_BY","MODIFY_TIME"], "connection": [ { "table": [ "visit_log" ], "jdbcUrl": [ "jdbc:mysql://192.168.0.197:3306/qyyx_test" ] } ] } }, "writer": { "name": "txtfilewriter", "parameter": { "path": "/opt/result/", "fileName": "shun", "writeMode": "truncate", "format": "yyyy-MM-dd" } } } ], "setting": { "speed": { "channel": 10 } } } }

本地文件到HDFS

orcle打印到Linux

{ "job": { "setting": { "speed": { "channel": 5 } }, "content": [ { "reader": { "name": "oraclereader", "parameter": { "username": "edw_src", "password": "123456", "where": "", "connection": [ { "querySql": [ "select * from ORDER_DETAIL_BAK" ], "jdbcUrl": [ "jdbc:oracle:thin:@192.168.0.197:1521:orcl" ] } ] } }, "writer": { "name": "streamwriter", "parameter": { "visible": true, "encoding": "UTF-8" } } } ] } }

oracle到HDFS

oracle到本地文件

{ "job": { "setting": { "speed": { "channel": 200 } }, "content": [ { "reader": { "name": "oraclereader", "parameter": { "username": "edw_src", "password": "123456", "where": "", "connection": [ { "querySql": [ "select * from ORDER_DETAIL_BAK" ], "jdbcUrl": [ "jdbc:oracle:thin:@192.168.0.197:1521:orcl" ] } ] } }, "writer": { "name": "txtfilewriter", "parameter": { "path": "/opt/result/", "fileName": "shun", "writeMode": "truncate", "format": "yyyy-MM-dd" } } } ] } }

datax 持续数据同步_Datax 数据同步相关推荐

  1. datax 持续数据同步_DataX数据同步

    因为选择了ElasticSearch做全文检索,需要把数据从数据库同步到es,此处选择开源方案DataX作为数据同步工具. 官方文档很详细,可以直接参考. DataXDataX 是一个异构数据源离线同 ...

  2. datax 持续数据同步_采用DataX实现多表增量数据同步

    这两天验证了一下阿里的DataX数据同步工具,觉得DataX可以用来做管理数据的多级数据同步.DataX用来做批量数据迁移很适合,能够保证数据的一致性,性能也很好,结合时间戳字段,用来实现数据定时增量 ...

  3. 使用datax同步cassandra数据

    DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现各种异构数据源之间高效的数据同步功能.最近,阿里云cassandra团队为datax提供了cassandra读写插件,进一步丰富了d ...

  4. 大数据开发平台-数据同步服务

    什么是数据同步服务?顾名思义,就是在不同的系统之间同步数据.根据具体业务目的和应用场景的不同,各种数据同步服务框架的功能侧重点往往不尽相同,因而大家也会用各种大同小异的名称来称呼这类服务,比如数据传输 ...

  5. BTC 复制节点(节点复制)复制区块数据,实现快速同步区块数据

    背景:btc全节点的数据量是非常庞大的,为了加快同步区块数据的效率,我们有两种方式:1.搭建轻节点,2.复制已有节点的区块数据 需求:已有一个完整的BTC全节点,通过复制区块数据.达到快速搭建一个BT ...

  6. 大数据时代,数据实时同步解决方案的思考—最全的数据同步总结

    1. 早期关系型数据库之间的数据同步 1).全量同步 比如从oracle数据库中同步一张表的数据到Mysql中,通常的做法就是 分页查询源端的表,然后通过 jdbc的batch 方式插入到目标表,这个 ...

  7. 企业级数据仓库:数据仓库概述;核心技术框架,数仓理论,数据通道Hive技术框架,HBase设计,系统调度,关系模式范式,ER图,维度建模,星型/雪花/星座模式,数据采集同步,业务数据埋点,数据仓库规范

    文章目录 第一章 数据仓库概述 1.1 数据仓库简介 1.1.2 什么是数据仓库? 1.1.3 OLTP 与 OLAP 1.2 数据仓库技术架构 1.3 课程目标 第二章 核心技术框架 2.1 数据仓 ...

  8. 【Redis】Redis主从同步中数据同步原理

    [Redis]Redis主从同步中数据同步原理 文章目录 [Redis]Redis主从同步中数据同步原理 1. 全量同步 1.1 判断是否第一次数据同步 2. 增量同步 3. 优化Redis主从集群 ...

  9. 大数据任务调度和数据同步组件初探

    本文个人博客地址 本文公众号地址 背景 数据从最原始的状态,可能是一个 excel,一个文本,或者是来自业务数据库的数据,格式各种各样,落地到数据仓库.数据湖中,数据的同步过程 是必不可少的 图片来源 ...

最新文章

  1. 华为云部署html网页,手把手教你如何在华为云服务器上部署一个自己的弹幕网站!...
  2. 嵌入式C语言基础(二)
  3. java udp 线程,Java中的UDP DatagramSocket线程的高CPU使用率
  4. c语言连续生成不同随机数_【转】关于C语言生成不重复的随机数
  5. Skype 8.34 Windows7-64bit Ubuntu 16.04安装试验
  6. CF 581A Vasya the Hipster
  7. 408计算机组成原理学习笔记——存储系统
  8. 一只青蛙一次可以跳上1级台阶,也可以跳上2级,也可以跳n级。求该青蛙跳上一个n级的台阶总共有多少种跳法(先后次序不同算不同的结果)
  9. 程序员找媳妇的要求是什么呢?
  10. 仙道经、清心诀、静心决、冰心诀、定心心经
  11. 在线文档协作进行项目管理
  12. 阿里云服务器如何购买?三种购买方式图文教程
  13. 分布式认知工业互联网赋能工业企业数字化转型
  14. Windows 更新:服务堆栈更新
  15. Web前端开发技术:Vue开发基础(2)
  16. 成都发布BIM计价参考依据,明确BIM服务费计算方式——筑智建
  17. FreeEIM(飞鸽传书)应用虚拟化系统
  18. Python Journey - Day4 - 字符串string
  19. 2.2.7 Web自动化验证码处理
  20. Linux 1. 奇怪符号 ^@

热门文章

  1. Pytorch学习记录-torchtext和Pytorch的实例( 使用神经网络训练Seq2Seq代码)
  2. TVM apps extension示例扩展库
  3. 2021年大数据ELK(二十五):添加Elasticsearch数据源
  4. CentOS7下安装nvm
  5. Java:全局变量(成员变量)与局部变量
  6. CentOS的el5, el6, el7代表什么
  7. js 404页面跳转
  8. python之接口开发
  9. react-navigation
  10. 2022-2028年中国版权行业深度调研及投资前景预测报告