随着业务量增加,原采用的mysql 对大量业务数据的处理效率降低,公司采购的ODPS(MaxCompute) 阿里数据处理平台,进行数据的处理。

一、源数据库 -> ODPS

全量同步,直接同步即可,这里主要介绍下增量过程,分为以下三步。

// 第一步、覆盖基表 插入非 变更/新增 的数据
INSERT OVERWRITE table tb_order_summary_odps
select * from middle_tb_order_summary_odps
where id not in (select id from trans_tb_order_summary_odps);// 第二步、插入基表 插入 变更/新增 的数据
insert into tb_order_summary_odps
select * from trans_tb_order_summary_odps;// 第三步、插入中间表,基表数据覆盖插入中间表
insert OVERWRITE table middle_tb_order_summary_odps
select * from tb_order_summary_odps;
二、ODPS -> 源数据库

手动全量数据同步
基本思想:将指定时间之前的数据与昨天数据汇总,作为最新的数据集,${bizdate} 获取指定日期。

INSERT OVERWRITE TABLE tb_order_summary
SELECT  *
FROM    tb_order_summary
WHERE   business_date > ${bizdate}
UNION ALL
SELECT *
from tb_order
WHERE
created_time <= ${bizdate}

定时增量同步前一天数据
基本思想:将昨天之前数据与昨天数据汇总,作为最新的数据集,运用 ${bdp.system.bizdate} 动态获取昨天。

INSERT OVERWRITE TABLE tb_order_summary
SELECT  *
FROM    tb_order_summary
WHERE   business_date != ${bdp.system.bizdate}
UNION ALL
SELECT *
FROM tb_order
WHERE
created_time = ${bdp.system.bizdate}

ODPS 数据全量/增量同步方案相关推荐

  1. solr mysql增量导入_10.Solr4.10.3数据导入(DIH全量增量同步Mysql数据)

    1.创建MySQL数据 create databasesolr;usesolr;DROP TABLE IF EXISTSstudent;CREATE TABLEstudent ( idchar(10) ...

  2. mongodb监听oplog 全量+增量同步

    一.前言 前一个项目中,涉及到了一次数据迁移,这次迁移需要从mongodb迁移到另一个mongodb实例上,两个源的数据结构是不一样的.涉及到增量和全量数据迁移,整体迁移数据量在5亿左右.本篇即讲理论 ...

  3. 利用Canal全量/增量同步mysql数据至ES

    Canal同步mysql数据至ES 1.更改Mysql配置 1.1 开启 Binlog 写入功能 配置 binlog-format 为 ROW 模式,配置my.cnf [mysqld] log-bin ...

  4. “全量增量” 与 “增量同步” 一文了解清楚【建议收藏】

    大家在同步数据的时候都会接触到2个名词,"全量增量" 与 "增量同步" ,名字都长得差不多,但是意思和操作却不一样:比如部门领导给你方案,那我们要如何去选择其中 ...

  5. mysqldump备份(全量+增量)

    在日常运维工作中,对mysql数据库的备份是万分重要的,以防在数据库表丢失或损坏情况出现,可以及时恢复数据. 线上数据库备份场景: 每周日执行一次全量备份,然后每天下午1点执行MySQLdump增量备 ...

  6. Elasticsearch和MySQL数据同步(logstash-input-jdbc)全量增量方式同步近千万数据

    同步方案: 同步读写:最为简单的方式在将数据写到mysql时,同时将数据写到ES,实现数据的双写. 异步双写(MQ方式):MQ的性能基本比mysql高出一个数量级,所以性能可以得到显著的提高. 定时器 ...

  7. 基于Solr DIH实现MySQL表数据全量索引和增量索引

    实现MySQL表数据全量索引和增量索引,基于Solr DIH组件实现起来比较简单,只需要重复使用Solr的DIH(Data Import Handler)组件,对data-config.xml进行简单 ...

  8. solr mysql 增量索引_基于Solr DIH实现MySQL表数据全量索引和增量索引

    实现MySQL表数据全量索引和增量索引,基于Solr DIH组件实现起来比较简单,只需要重复使用Solr的DIH(Data Import Handler)组件,对data-config.xml进行简单 ...

  9. 数据全量、增量、比较更新

    [实验目的] 1.利用Kettle的"表输入","表输入出","JavaScript代码"组件,实现数据全量更新. 2.熟练掌握" ...

最新文章

  1. 最新自然语言处理领域顶会论文大合集!
  2. 10 Lessons Learned Doing ICOs
  3. 实例教程二:短信发送器
  4. mysql8.0.15调优_Mysql 8.0 参数调优
  5. 【谈谈IO】BIO、NIO和AIO
  6. Eclipse相关快捷键
  7. 孤独终老和勉强结婚,你会选什么?
  8. 仓库对象DataSet与小车对象DataAdapter的 关键命令 1201
  9. JQuery学习笔记(1)
  10. java check word lock_Java多线程-新特征-锁(下)
  11. Android注解编程的第一步---模仿ButterKnife的ViewBinder机制
  12. C#版 Tag云图控件
  13. 论文笔记_S2D.06-2018-BMVC-用于实时语义分割的轻量级精细网络RefineNet
  14. 代码片段---重定向
  15. MyBatis数据库链接池源码分析
  16. 利用 LSTM 神经网络预测股价走势
  17. 如何才能把qlv格式转换成mp4格式
  18. 大白菜 装系统 win7
  19. 单面机51小车程序_4千元牛排机实测!小白也能做出星级牛排,在家吃出法式餐厅感觉...
  20. html怎么自动导入数据并排序,jQuery html表格排序插件:tablesorter

热门文章

  1. 什么才是真正的股权激励
  2. zabbix监控配置过程图解
  3. 安卓搜不到airpods_在安卓手机上找回使用 AirPods 的最佳体验:AndPods | App+1
  4. 全球与中国肥料用着色剂市场深度研究分析报告
  5. Python调用AutoCAD步骤及出错问题总结
  6. 聊天机器人微信表情个性化 回复 部分示例
  7. SqlConnection类和SqlCommand类
  8. 收益提高10倍,如何下载无水印视频?5分钟教你一键操作
  9. NOIP2010提高组题解
  10. Linux拷贝文件到当前目录的所有子文件夹中