可以使用percona-toolkit包中的pt-archiver工具来进行历史数据归档

pt-archiver使用的场景:

1、清理线上过期数据。

2、清理过期数据,并把数据归档到本地归档表中,或者远端归档服务器。

3、两张表之间的数据不完全相同,希望合并。此时加上–ignore或–replace选项,可以轻松实现。

4、导出线上数据,到线下数据作处理。

例子:

pt-archiver --source h=127.0.0.1,P=3306,D=database,t=table,u=root,p=123456 --dest h=127.0.0.1,P=3306,D=database,t=new_table,u=root,p=123456 --no-check-charset --where 'id>100' --progress 1000 --no-delete --limit=1000 --statistics

参数说明:

--statistics:结束的时候给出统计信息:开始的时间点,结束的时间点,查询的行数,归档的行数,删除的行数,以及各个阶段消耗的总的时间和比例,便于以此进行优化。
--where:给出表中要处理的数据的查询条件。
--progress:每处理progress指定的行数后,就打印一次信息。
--no-delete:表示不删除原来的数据,注意:如果不指定此参数,所有处理完成后,都会清理原表中的数据。
--limit:表示每次事务删除多少条数据,默认1条(注意:如果数据比较多时,也可以设置大一些,减少循环次数)。
--txn-size:每个事务提交的数据行数(包括读写操作),批量提交,增加该值可以提升归档性能。
--file:数据存放的文件,最好指定绝对路径,文件名可以灵活地组合(另外,我测试过写文件与不写文件速度几乎差不多,原本以为不写文件速度会快)。
--charset=UTF8 指定字符集为UTF8
--no-check-charset 不指定字符集
--bulk-delete 批量删除source上的旧数据(例如每次1000行的批量删除操作)
--bulk-insert 批量插入数据到dest主机 (看dest的general log发现它是通过在dest主机上LOAD DATA LOCAL INFILE插入数据的)
--replace 将insert into 语句改成replace写入到dest库
--sleep120 每次归档了limit个行记录后的休眠120秒(单位为秒)
--local 不把optimize或analyze操作写入到binlog里面(防止造成主从延迟巨大)
--retries 超时或者出现死锁的话,pt-archiver进行重试的间隔(默认1s)
--no-version-check 目前为止,发现部分pt工具对阿里云RDS操作必须加这个参数
--analyze=ds 操作结束后,优化表空间(d表示dest,s表示source)
--purge 删除source数据库的相关匹配记录,不归档删除数据

参考:http://www.ywnds.com/?p=8379 ,http://www.mamicode.com/info-detail-1903758.html

转载于:https://www.cnblogs.com/wsl222000/p/9025216.html

pt-archiver数据归档相关推荐

  1. 用NSKeyedArchiver存储数据(归档)

    用NSKeyedArchiver存储数据(归档) 一.NSKeyedArchiver和NSUserDefault的区别 NSUserDefault只能存储基本数据类型,如NSInteger NSStr ...

  2. sqlserver大数据归档

    昨天做了个日常大数据归档,归档700W数据,表字段130左右,字段比较多,分享下! ----先禁用表的index 1.先获取需要禁用的索引 declare @tname varchar(100) se ...

  3. pt-archiver 数据归档bug

    2019独角兽企业重金招聘Python工程师标准>>> 前言:今天在进行线上数据库数据归档的时候发现个问题,ID最大的那一列数据没有归档到其他实例,下面是现场及解决办法 现场: ro ...

  4. oracle 11g Flashback Data Archive(闪回数据归档)

    Flashback Data Archive(闪回数据归档) UNDO表空间记录的回滚信息虽然可以提供回闪查询,但时间久了,这些信息会被覆盖掉,其实只要事务一提交,他们就变成可覆盖的对象了,所以经常在 ...

  5. oracle 12c创建归档,oracle 12c 数据归档 即Using In-Database Archiving feature

    在oracle 12c 通过Using In-Database Archiving feature 特性,来启到分离在线数据和历史数据的作用, 即数据归档,应用可以有选择性的访问在线数据或者历史数据, ...

  6. 大数据归档-冷热数据分离

    1. 什么是TokuDB? TokuDB 是一个支持事务的"新"引擎,有着出色的数据压缩功能,由美国 TokuTek 公司(现在已经被 Percona 公司收购)研发.拥有出色的数 ...

  7. 数据治理-数据生命周期管理-大数据归档与销毁

    数据归档 在大数据时代,存储成本显著降低的情况,企业希望在技术方案的能力范围之内尽量存储更多的数据.但大数据时代同样带来了数据的急剧增长,因此数据归档仍然是数据管理必须考虑的问题.与传统的数据备份和数 ...

  8. ArcGIS版本高级应用 数据归档(历史归档 存档数据)

    QQ交流群:607330463 GIS开发技术最强交流群   未经允许 禁止转载  可以参考 目录 1地理数据库 (Geodatabase) 存档 2启用存档 3存档过程 4使用历史版本 5使用历史标 ...

  9. 那些年跟领导聊过的数据归档【DB篇】:从梳理到落地-DB单表千万级归档详细流程讲解

    文章目录 知人论世 执笔蓝图 V1 - 浅尝辄止 V2 - 初窥门镜 V3 - 木已成舟 躬行方案 安内 攘外 卓有成效 沉淀之石 道阻且长 知人论世 无论何种需求的出现都是因为某种迫切解决的问题契机 ...

  10. 数据归档,存储的完美储备军

    数据爆炸性增长的同时,存储成为了大家首要担心的问题 大家都希望自家数据保存20年.50年后仍完好无损 但是,N年后的数据量已达到一个无法预测的峰值 如此大量的数据在保存时极可能存在丢失.损坏等问题 这 ...

最新文章

  1. linux查找以h结尾的文件,【linux_笔记】Linux_文件查找(find)详解特殊权限
  2. Django models Form model_form 关系及区别
  3. linux虚拟网络设备--内核网桥的实现分析(六)
  4. 网页css样式中英对照,css中文样式(含中英文对照表).doc
  5. ASP.NET Core on K8S深入学习(1)K8S基础知识与集群搭建
  6. [2021.07.25更新]循环冗余校验(CRC)的MATLAB实现
  7. 交流电的有效值rms值_【电工基础知识:三、正弦交流电的产生】2正弦交流电的三要素...
  8. selenium元素等待及滚动条滚动
  9. 《数学之美》—PageRank
  10. 放大你的Rstudio窗口字体
  11. 过程FMEA(PFMEA)步骤一:策划与准备
  12. Kaggle——TMDB 5000 Movie Dataset电影数据分析
  13. 小米青春版路由器解锁root与SSH方法
  14. Linux 虚拟网卡技术:Macvlan
  15. 三年级江苏凤凰出版社计算机,苏教版小学信息技术三年级下册教案全集
  16. Win10如何禁止自动更新?Win10禁止更新又恢复怎么办?
  17. 杨辉三角~~~~~~~~
  18. 用递归算法,把任一给定的十进制正整数转换成八进制数输出。
  19. java 与 汇编_清华大学出版社-图书详情-《汇编语言与计算机体系结构——使用C++和Java》...
  20. 分享一个云端电脑(让你的电脑少装几十款软件)

热门文章

  1. 【Java6学习笔记】多线程编程中使用volatile保障原子性
  2. Ubuntu系统多屏幕时 触摸屏如何分屏定位
  3. 九爷 带你了解 Memcache工作原理总结
  4. fastdfs 配置文件详解
  5. Ext JS 6应用程序Build后出现“c is not a constructor return new c(a[0])”的处理
  6. 如何让你的Android SDK下载或者升级快如闪电
  7. javascript事件之:谈谈自定义事件
  8. ASP.NET MVC+EF框架+EasyUI实现权限管理系列
  9. PCoIP卡由火炮升级为喀秋莎
  10. C#生成CHM文件(入门篇)