MySQL 并行回放在一路改进,从5.6的schema并行,到5.7的group commit, 再到8.0的write set

MTS based on schema

这种方式不用多说,涉及不同schema的DML操作,在slave端可以按schema粒度并行回放,弱点也很明显,如果实例中的schema较少,并行回放效果并不理想。

其优化方式也比较简单slave_parallel_workers 小于等于master的schema数量。

LOGICAL_CLOCK

MySQL 5.7 增加了基于group commit的并行回放策略,使得slave可以接近master同样并发回放事务,master并发越高,slave并行回放效果越明显。

在binlog中每个事务会有多出两个标签

sequence_number:随每个事务递增的自增ID,每次新的binlog会从1开始

last_committed:当前事务所依赖的上次事务的sequence_number,每次新的binlog会从0开始

last_committed相同值的事务代表同时提交的,可以并行回放。

#180105 20:08:33 ... last_committed=7201 sequence_number=7203

#180105 20:08:33 ... last_committed=7203 sequence_number=7204

#180105 20:08:33 ... last_committed=7203 sequence_number=7205

#180105 20:08:33 ... last_committed=7203 sequence_number=7206

#180105 20:08:33 ... last_committed=7205 sequence_number=7207

7203事务依赖7201

7204、7205、7206事务依赖7203,可以并行提交

7207事务依赖7205,由于7205依赖7203,那么在7205执行完后,7207可以和7206并行执行

优化方式通过调整master group commit size和slave的并行work线程数,提升并行效率。

master group commit size和并发压力,以及下面两个参数相关

binlog_group_commit_sync_delay 表示binlog提交事务前等待多少微秒

binlog_group_commit_sync_no_delay_count 表示同步队列最大允许的事务数,当等待提交的线程达到多少时, 就不在等待

在master低并发的负载下,并行回放效果就不好了,如果想要提高并行度,需要增加binlog_group_commit_sync_delay,积累较多的分组大小,副作用是拉低master吞吐量。

Write set

MySQL 8.0.1 & 5.7.22 在group commit基础上进一步改善了并行复制效率,增加了新的跟踪事务依赖关系的机制。相对于基于事务commit timestamp,即使master低并发场景下也能使slave根据事务依赖关系并行重放,充分利用硬件资源,不需要像MySQL 5.7增加binlog_group_commit_sync_delay延迟的方式,增加可并行的事务,降低复制延迟。

在master上满足以下条件binlog_format=row

开启transaction_write_set_extraction=XXHASH64

更新表必须有主键,如果更新事务包含外键,则退回commit_order方式

binlog_transaction_dependency_tracking = [COMMIT_ORDER | WRITESET | WRITESET_SESSION]

slave上开启slave_parallel_workers

COMMIT_ORDER 基于commit timestamp

不同会话在相同时间执行可以并行回放

WRITESET 变更不同行的操作都可以并行无主键 退回commit_order模式

hongbin@MBP ~/w/s/msb_8_0_3> mysqlbinlog data/MBP-bin.000013 |grep last_ |sed -e 's/server id.*last/[...] last/' -e 's/.rbr_only.*/ [...]/'

#180105 21:19:31 [...] last_committed=0 sequence_number=1 [...] create table t1 (id);

#180105 21:19:50 [...] last_committed=1 sequence_number=2 [...] insert t1 value(1);

#180105 21:19:52 [...] last_committed=2 sequence_number=3 [...] insert t1 value(2);

#180105 21:19:54 [...] last_committed=3 sequence_number=4 [...] insert t1 value(3);

有主键 单个会话也可以并行

#180105 21:23:58 [...] last_committed=4 sequence_number=5 [...] create table t2 (id INT UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY, str VARCHAR(80) NOT NULL UNIQUE);

#180105 21:24:19 [...] last_committed=5 sequence_number=6 [...] session1: insert t2(str) value('a');

#180105 21:24:21 [...] last_committed=5 sequence_number=7 [...] session1: insert t2(str) value('b');

#180105 21:24:25 [...] last_committed=5 sequence_number=8 [...] session1: insert t2(str) value('c');

WRITESET_SESSION 相同会话不会被重新排序,不同会话可并行

在相同会话中执行

#180106 13:15:26 [...] last_committed=0 sequence_number=1 [...] session1:insert t2(str) value('h');

#180106 13:15:31 [...] last_committed=1 sequence_number=2 [...] session1:insert t2(str) value('l');

在不同会话中执行

#180106 13:17:08 [...] last_committed=1 sequence_number=3 [...] session1: insert t2(str) value('q');

#180106 13:17:09 [...] last_committed=1 sequence_number=4 [...] session2: insert t2(str) value('w');

如何观测并行回放

如何评估slave_parallel_workers设置多少合适?如果设置小了,任务会有积压,如果设置大了,多余的线程是空闲的。

计算机领域有这么个公式专门来研究系统资源分配公平性。

出自论文《A Quantitative Measure Of Fairness And Discrimination For Resource Allocation In Shared Computer Systems》引用数4000+

这个公式称为 jain's index 计算一系统共享资源分配公平性的指数,指数值在0

借用此公式是不是可以来计算回放线程任务分配的公平性,如果slave_parallel_workers设置过大,反应任务分配公平性较差。找到合适的slave_parallel_workers

这里需要启用performance_schema的transaction级的instrument,搜集线程事务提交信息。call sys.ps_setup_enable_consumer('events_transactions%');

call sys.ps_setup_enable_instrument('transaction');

将公式转换为SQL语句如下select ROUND(POWER(SUM(trx_summary.COUNT_STAR), 2)

(@@GLOBAL.slave_parallel_workers * SUM(POWER(trx_summary.COUNT_STAR, 2))), 2) AS replica_jain_index

from performance_schema.events_transactions_summary_by_thread_by_event_name as trx_summary join performance_schema.replication_applier_status_by_worker as applier

on trx_summary.THREAD_ID = applier.THREAD_ID

在slave上观测,如果该指数值越接近0说明当前applier线程越空闲率高,如果该指数值越接近1说明当前applier线程空闲率越低。动手试试吧!

参考

https://www.percona.com/blog/2016/02/10/estimating-potential-for-mysql-5-7-parallel-replication/

https://www.slideshare.net/JeanFranoisGagn/fosdem-2018-premysql-day-mysql-parallel-replication

https://jfg-mysql.blogspot.hk/2017/02/metric-for-tuning-parallel-replication-mysql-5-7.html

https://jfg-mysql.blogspot.com/2018/01/write-set-in-mysql-5-7-group-replication.html?m=1

http://mysqlhighavailability.com/improving-the-parallel-applier-with-writeset-based-dependency-tracking/

mysql 5.7 mts_回顾MySQL的MTS相关推荐

  1. mysql mts_MySQL进一步完善可用并行复制-MTS并行增量的应用-爱可生

    原标题: MySQL进一步完善可用并行复制-MTS并行增量的应用-爱可生 MTS 并行增量应用 MySQL 的复制延迟在早期版本一直存在,MySQL 5.6.3 版本后开始支持并行复制,并在 5.7 ...

  2. 与mysql的零距离接触_与MySQL的零距离接触

    第1章 初涉MySQL 1-1 MySQL概述 (01:54) 1-2 MySQL的安装与配置 (15:13) 1-3 启动与停止MySQL服务 (02:41) 1-4 登录与退出 (05:48) 1 ...

  3. mysql数据库with ur_Python使用MySQL数据库(新)

    一,安装mysql 如果是windows用户,mysql的安装非常简单,直接下载安装文件,双击安装文件一步一步进行操作即可. Linux 下的安装可能会更加简单,除了下载安装包进行安装外,一般的lin ...

  4. 【建议收藏】15755字,讲透MySQL性能优化(包含MySQL架构、存储引擎、调优工具、SQL、索引、建议等等)

    0. 目录 1)MySQL总体架构介绍 2)MySQL存储引擎调优 3)常用慢查询分析工具 4)如何定位不合理的SQL 5)SQL优化的一些建议 1 MySQL总体架构介绍 1.1 MySQL总体架构 ...

  5. MySQL 数据存储和优化------MySQL架构原理 ---- (架构---索引---事务---锁---集群---性能---分库分表---实战---运维)持续更新

    Mysql架构体系全系列文章主目录(进不去说明还没写完)https://blog.csdn.net/grd_java/article/details/123033016 本文只是整个系列笔记的第一章: ...

  6. mysql教程虫师_python使用mysql数据库 - 虫师

    一,安装 mysql 如果是 windows 用户, mysql 的安装非常简单,直接下载安装文件,双击安装文件一步一步进行操作即可. Linux  下的安装可能会更加简单,除了下载安装包进行安装外, ...

  7. 解决 ERROR 2002 (HY000): Can‘t connect to local MySQL server through socket ‘/tmp/mysql.sock‘ (61) 超详细

    环境: mac 10, mysql 8.0.18 背景: 检查/tmp/mysql.sock文件存在且正常 解决步骤: 1.授予权限     (base) AppledeMacBook-Air-2:~ ...

  8. ubuntu 找不到mysql.h_ubuntu安装了mysql 但是编译报错 mysql.h: No such file or directory

    在Ubuntu体系中,已经安装了mysql,即应用sudo apt-get install mysql-server mysql-client 但是用C编译mysql数据库时,报错 fatal err ...

  9. 【建议收藏】15755 字,讲透 MySQL 性能优化(包含 MySQL 架构、存储引擎、调优工具、SQL、索引、建议等等)

    0. 目录 1)MySQL 总体架构介绍 2)MySQL 存储引擎调优 3)常用慢查询分析工具 4)如何定位不合理的 SQL 5)SQL 优化的一些建议 1 MySQL 总体架构介绍 1.1 MySQ ...

最新文章

  1. 用OpenCV进行摄像机标定
  2. WebSocket的故事(六)—— Springboot中,实现更灵活的WebSocket
  3. 广州新房都智能成这样了???
  4. 浅谈Logistic回归及过拟合
  5. spring心得5--构造器注入@设置控制@案例加注解剖析
  6. Spring中的容器
  7. 淘宝前端工程师:国内前端行业十日谈(六)
  8. rest framework错误笔记——身份验证和权限
  9. python实现计算字符串或列表中每个字符出现的次数,并打印出现次数最多的字符
  10. 记事本写html怎么加a1图片,记事本-功能待添加
  11. mp4视频转gif图片
  12. 洛谷——P1319 压缩技术
  13. 使用C# 开始第一个QQ机器人
  14. jade模板引擎入门教程
  15. 如何卸载office201032位_win7卸载office2010的步骤_win7如何完美卸载office2010-win7之家...
  16. 计算机基础知识刷题app,计算机考试刷题app
  17. 登陆weblogic console报错 The server encountered an unexpected condition which prevented it from
  18. 线性代数系列(一)--线性组合
  19. correl函数相关系数大小意义_用Correl函数返回相关系数,以确定属性关系 Excel用Correl函数返回相关系数以确...
  20. python打开是什么样子的图片_黑洞6问:黑洞内部是什么样子?黑洞图片发布,理论和实测的碰撞...

热门文章

  1. 为啥不用PC机做物联网关?物联网关有啥特征?工业物联网产业的发展之道?
  2. MySQL分组统计及占比分析的方法实现
  3. 代理模式-为别人做嫁衣
  4. 后疫情新常态下,快消品牌企业如何通过数字化撬动万亿市场新增长?
  5. mysql的full join_mysql实现full join
  6. TL-SSD: Detecting Traffic Lights by Single Shot Detection 论文复现
  7. SGU 103 Traffic Lights【最短路】
  8. 网络检测,其实我们可以做的更多
  9. 【三十天精通Vue 3】 第二十二天 Vue 3的UI框架详解
  10. 逆向入门之计次软件的破解