前言:希望通过本文,使MySQL5.7.18的使用者知晓分区表使用中存在的陷阱,避免在该版本上继续踩坑。同时通过对源码的分享,升级MySQL5.7.18时分区表性能下降的根本原因,向MySQL源码爱好者展示分区表实现中锁的运用。

问题描述

MySQL 5.7版本中,性能相关的改进非常多。包括临时表相关的性能改进,连接建立速度的优化和复制分发相关的性能改进等等。基本上不需要做配置修改,只需要升级到5.7版本,就能带来不少性能的提升。

我们在测试环境,把数据库升级到5.7.18版本,验证MySQL 5.7.18版本是否符合我们的预期。观察运行了一段时间,有开发反馈,数据库的性能比之前的5.6.21版本有下降。主要的表现特征是遇到比较多的锁超时情况。开发另外反馈,性能下降相关的表都是分区表。更新走的都是主键。这个反馈引起了我们重视。我们做了如下尝试:

数据库的版本为5.7.18, 保留分区表,性能会下降。

数据库版本为5.7.18,把表调整为非分区表,性能正常。

把数据库的版本回退到5.6.21版本,保留分区表,性能也是正常

通过上述测试,我们大致判定,这个性能下降和MySQL5.7版本升级有关。

问题重现

测试环境的数据库表结构比较多,并且调用关系也比较复杂。为了进一步分析并定位问题,我们抽丝剥茧,构建了如下一个简单的重现过程

// 创建一个测试分区表t2:

CREATE TABLE `t2`(

`id` INT(11) NOT NULL,

`dt` DATETIME NOT NULL,

`data` VARCHAR(10) DEFAULT NULL,

PRIMARYKEY (`id`,`dt`),

KEY`idx_dt`(`dt`)

) ENGINE=INNODB DEFAULTCHARSET=latin1

/*!50100 PARTITION BY RANGE (to_days(dt))

(PARTITION p20170218 VALUES LESS THAN (736744)ENGINE = InnoDB,

PARTITIONp20170219 VALUES LESS THAN (736745) ENGINE = InnoDB,

PARTITIONpMax VALUES LESS THAN MAXVALUE ENGINE = InnoDB) */

// 插入测试数据

INSERT INTO t2 VALUES (1, NOW(), '1');

INSERT INTO t2 VALUES (2, NOW(), '2');

INSERT INTO t2 VALUES (3, NOW(), '3');

// SESSION 1 对id = 1的 记录 做一个更新操作,事务先不提交。

BEGIN;UPDATE t2 SET DATA = '12' WHERE id = 1;

// SESSION 2 对id = 2 的记录做一个更新。

BEGIN;UPDATE t2 SET DATA = '21' WHERE id = 2;

在SESSION 2,我们发现,这个更新操作一直在等待。ID是主键,按道理,主键id = 1 的记录更新,不至于影响到主键id = 2的记录更新。

查询information_schema下的innodb_locks这张表。这张表是用于记录InnoDB事务尝试申请但还未获取的锁,以及阻塞其他事务的事务所拥有的锁。有两条记录:

观察此时的innodb_locks表,事务id=40021锁住第3页的第2行记录,导致事务id=40022无法进行下去。

我们把数据库回退到5.6.21版本,则不能重现上述场景。

进一步分析

根据innodb_locks表提供的信息,我们知道问题在于InnoDB锁定了不恰当的行。该表是memory存储引擎。我们在memory 存储引擎的插入接口设置断点,得到如下堆栈信息。确定是红框部分,将锁信息写入到innodb_locks表中。

并在函数fill_innodb_locks_from_cache中得以确认,每次写入行的数据,都是从如下代码中Cache对象中获取的。

我们知道Cache中保存了事务锁的信息,因此需要进一步查找Cache中的数据,是如何添加进去的。通过搜索cache对象在innodb代码中出现的位置,找到函数add_lock_to_cache。在此函数设置断点进行调试后,发现其内容与填写innodb_locks表的数据一致。确定该函数使用的lock对象,就是我们要找的锁对象。

针对lock_t 类型的使用位置进行排查。经过筛选和调试,发现函数RecLock::lock_add中,生成的行锁被加入到该锁所在的事务链表中。

RecLock::lock_add函数可以推出行锁的生成原因。因此,通过对该函数进行断点设置,查看函数堆栈,在如下堆栈内,定位到红框位置的函数:

针对Partition_helper::handle_ordered_index_scan的如下代码进行跟踪,根据该段代码的分析,m_part_spec.end_part 决定了进行上锁的最大行数,此处即为非正常行锁生成的原因。

最终问题归结到m_part_spec.end_part 的生成原因。通过对end_part 使用地方进行排查,最终在get_partition_set函数中定位到该变量在使用前的初始设置值。从代码中可以看出,每次单条记录的update操作,在进行index scan上锁时,对分区表数目相同的行数进行上锁。这个是根本原因。

验证结论

根据之前的分析,每次单条记录的update操作,会对分区表数目相同的行数进行上锁。我们尝试验证我们的发现。

新增如下两条记录:

INSERT INTO t2 VALUES (4, NOW(), '4');

INSERT INTO t2 VALUES (5, NOW(), '5');

// SESSION 1 对id = 1的 记录 做一个更新操作,事务先不提交。

BEGIN;UPDATE t2 SET DATA = '12' WHERE id = 1;

// SESSION 2 现在对id = 4 的记录做一个更新。

BEGIN;UPDATE t2 SET DATA = '44' WHERE id = 4;

我们发现,对id = 4的更新可以正常进行。不会受到id = 1 的更新影响。这是因为id=4的记录,超过了测试案例的分区个数,不会被锁住。在实际应用中,分区表所定义分区数不会如测试用例中的只有3个,而是数十个乃至数百个。这样进行上锁的结果,将加剧更新情况下的锁冲突,导致事务处于锁等待状态。如下图所示,每个事务都上N个行锁,那么这些上锁记录互相覆盖的可能性就极大的提高,也就导致并发下降,效率降低。

结论

通过上述分析,我们非常确认,这个应该是MySQL 5.7版本的一个regression。我们提交了一个Bug到开源社区。Oracle确认是一个问题,需进一步分析调查这个Bug。

点关注,不迷路

好了各位,以上就是这篇文章的全部内容了,能看到这里的人呀,都是人才。之前说过,PHP方面的技术点很多,也是因为太多了,实在是写不过来,写过来了大家也不会看的太多,所以我这里把它整理成了PDF和文档,如果有需要的可以

以上内容希望帮助到大家,很多PHPer在进阶的时候总会遇到一些问题和瓶颈,业务代码写多了没有方向感,不知道该从那里入手去提升,对此我整理了一些资料,包括但不限于:分布式架构、高可扩展、高性能、高并发、服务器性能调优、TP6,laravel,YII2,Redis,Swoole、Swoft、Kafka、Mysql优化、shell脚本、Docker、微服务、Nginx等多个知识点高级进阶干货需要的可以免费分享给大家,需要的可以加入我的

mysql 分区 性能更差_用案例分析MySQL 5.7分区表性能下降的根本原因相关推荐

  1. ArcGIS for Desktop入门教程_第四章_入门案例分析 - ArcGIS知乎-新一代ArcGIS问答社区...

    原文:ArcGIS for Desktop入门教程_第四章_入门案例分析 - ArcGIS知乎-新一代ArcGIS问答社区 1 入门案例分析 在第一章里,我们已经对ArcGIS系列软件的体系结构有了一 ...

  2. 为什么非阻塞io性能更好_提高性能:流的非阻塞处理

    为什么非阻塞io性能更好 1.简介 想象一下,我们有一个需要访问外部Web服务的应用程序,以便收集有关客户端的信息,然后对其进行处理. 更具体地说,我们无法在一次调用中获得所有这些信息. 如果我们要查 ...

  3. mysql 建立索引更慢_如何运用“提前发布,经常发布”来建立更好的品牌

    mysql 建立索引更慢 开源的重要性,尤其是"早发布,经常发布"(RERO)的格言,很难被夸大. 随着各种规模和规模的组织发现开放的协作流程可以做什么,这种在命令行中诞生的方法已 ...

  4. mysql递归查询所有上下节点_【转】MySQL之Spider存储引擎原理详解

    一.概述 Spider是为MySQL/MariaDB开发的一个特殊引擎,具有内嵌分片功能.MariaDB从10.0.4开始支持Spider.作为MariaDB的一个新的主要特性.Spider的主要功能 ...

  5. 数据库设计讲解和案例分析 | mysql 入门

    数据库设计 什么是数据库设计 数据库设计是指在数据库系统开发过程中,根据用户需求,通过对数据进行分析.抽象和建模,设计出一个合理.高效的数据库结构的过程.数据库设计的目的是为了实现数据的存储.管理.维 ...

  6. mysql逻辑读高影响_运维日记| MySQL/Oracle深度解析之一:逻辑读

    前言 THE FIRST 比较数据库优劣.异同的文章有很多了,使用压测工具,进行不同压力下的测试,就能大致上比较出来哪种数据库是"最快"的数据库.但从有经验的数据架构.DBA等专业 ...

  7. mysql io 100_MySQL服务器 IO 100%的案例分析

    [问题] 有台MySQL 5.6.21的数据库实例以写入为主,IO %util接近100% 写入IOPS很高 [分析过程] 1.通过iotop工具可以看到当前IO消耗最高的mysql线程 2.查看线程 ...

  8. mysql 事务值被改变_面试被问MySQL 事务的实现原理,怎么破?

    Java面试笔试面经.Java技术每天学习一点 作者:小小木的博客 来源:https://www.cnblogs.com/wyc1994666/ 开篇 相信大家都用过事务以及了解他的特点,如原子性(A ...

  9. mysql使用已有的数据库_使用SQL操作MySQL数据库

    用SHOW显示已有的数据库 句法:SHOW DATABASES [LIKE wild] 如果使用LIKE wild部分,wild字符串可以是一个使用SQL的"%"和"_& ...

最新文章

  1. 给娃写个游戏,庆祝嫦娥五号登月
  2. 讨厌别人不写注释,但自己也不爱写?那么试试这个IDEA的注释插件吧!
  3. Docker 运行的 应用程序无法连接Oracle数据库的解决办法
  4. ITK:计算图像在特定方向上的导数
  5. Java EE 8怎么了? (第2部分)
  6. 一般试卷的纸张大小是多少_pdf试卷怎么打印在A3纸上
  7. 物联网无线数传通信模块:工业级高精度电源模块
  8. 宝塔面板数据库未授权访问(端口:888)
  9. 程序员书单_数据库篇
  10. oracle多用户导出导入用法
  11. 简单的Verilog测试模板结构
  12. Hash和Bloom Filter
  13. 在线教育网校系统源码,搭建可以解决培训考试的教学平台
  14. matlab符号系统
  15. Linux下如何解压.zip和.rar文件
  16. System x服务器使用ServerGuide引导安装Windows Server 2008 R2
  17. 扩展欧几里得算法求逆元c语言,利用扩展欧几里得算法编程求逆元
  18. 学习笔记-应用光学 典型光学系统
  19. 计算机网络实验-eNSP路由器配置
  20. 机器学习100天(三):003 数据预处理之处理缺失值

热门文章

  1. node js 开发网站_使用Node JS开发网站
  2. 最囧的国庆,是一种怎样的体验?
  3. 多图带你彻底理解Java中的21种锁!
  4. Python SimpleITK实现医学图像增强算法
  5. js html 转换为富文本,如何将富文本得到的html转换为pdf?
  6. 小米9私密相册怎么找_“拼藏搜”,手机相册还能这么玩
  7. java 跳转虚拟目录_java tomcat虚拟目录的深入了解
  8. react项目中的参数解构_一天入门React学习心得
  9. 一个柱状图里两种数据_分享一些数据分析常用的统计图图表
  10. python时间序列预测不连续怎么办_python – 不连续的时间序列在x轴上绘制日期