MySQL数据是如何存储的?

聚集索引

我们先建如下的一张表

CREATE TABLE `student` (  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '学号',  `name` varchar(10) NOT NULL COMMENT '学生姓名',  `age` int(11) NOT NULL COMMENT '学生年龄',  PRIMARY KEY (`id`),  KEY `idx_name` (`name`)) ENGINE=InnoDB;

插入如下sql

insert into student (`name`, `age`) value('a', 10);insert into student (`name`, `age`) value('c', 12);insert into student (`name`, `age`) value('b', 9);insert into student (`name`, `age`) value('d', 15);insert into student (`name`, `age`) value('h', 17);insert into student (`name`, `age`) value('l', 13);insert into student (`name`, `age`) value('k', 12);insert into student (`name`, `age`) value('x', 9);

数据如下mysql是按照页来存储数据的,每个页的大小为16k。

在MySQL中可以通过执行如下语句,看到一个页的大小

show global status like 'innodb_page_size'

结果为16384,即16kb

在InnoDB存储引擎中,是以主键为索引来组织数据的。记录在页中按照主键从小到大的顺序以单链表的形式连接在一起。

可能有小伙伴会问,如果建表的时候,没有指定主键呢?

如果在创建表时没有显示的定义主键,则InnoDB存储引擎会按如下方式选择或创建主键。

  1. 首先判断表中是否有非空的唯一索引,如果有,则该列即为主键。如果有多个非空唯一索引时,InnoDB存储引擎将选择建表时第一个定义的非空唯一索引作为主键
  2. 如果不符合上述条件,InnoDB存储引擎自动创建一个6字节大小的指针作为索引

页和页之间以双链表的形式连接在一起。并且下一个数据页中用户记录的主键值必须大于上一个数据页中用户记录的主键值

假设一个页只能存放3条数据,则数据存储结构如下。可以看到我们想查询一个数据或者插入一条数据的时候,需要从最开始的页开始,依次遍历每个页的链表,效率并不高。我们可以给这页做一个目录,保存主键和页号的映射关系,根据二分法就能快速找到数据所在的页。但这样做的前提是这个映射关系需要保存到连续的空间,如数组。如果这样做会有如下几个问题

  1. 随着数据的增多,目录所需要的连续空间越来越大,并不现实
  2. 当有一个页的数据全被删除了,则相应的目录项也要删除,它后面的目录项都要向前移动,成本太高

我们可以把目录数据放在和用户数据类似的结构中,如下所示。目录项有2个列,主键和页号。数据很多时,一个目录项肯定很多,毕竟一个页的大小为16k,我们可以对数据建立多个目录项目,在目录项的基础上再建目录项,如下图所示

图片来自《MySQL 是怎样运行的:从根儿上理解 MySQL》

这其实就是一颗B+树,也是一个聚集索引,即数据和索引在一块。叶子节点保存所有的列值

以 InnoDB 的一个整数字段索引为例,这个 N 差不多是 1200。这棵树高是 4 的时候,就可以存 1200 的 3 次方个值,这已经17 亿了。考虑到树根的数据块总是在内存中的,一个 10 亿行的表上一个整数字段的索引,查找一个值最多只需要访问 3次磁盘。其实,树的第二层也有很大概率在内存中,那么访问磁盘的平均次数就更少了。《MySQL实战45讲》

非聚集索引

聚集索引和非聚集索引非常类似,区别如下

聚集索引叶子节点的值为所有的列值非聚集索引叶子节点的值为索引列+主键

当我们查询name为h的用户信息时(学号,姓名,年龄),因为name上建了索引,先从name非聚集索引上,找到对应的主键id,然后根据主键id从聚集索引上找到对应的记录。

从非聚集索引上找到对应的主键值然后到聚集索引上查找对应记录的过程为回表

联合索引/索引覆盖

假设teacher表定义如下,在name和age列上建立联合索引

CREATE TABLE `teacher` (  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '教师编号',  `name` varchar(10) NOT NULL COMMENT '教师姓名',  `age` int(11) NOT NULL COMMENT '教师年龄',  `ismale` tinyint(3) NOT NULL COMMENT '是否男性',  PRIMARY KEY (`id`),  KEY `idx_name_age` (`name`, `age`)) ENGINE=InnoDB;

插入如下sql

insert into teacher (`name`, `age`, `ismale`) value('aa', 10, 1);insert into teacher (`name`, `age`, `ismale`) value('dd', 12, 0);insert into teacher (`name`, `age`, `ismale`) value('cb', 9, 1);insert into teacher (`name`, `age`, `ismale`) value('cb', 15, 1);insert into teacher (`name`, `age`, `ismale`) value('bc', 17, 0);insert into teacher (`name`, `age`, `ismale`) value('bb', 15, 1);insert into teacher (`name`, `age`, `ismale`) value('dd', 15, 1);insert into teacher (`name`, `age`, `ismale`) value('dd', 12, 0);

对name和age列建立联合索引

目录页由name列,age列,页号这三部分组成。目录会先按照name列进行排序,当name列相同的时候才对age列进行排序。

数据页由name列,age列,主键值这三部分组成。同样的,数据页会先按照name列进行排序,当name列相同的时候才对age列进行排序。

当执行如下语句的时候,会有回表的过程

select * from student where name = 'aa';

当执行如下语句的时候,没有回表的过程

select name, age from student where name = 'aa';

为什么不需要回表呢?

因为idx_name_age索引的叶子节点存的值为主键值,name值和age值,所以从idx_name_age索引上就能获取到所需要的列值,不需要回表,即索引覆盖

仔细看一下联合索引这个图,你就基本上能明白为什么不满足最左前缀原则的索引会失效?

索引下推

当执行如下语句的时候

select * from student where name like '张%' and age = 10 and ismale = 1;

在5.6版本之前的执行过程如下,先从idx_name_age索引上找到对应的主键值,然后回表找到对应的行,判断其他字段的值是否满足条件图片来自《MySQL实战45讲》

在5.6引入了索引下推优化,可以在遍历索引的过程中,对索引中包含的字段做判断,直接过滤掉不满足条件的数据,减少回表次数,如下图图片来自《MySQL实战45讲》

最左前缀原则

加速查询

主要针对组合索引,满足如下2个条件即可满足左前缀原则

  1. 需要查询的列和组合索引的列顺序一致
  2. 查询不要跨列

构造数据如下,其中在name,address,country上建了联合索引

CREATE TABLE `people` (  `name` varchar(50) NOT NULL,  `address` varchar(50) NOT NULL,  `country` varchar(50) NOT NULL,  KEY `idx_name_addr_country` (`name`,`address`,`country`)) ENGINE=InnoDB DEFAULT CHARSET=utf8;

举几个例子,下面涉及到一些explain相关的知识,后面单开一篇长文来做介绍

例子一

explain select * from people where name = "jack"and address = "beijing" and country = "china"

在这里插入图片描述

type为ref,key_len为456=(50*3+2)*3,联合索引的所有列都使用了

例子二

explain select * from people where name = "jack"

type为ref,key_len为152=50*3+2,联合索引只使用了name列

例子三

explain select * from people where address = "beijing"

type为index,表明查询的时候对整个索引进行了扫描,并没有加速查找。

假设有如下的联合索引 key idx_a_b_c(a,b,c)

sql 是否使用索引
where a = x and b = x and c = x
where a = x and b = x 是,部分索引
where a = x 是,部分索引
where b = x 否,不包含最左列name
where b = x and c = x 否,不包含最左列name

如果你仔细看了前面联合索引是如何存储的,那你一定能看懂是否使用索引的介绍

目录页是按照 a b c 列的顺序依次递增排序的。先按照a列排序,如果a列相同,再按照b列排序,如果b列相同,才按照c列排序

所以查询列值a b c,则这个排序规则能用到,即会走索引。如果只查列值b,并不能用到这个排序规则,所以得遍历所有的记录

加速排序

最左前缀原则不仅用在查询中,还能用在排序中。MySQL中,有两种方式生成有序结果集:

  1. 通过有序索引顺序扫描直接返回有序数据
  2. Filesort排序,对返回的数据进行排序

因为索引的结构是B+树,索引中的数据是按照一定顺序进行排列的,所以在排序查询中如果能利用索引,就能避免额外的排序操作。EXPLAIN分析查询时,Extra显示为Using index。

所有不是通过索引直接返回排序结果的操作都是Filesort排序,也就是说进行了额外的排序操作。EXPLAIN分析查询时,Extra显示为Using filesort,当出现Using filesort时对性能损耗较大,所以要尽量避免Using filesort

还是先举2个例子,然后总结

explain select * from people order by name

在这里插入图片描述

Extra列只有Using index,即根据索引顺序进行扫描

explain select * from people order by address

在这里插入图片描述

Extra列有Using filesort

总结:假如说有如下联合索引,key idx_a_b_c(a,b,c)

order by 能使用索引排序

order by aorder by a,border by a,b,corder by a desc, b desc, c descwhere a = const order by b,cwhere a = const and b = const order by cwhere a = const and b > const order by b,c

order by 不能使用索引进行排序

order by border by corder by b, corder by a asc, b desc, c desc //排序不一致where g = const order by b,c //丢失a索引where a = const order by c //丢失b索引where a = const order by a,d //d不是索引的一部分where a in (...) order by b,c //范围查询

这个原因就不用我解释了把,相信你一定看懂了

联合索引的好处

索引覆盖,减少了很多回表的操作,提高了查询的效率

索引下推,索引列越多,通过索引筛选出的数据越少。有1000W条数据的表,有如下sql:select * from table where col1=1 and col2=2 and col3=3,假设假设每个条件可以筛选出10%的数据,如果只有单值索引,那么通过该索引能筛选出1000W10%=100w条数据,然后再回表从100w条数据中找到符合col2=2 and col3= 3的数据;如果是联合索引,通过索引筛选出1000w*10%*10% *10%=1w,效率提升可想而知!

索引为什么会失效?

当别人问我索引在什么条件下会失效时,我能背出一大堆规则

  1. 不要在索引列上进行运算或使用函数
  2. 前导模糊查询不会使用索引,例如 like %李
  3. 负向条件索引不会使用索引,建议用in。负向条件有:!=、<>、not in、not exists、not like 等

索引是按照一定规则排好序的,如果对索引列使用函数,或者 like % 李,具体的值都不知道,它怎么在B+树上加速查询?

长文不易,有帮助?点个在看?

synchronized 分布式时为什么会失效_10张图,搞懂索引为什么会失效?相关推荐

  1. java 原型图_一张图搞懂原型、原型对象、原型链

    基本概念 在javascript中,函数可以有属性. 每个函数都有一个特殊的属性叫作原型(prototype) 每个对象拥有一个原型对象 [[Prototype]] / __proto__ / Obj ...

  2. 一张图搞懂Spring bean的完整生命周期

    转载自 一张图搞懂Spring bean的完整生命周期 一张图搞懂Spring bean的生命周期,从Spring容器启动到容器销毁bean的全过程,包括下面一系列的流程,了解这些流程对我们想在其中任 ...

  3. 【科普干货】3张图搞懂Salesforce的认证体系(附新手考证攻略)

    Salesforce.com,这家神一般的公司及其产品我就不多说了,需要了解的可以阅读我的另一篇科普文章<一张图读懂Salesforce的产品架构>. 今天给大家带来另一篇关于Salesf ...

  4. 一张图搞懂微服务架构设计

    前言 当前,微服务架构在很多公司都已经落地实施了,下面用一张图简要概述下微服务架构设计中常用组件.不能说已经使用微服务好几年了,结果对微服务架构没有一个整体的认知,一个只懂搬砖的程序员不是一个好码农! ...

  5. 一张图搞懂容器所有操作 - 每天5分钟玩转 Docker 容器技术(26)

    前面我们已经讨论了容器的各种操作,对容器的生命周期有了大致的理解,下面这张状态机很好地总结了容器各种状态之间是如何转换的. 如果掌握了前面的知识,要看懂这张图应该不难.不过有两点还是需要补充一下: 可 ...

  6. 4张图搞懂Salesforce的认证体系(附新手考证攻略)

    Salesforce认证计划概述 最近这一两年,Salesforce的Trailhead和认证太热门了,小伙伴们前赴后继地刷Badge拿认证,可以考的认证也随着产品家族的增加而增加,从十几年前的几个认 ...

  7. 3张图搞懂Salesforce的认证体系

    今天给大家带来另一篇关于Salesforce认证考试的科普文章. [Salesforce认证计划概述] 最近这一两年,Salesforce的Trailhead和认证太热门了,小伙伴们前赴后继地刷Bad ...

  8. 一张图搞懂Ajax原理

    原理 说起ajax,就不得不说他背后的核心对象XMLHttpRequest,而说到XMLHttpRequest我觉得,从它的readyState状态说起是最好的切入点. 个人觉得,只要弄清楚了read ...

  9. 5张图搞懂Java深浅拷贝

    微信搜一搜 「bigsai」 关注这个专注于Java和数据结构与算法的铁铁 文章收录在github/bigsai-algorithm 欢迎star收藏 如果本篇对你有帮助,记得点赞收藏哦! 在开发.刷 ...

最新文章

  1. 异步GridView(ASPxGridView) 特点介绍(2) - 筛选(Filter)、弹出编辑(Editing)
  2. 让AI说话告别三观不正,OpenAI只用80个文本就做到了
  3. 人生感悟:一个男人必须具有的东西
  4. Linux vim编辑器命令总结(转载)
  5. 科大星云诗社动态20210211
  6. 光盘显示容量但读不出文件_软网推荐:文件夹容量属性增强显示
  7. 一个常见的物理现象,直今还是未解之谜!
  8. 10 Equality constrained minimization
  9. mac 鼓捣php 多版本切换
  10. 【常见问题】hive、Hadoop(HA)、sqoop出现的问题的总结---各种问题以及解决方案-
  11. 计算机的数据库应用领域,【信息管理论文】信息管理中计算机数据库技术的应用(共4410字)...
  12. Hibernate学习笔记之EHCache的配置
  13. Ubuntu 12.04.2搭建nfs服务器
  14. Docker 镜像、容器 常用命令,容器与宿主服务器文件复制
  15. 2021MathorCup高校数学建模挑战赛——大数据竞赛的一些想法总结
  16. Mysql语句字符串拼接
  17. laypage分页java例子_基于LayUI分页和LayUI laypage分页的使用示例
  18. 泛微E9 获取附件内容,泛微Ecology9获取附件范例,Ecology9附件、E9 附件下载及上传集成平台
  19. 小霸王电脑吃鸡/玩大型游戏GlobalShaderCache-PCD3D_SM4.bin is missing解决方法
  20. linux读取外接硬盘。bash: cd: too many arguments

热门文章

  1. javascript 获取图片原始尺寸
  2. spring import resource 文件后bean找不到问题解决
  3. [解决] term.js 记录遇到的问题
  4. Eclipse中自动提示的方法参数都是arg0,arg1的解决方法
  5. vue-cli3出现Invalid Host header的解决方案
  6. 【报告分享】2019全球数字经济新图景.pdf
  7. 剑指offer 面试题63. 股票的最大利润
  8. 机器学习算法总结之XGBoost(下) 实战与调参
  9. 经典查找算法及其Python实现
  10. png文件合并_程序员学习之在Python中使用PDF:阅读、旋转、合并和拆分