聊聊 MySql 索引那些事儿
来源:my.oschina.net/luozhou/blog/3030583
概述
上一篇文章《一条SQL语句在MySQL中是如何执行的》我们聊到了sql语句内部的执行,包括InnoDB引擎是如何支持事务的,如何做到可以备份恢复的,那么今天我们来聊一聊MySql索引的那些事,在这篇文章中,我会主要聊聊InnoDB下索引的数据结构,索引如何起作用的,如何更好的利用索引提高效率。
一、什么是索引
数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询、更新数据库表中数据。就像我们以前用的新华字典的目录一样,能帮助我们快速查询到某一个字。
二、索引的分类
分类角度 | 索引名称 |
---|---|
数据结构 | B+树,Hash索引,R-Tree等 |
存储层面 | 聚簇索引,非聚簇索引 |
逻辑层面 | 主键索引,普通索引,复合索引,唯一索引,空间索引等 |
三、索引实例分析(以InnoDB为例)
3.1 InnoDB下索引的结构
InnoDB下,表都是根据主键顺序以索引的形式存放的,这种数据存储方式也被称为聚簇索引,“聚簇”就是表示数据行和相邻的键值紧凑的存储在一起,也就是数据行实际上是存储在索引的叶子页中。我们创建一张表来实际说明下InnoDB下的索引结构,建表语句如下:
create table person(
id int primary key,
age int not null
index (age)engine=InnoDB;
然后我们插入五条数据分别为(1,15),(2,17),(6,20),(10,18),(19,21),索引的树结构如下:
上图中展示了两部分内容,第一个图为聚簇索引(主键索引)的内容,可以看到,数据按照Id的大小排序,对应的索引会包含该索引的整行数据。
第二个图展示了用age做索引的索引结构图,也就是非聚簇索引(非主键索引),可以看到索引以年龄排序,但是和主键索引不同的是,年龄索引对应的却是Id,所以我们可以知道非主键索引记录的内容就是主键索引的值。
这里可能有同学会有疑问,如果我建表的时候没有指定主键的话,索引结构又是如何的呢?其实在InnoDB中,如果没有定义主键,那么他会选择一个唯一的非空索引代替。如果没有这样的索引,那么他会隐式的定义一个主键来作为聚簇索引。所以无论你是否设置主键,InnoDB还是会帮你满足以上图的形式来索引数据。接下来我们分析下索引查询的流程。
3.2 索引查询分析
假设我们执行一条查询语句 select * from person where ID = 6
,因为直接使用的是主键ID查询,所以就会用主键索引,由于主键索引直接关联了整行所有数据,所以,引擎只要执行一次就能查询出结果。
如果执行的sql语句是非主键索引
select * from person where age = 18
上述语句会走age的普通索引,索引先根据age搜索等于18的索引记录,找到ID=10的记录,然后再到主键索引搜索一次,然后拿出需要查询的数据。
从普通索引查出主键索引,然后查询出数据的过程叫做回表。由于回表需要多执行一次查询,这也是为什么主键索引要比普通索引要快的原因,所以,我们要尽量使用主键查询。
3.3 覆盖索引
我们通常创建索引的依据都是根据查询的where条件,但是这只是我们通常的做法,我们根据上面的分析可以知道,如果要想查询效率高,第一,使用主键索引,第二,避免回表,也就是尽可能的在索引中就能获取想要的数据。如果一个索引包含了需要查询的字段,那么我们就叫做“覆盖索引”。
那么如何建立一个覆盖索引呢?答案是通过联合索引来实现,通过联合索引的字段来覆盖要查询的字段,从而达到索引覆盖的效果。
我们把上面的建表语句改造下,来分析下如何实现覆盖索引。
CREATE TABLE `person` (`id` int(11) NOT NULL,`age` int(11) DEFAULT NULL,`name` varchar(20) DEFAULT NULL,`sex` varchar(1) DEFAULT NULL,PRIMARY KEY (`id`),KEY `name_age` (`name`,`age`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1;
上面我创建了一个name和age的联合索引,索引结构图表示如下:
我们根据图可以知道,联合索引是和创建索引字段顺序有关的,上面这个例子就是先以name排序,然后name相同再以age为标准排序。那么我们建表后该如何达到覆盖索引的效果呢?相信有些同学已经知道了怎么写sql可以达到覆盖索引效果,sql如下:
select name,age from person where name = "Barry"
因为我们需要查询的字段name和age,都在索引中可以直接查询到了,所以不需要查找到主键ID,然后再回表了。
看到这里,肯定有同学会说,既然这样的话,我把所有需要查询的字段组合都建上联合索引不就行了吗?答案是:不行。因为索引也是需要消耗空间的,而且维护索引也是需要成本的,这一点我会在后面的优缺点中提到。那么有没有别的方式可以尽可能的实现不回表的效果呢?这里我们就要引入MySql的最左前缀原则了。
什么叫最左前缀原则呢?就是在索引的匹配中,可以以索引的最左N个字段,也可以是字符串索引的最左N个字符。比如在上图中,要查询以A开头的名字,查询语句就是
select name from person where name like 'A%'
这个时候就可以满足最左前缀规则来使用索引查询了,这里就会依赖索引查询到第一个首字母是A的名字,然后向后遍历,直到不满足条件为止。
那么最左N个字段是什么意思呢?意思就是索引(name,age),可以直接利用 name来当做单独索引使用,可以只使用联合索引的部分字段,但是必须是顺序一致,比如索引(a,b,c),如果要想使用最左前缀规则,可以使用索引a,ab。
我们也可以利用该规则来少维护一个或多个索引,比如我们需要 a,ab,abc的查询,那就只需要(a,b,c)联合索引就满足要求了。
3.4 索引下推
在MySql 5.6版本中引入了一个新特性,叫做“索引条件推送(index condition pushdown)”,这也称为索引下推。那么索引下推是这个什么东东呢?其实从“索引条件推送”这个名字就可以表明,这个特性是可以在索引中的字段进行条件判断,然后过滤不满足条件的记录,减少回表的次数。
比如以上图中的数据为准,sql如下:
select * from person where name like 'A%' and age =19;
那么如果没有索引下推的情况下,首先会根据索引查询出名字以A开头的所有记录,然后查询出ID,然后回表去查询对应的ID记录,最后再判断age=19,返回满足条件的语句。因为满足A开头的记录有2条,所以这种情况下,会回表2次。
在索引下推情况下,InnoDB会在索引内部直接判断age=19是否满足条件,过滤掉不满足条件的记录,所以只返回了一条,也就是只需要回表一次。从而提高了性能。
3.5 索引的优点与缺点
说了这么多关于索引的内容,我们来谈谈索引的优缺点。
优点:
减少服务器需要扫描的数据量
索引可以帮助服务器避免排序和临时表
索引可以将随机IO变为顺序IO
缺点
索引会占用额外的存储空间
索引的维护需要一定的成本,插入数据后需要保证原来的索引有序,所以也会影响一定的数据库性能。
四、总结
这篇博文我主要说了,索引的定义,索引的分类,索引按照不同的角度可以分为常见的哪几种。然后我重点说了在InnoDB下索引的索引的数据结构。 主键索引和非主键索引的区别就是查询主键索引可以直接返回数据,非主键索引需要先查询出主键ID,然后再查询出数据,这个过程就叫做回表。我们可以通过覆盖索引减少回表的次数,从而达到提高性能的效果。在mysql5.6以后,InnoDB可以支持索引下推,在使用联合索引的时候,如果可以在索引判断条件,那么就在索引中过滤不满足条件的行,从而减少回表次数。
五、参考
《高性能MySql》第3版
《MySql45讲》专栏
聊聊 MySql 索引那些事儿相关推荐
- 聊聊Mysql索引和redis跳表
聊聊Mysql索引和redis跳表 ---redis的有序集合zset数据结构底层采用了跳表原理 时间复杂度O(logn)(阿里) redis使用跳表不用B+数的原因是:redis是内存数据库,而B+ ...
- 面试热点话题:聊聊MySQL索引“B+Tree”的前世今生,
小伙伴想精准查找自己想看的MySQL文章?喏 → MySQL江湖路 | 专栏目录 面试一说起MySQL,我们总会提到B+Tree索引,你对B+Tree索引了解么,它有哪些特性,优势在哪里,和B树有 ...
- mysql索引和redis比较_聊聊Mysql索引和redis跳表
摘要 面试时,交流有关mysql索引问题时,发现有些人能够涛涛不绝的说出B+树和B树,平衡二叉树的区别,却说不出B+树和hash索引的区别.这种一看就知道是死记硬背,没有理解索引的本质.本文旨在剖析这 ...
- 聊聊mysql唯一索引的哪些坑,为什么还是产生重复数据?
前言 前段时间我踩过一个坑:在mysql8的一张innodb引擎的表中,加了唯一索引,但最后发现数据竟然还是重复了. 到底怎么回事呢? 本文通过一次踩坑经历,聊聊唯一索引,一些有意思的知识点. 1.还 ...
- mysql为什么用b加树_为什么MySQL要用B+树?聊聊B+树与硬盘的前世今生【宇哥带你玩转MySQL 索引篇(二)】...
为什么MySQL要用B+树?聊聊B+树与硬盘的前世今生 在上一节,我们聊到数据库为了让我们的查询加速,通过索引方式对数据进行冗余并排序,这样我们在使用时就可以在排好序的数据里进行快速的二分查找,使得查 ...
- 关于MySQL索引面试题的6连炮!招架的住吗?
往期热门文章: 1.<往期精选优秀博文都在这里了!> 2.真香!IDEA 最新版本,支持免打扰和轻量模式! 3.微服务如何防止雪崩?阿里开源之Sentinel限流.熔断来帮你! 4.为什么 ...
- ElasticSearch 索引 VS MySQL 索引
前言 这段时间在维护产品的搜索功能,每次在管理台看到 elasticsearch 这么高效的查询效率我都很好奇他是如何做到的. 这甚至比在我本地使用 MySQL 通过主键的查询速度还快. 为此我搜索了 ...
- wsl ubuntu拒绝访问_一起聊聊WSL的那些事儿(下)
前文回顾:一起聊聊WSL的那些事儿(上) 文件系统 在WSL这个feature刚出来的时候,很多人都抢着装上了这个特性,包括笔者的同学们都争先恐后的体验这个特性,不过最后都成了黑子,因为大家发现Fil ...
- mysql索引 和 es索引_MySQL索引 VS ElasticSearch索引
今天MySQL数据库栏目介绍MySQL索引与ElasticSearch索引的对比. 前言 这段时间在维护产品的搜索功能,每次在管理台看到 elasticsearch 这么高效的查询效率我都很好奇他是如 ...
最新文章
- 数据结构——第一章线性表:01线性表的逻辑结构
- 揽货最短路径解决方案算法 - C# 蚁群优化算法实现
- MySQL数据库 --基础
- 销售软件服务器设置,销售软件服务器
- OpenCV中的三种图像数据结构CvMat, IplImage和Mat(二)IplImage
- 【实用工具】之移除PDF的密码PDF Password Remover 3.0 汉化版
- 16 岁赚到 20 万美元,我的编程之路始于对代码的热爱
- Facebook首次披露自研AI芯片细节:为视频而生,LeCun挂帅
- Java http处理get请求,参数中带特殊字符处理方式
- 微信蓝牙协议二:1800 or 18914E结尾和Varint压缩算法
- Java概 述(新手专区)
- config.o:文件无法辨识_HAZOP有哪些局限性,及系统生命周期不同阶段的危险辨识...
- 小D课堂 - 新版本微服务springcloud+Docker教程_4-05 微服务调用方式之feign 实战 订单调用商品服务...
- teigha开发从入门到精通(3)-- 编译drawings sdk示例
- 图文展示目标检测的现代发展历史
- 2010年中考英语写作高分指导
- Android Xml解析
- “繁盛计划”,纾困中国餐饮难题背后的美团式解法
- 现场总线技术笔记——3、通用串行端口的数据通信(RS232、RS485)
- 什么是php-fpm
热门文章
- java 最近将工作中用到的工具总结——日期工具
- maven 插件在线安装
- db_recovery_file_dest_size 修改大一点及删除归档日志 |转|
- Struts2+Spring2框架开发的菜鸟绝对能看得懂的用户登录程序 (2)
- [整理I]精选微软等公司数据结构+算法面试100题 [第1-40题]
- 远程桌面mstsc /console(/admin) 的运用
- 卸载shockwave flash插件
- C项目实践--俄罗斯方块(2)
- 大话算法-排序-归并排序
- python基础:冒泡和选择排序算法实现