本文主要概述mysql的覆盖索引,以及几种常见的优化场景

内容概要

  • 聚集索引和辅助索引
  • 什么是覆盖索引
  • 几种优化场景
  • 总体建议

聚集索引和辅助索引

  • 聚集索引(主键索引)
—innodb存储引擎是索引组织表,即表中的数据按照主键顺序存放。而聚集索引就是按照每张表的主键构造一颗B+树,同时叶子节点中存放的即为整张表的记录数据
—聚集索引的叶子节点称为数据页,数据页,数据页!重要的事说三遍。聚集索引的这个特性决定了索引组织表中的数据也是索引的一部分。
  • 辅助索引(二级索引)
—非主键索引
—叶子节点=键值+书签。Innodb存储引擎的书签就是相应行数据的主键索引值
辅助索引检索数据图示如下
由于检索数据时,总是先获取到书签值(主键值),再返回查询,因此辅助索引也被称之为二级索引

什么是覆盖索引

覆盖索引(covering index)指一个查询语句的执行只需要从辅助索引中就可以得到查询记录,而不需要查询聚集索引中的记录。也可以称之为实现了索引覆盖。
那么,优点显而易见。辅助索引不包含一整行的记录,因此可以大大减少IO操作。覆盖索引是mysql dba常用的一种SQL优化手段
先看一个简单示例
从执行计划看到,这个SQL语句只通过索引,就取到了所需要的数据,这个过程,就称为索引覆盖

几种优化场景

1、无where条件的查询优化

如下这个查询
执行计划中,type为ALL,代表进行了全表扫描,扫描的行数也与表的行数一致
如何改进?优化措施很简单,就是对这个查询列建立索引。如下,
mysql> alter table t1 add key(staff_id);

我们再看一下优化之后的效果

  • 执行计划
mysql> explain select sql_no_cache count(staff_id) from t1\G
*************************** 1. row ***************************id: 1select_type: SIMPLEtable: t1type: index
possible_keys: NULLkey: staff_idkey_len: 1ref: NULLrows: 10238491 row in set (0.00 sec)

Using index表示使用到了索引

  • 查询消耗
从时间消耗上来看,才100W的数据,已经有了比较明显的差别了
执行计划解读如下:
Possible_keys为null,说明没有where条件时优化器无法通过索引检索数据;
但是这里使用了索引的另外一个优点,即从索引中获取数据,减少了读取的数据块的数量
无where条件的查询,可以通过索引来实现索引覆盖查询,但前提条件是,查询返回的字段数足够少,更不用说select *之类的了。毕竟,建立key length过长的索引,始终不是一件好事情。

2、二次检索优化

如下这个查询,
 mysql> select sql_no_cache rental_date from t1 where inventory_id<80000;
…
…
| 2005-08-23 15:08:00 |
| 2005-08-23 15:09:17 |
| 2005-08-23 15:10:42 |
| 2005-08-23 15:15:02 |
| 2005-08-23 15:15:19 |
| 2005-08-23 15:16:32 |
+---------------------+
79999 rows in set (0.13 sec)

执行计划:

mysql> explain select sql_no_cache rental_date from t1 where inventory_id<80000\G
*************************** 1. row ***************************id: 1select_type: SIMPLEtable: t1type: range
possible_keys: inventory_idkey: inventory_idkey_len: 3ref: NULLrows: 153734Extra: Using index condition
1 row in set (0.00 sec)

从执行计划,我们看到,这个SQL其实是使用到了索引的,虽然查询的数据量很大,但是相对比全表扫描的性能消耗,优化器还是选择了索引。

更优的改进措施?
从上面执行计划中,我们发现Extra信息为Using index condition而不是Using index,这说明,使用的检索方式为二级检索,即79999个书签值被用来进行回表查询。可想而知,还是会有一定的性能消耗的
尝试针对这个SQL建立联合索引,如下
mysql> alter table t1 add key(inventory_id,rental_date);

这个联合索引前置列为where子句的检索字段,第二个字段为查询返回的字段。下面来看下效果如何。

为避免优化器对索引的选择出现偏差,我们首先收集一下统计信息
mysql> analyze table t1\G
*************************** 1. row ***************************Table: sakila.t1Op: analyze
Msg_type: status
Msg_text: OK
1 row in set (0.03 sec)

执行计划

mysql> explain select sql_no_cache rental_date from t1 where inventory_id<80000\G
*************************** 1. row ***************************id: 1select_type: SIMPLEtable: t1type: range
possible_keys: inventory_id,inventory_id_2key: inventory_id_2key_len: 3ref: NULLrows: 1628841 row in set (0.00 sec)
同样是使用索引,但这里的提示信息为Using index而不是Using index condition。这代表没有了回表查询的过程,也就是实现了索引覆盖

查询消耗

mysql> select sql_no_cache rental_date from t1 where inventory_id<80000;
…
…
| 2005-08-23 15:08:00 |
| 2005-08-23 15:09:17 |
| 2005-08-23 15:10:42 |
| 2005-08-23 15:15:02 |
| 2005-08-23 15:15:19 |
| 2005-08-23 15:16:32 |
+---------------------+
79999 rows in set (0.09 sec)

从执行时间上来看,快了大约40ms,虽然只有40ms,但在实际的生产环境下,却可能会因系统的总体负载被无限放大。

和前面场景限制类似,当where条件与查询字段总数较少的情况下,使用这种优化建议,是个不错的选择。

3、分页查询优化

分页查询的优化,相信大部分的DBA同学都碰到过,通常比较常规的优化手段就是查询改写,这里主要介绍一下新的思路,就是通过索引覆盖来优化
如下这个查询场景
mysql> select tid,return_date from t1 order by inventory_id limit 50000,10;
+-------+---------------------+
| tid   | return_date         |
+-------+---------------------+
| 50001 | 2005-06-17 23:04:36 |
| 50002 | 2005-06-23 03:16:12 |
| 50003 | 2005-06-20 22:41:03 |
| 50004 | 2005-06-23 04:39:28 |
| 50005 | 2005-06-24 04:41:20 |
| 50006 | 2005-06-22 22:54:10 |
| 50007 | 2005-06-18 07:21:51 |
| 50008 | 2005-06-25 21:51:16 |
| 50009 | 2005-06-21 03:44:32 |
| 50010 | 2005-06-19 00:00:34 |
+-------+---------------------+
10 rows in set (0.75 sec)

在未优化之前,我们看到它的执行计划是如此的糟糕

mysql> explain select tid,return_date from t1 order by inventory_id limit 50000,10\G
*************************** 1. row ***************************id: 1select_type: SIMPLEtable: t1type: ALL
possible_keys: NULLkey: NULLkey_len: NULLref: NULLrows: 10236751 row in set (0.00 sec)

全表扫描,加上额外的排序,相信产生的性能消耗是不低的

如何通过覆盖索引优化呢?
我们创建一个索引,包含排序列以及返回列,由于tid是主键字段,因此,下面的复合索引就包含了tid的字段值

mysql> alter table t1 add index liu(inventory_id,return_date);
Query OK, 0 rows affected (3.11 sec)
Records: 0  Duplicates: 0  Warnings: 0mysql> analyze table t1\G
*************************** 1. row ***************************Table: sakila.t1Op: analyze
Msg_type: status
Msg_text: OK
1 row in set (0.04 sec)

那么,效果如何呢?

mysql> select tid,return_date from t1 order by inventory_id limit 50000,10;
+-------+---------------------+
| tid   | return_date         |
+-------+---------------------+
| 50001 | 2005-06-17 23:04:36 |
| 50002 | 2005-06-23 03:16:12 |
| 50003 | 2005-06-20 22:41:03 |
| 50004 | 2005-06-23 04:39:28 |
| 50005 | 2005-06-24 04:41:20 |
| 50006 | 2005-06-22 22:54:10 |
| 50007 | 2005-06-18 07:21:51 |
| 50008 | 2005-06-25 21:51:16 |
| 50009 | 2005-06-21 03:44:32 |
| 50010 | 2005-06-19 00:00:34 |
+-------+---------------------+
10 rows in set (0.03 sec)
可以发现,添加复合索引后,速度提升0.7s!
我们看一下改进后的执行计划
mysql> explain select tid,return_date from t1 order by inventory_id limit 50000,10\G
*************************** 1. row ***************************id: 1select_type: SIMPLEtable: t1type: index
possible_keys: NULLkey: liukey_len: 9ref: NULLrows: 500101 row in set (0.00 sec)

执行计划也可以看到,使用到了复合索引,并且不需要回表

接下来,我们对比一下,索引覆盖与常规优化手段的效果差异
为了让结果更明显,我将查询修改为 limit 800000,10
现在看一下,通过覆盖索引查询的性能消耗
mysql> select tid,return_date from t1 order by inventory_id limit 800000,10;
+--------+---------------------+
| tid    | return_date         |
+--------+---------------------+
| 800001 | 2005-08-24 13:09:34 |
| 800002 | 2005-08-27 11:41:03 |
| 800003 | 2005-08-22 18:10:22 |
| 800004 | 2005-08-22 16:47:23 |
| 800005 | 2005-08-26 20:32:02 |
| 800006 | 2005-08-21 14:55:42 |
| 800007 | 2005-08-28 14:45:55 |
| 800008 | 2005-08-29 12:37:32 |
| 800009 | 2005-08-24 10:38:06 |
| 800010 | 2005-08-23 12:10:57 |
+--------+---------------------+

与之对比的是如下改写SQL方式

改写后的sql如下,思想是通过索引消除排序
select a.tid,a.return_date from  t1 a
inner join
(select tid from t1 order by  inventory_id limit 800000,10) b on a.tid=b.tid;

并在此基础上,我们为inventory_id列创建索引,并删除之前的覆盖索引

mysql> alter table t1 add index idx_inid(inventory_id),drop index liu;

然后收集统计信息。

查询消耗如下

mysql> select a.tid,a.return_date from  t1 a inner join  (select tid from t1 order by  inventory_id limit 800000,10) b on a.tid=b.tid;
+--------+---------------------+
| tid    | return_date         |
+--------+---------------------+
| 800001 | 2005-08-24 13:09:34 |
| 800002 | 2005-08-27 11:41:03 |
| 800003 | 2005-08-22 18:10:22 |
| 800004 | 2005-08-22 16:47:23 |
| 800005 | 2005-08-26 20:32:02 |
| 800006 | 2005-08-21 14:55:42 |
| 800007 | 2005-08-28 14:45:55 |
| 800008 | 2005-08-29 12:37:32 |
| 800009 | 2005-08-24 10:38:06 |
| 800010 | 2005-08-23 12:10:57 |
+--------+---------------------+

可以看到,这种优化手段较前者时间消耗多了大约140ms。

这种优化手段虽然使用索引消除了排序,但是还是要通过主键值回表查询。因此,在select返回列较少或列宽较小的时候,我们可以通过建立复合索引的方式优化分页查询,效果更佳,因为它不需要回表!

总体建议

索引具有以下两大用处:
1、通过索引检索仅需要数据
2、从索引中直接获取查询结果
覆盖索引的优势,就是利用到索引的第二大用处,在某些场景下,具有意想不到的优化效果。个人总结如下:
  • Select查询的返回列包含在索引列中
  • 有where条件时,where条件中要包含索引列或复合索引的前导列
  • 查询结果的总字段长度可以接受
from: https://yq.aliyun.com/articles/62419

MySQL 覆盖索引相关推荐

  1. MySQL覆盖索引(Covering Index)

    MySQL覆盖索引(Covering Index) mysql高效索引之覆盖索引 概念 如果索引包含所有满足查询需要的数据的索引成为覆盖索引(Covering Index),也就是平时所说的不需要回表 ...

  2. MySQL 覆盖索引、最左前缀原则、索引下推

    1.覆盖索引 1.1 概念 索引是高效找到行的一个方法,当能通过检索索引就可以读取想要的数据,那就不需要再到数据表中读取行了.如果一个索引包含了(或覆盖了)满足查询语句中字段与条件的数据就叫做覆盖索引 ...

  3. mysql覆盖索引二次查找_mysql中关于覆盖索引的知识点总结

    如果一个索引包含(或覆盖)所有需要查询的字段的值,称为'覆盖索引'. 覆盖索引是一种非常强大的工具,能大大提高查询性能,只需要读取索引而不需要读取数据,有以下优点: 1.索引项通常比记录要小,所以My ...

  4. 简单易懂的MySQL覆盖索引、前缀索引、索引下推

    文章目录 前言 常见的索引类型 聚簇索引/非聚簇索引 覆盖索引 前缀索引 索引下推 前言 索引的出现是为了提高数据查询效率,像书的目录一样.对于数据库的表而言,索引其实就是"目录" ...

  5. MySQL 覆盖索引(Cover Index)

    概述 一个索引包含了所有需要查询的字段值,那么就称为覆盖索引. 好处 索引的大小通常远小于数据行大小,所以如果只需要读取索引,那么MySQL会极大的减少数据访问量. 索引是按照值得顺序存储的. Inn ...

  6. mysql覆盖索引详解

    如果一个索引包含(或覆盖)所有需要查询的字段的值,称为'覆盖索引'.即只需扫描索引而无须回表. 只扫描索引而无需回表的优点: 1.索引条目通常远小于数据行大小,只需要读取索引,则mysql会极大地减少 ...

  7. mysql覆盖索引解决模糊查询失效_关于MySQL的SQL优化之覆盖索引

    前些天,有个同事跟我说:"我写了个SQL,SQL很简单,但是查询速度很慢,并且针对查询条件创建了索引,然而索引却不起作用,你帮我看看有没有办法优化?". 我对他提供的case进行了 ...

  8. Mysql 覆盖索引及其使用注意事项

    一,什么叫覆盖索引 网上对覆盖索引的定义有如下三种: 解释一: 就是select的数据列只用从索引中就能够取得,不必从数据表中读取,换句话说查询列要被所使用的索引覆盖. 解释二: 索引是高效找到行的一 ...

  9. MySQL覆盖索引:直接从索引查询到了数据

    标志:覆盖索引的标志  extra的using index ; 定义:sql直接从索引查找到了数据  没有去数据表查找  就是索引覆盖了 就是覆盖索引 结合:有using where和using id ...

最新文章

  1. 如何对 Rocksdb以及类似存储引擎社区 提出 有效的性能问题?
  2. DockOne微信分享(八十四):Docker在B站的实施之路
  3. OC中的几种延迟执行方式
  4. 优酷视频如何进行连续播放?
  5. Guava链式风格Ordering比较器实例
  6. 聚类分析在用户行为中的实例_基于行为数据的消费信贷反欺诈方案
  7. Python报错it could not find or load the Qt platform plugin windows
  8. jsp页面什么时候用 .do 和 .jsp
  9. Python查找中国城市、省份
  10. 2022SPSSPRO认证杯数学建模B题第二阶段方案及赛后总结:唐宋诗的定量分析与比较研究
  11. android studio 读取短信
  12. Quartus II :1位全加器设计
  13. vim的文件比较功能
  14. C语言中带负数的除法
  15. Swift之代码优化
  16. L1:一维圣维南方程
  17. 为什么单个元素的元组要加上逗号?
  18. 关于carsim2016破解问题
  19. 通达信l2接口是什么意思?
  20. 云基础设施之硬件安全威胁

热门文章

  1. Lesson 2.张量的索引、分片、合并以及维度调整
  2. vue笔记整理与总结
  3. 实战 | 深度学习轻松学:如何用可视化界面来部署深度学习模型 转载 2017年12月27日 00:00:00 109 翻译 | AI科技大本营 参与 | 王赫 上个月,我有幸结识了 DeepCogn
  4. 使用Pandas进行变量衍生
  5. @springbootapplication 注解_Spring Boot最核心的27个干货注解,你了解多少?
  6. 三、【线性表】线性表概述
  7. 深入理解分布式技术 - 理论基石 CAP
  8. Spring Cloud【Finchley】-10Hystrix监控
  9. 实战SSM_O2O商铺_14【商铺注册】View层之验证码kaptcha组件
  10. Linux-SFTP/SSH免密码登录