Mysql——索引底层数据结构与Explain用法

一、索引底层数据结构
- 1、Mysql不同引擎对应的数据结构
- 2、B+Tree数据结构
- - 2.1、二叉树（Binary Search Trees）
  - 2.2、红黑树（Red-Black Trees）
  - 2.3、 B-Tree
  - 2.4、 B+Tree
二、Explain用法
- 1、Explain工具介绍
- 2、Explain分析
- - 2.1、explain 两种扩展
  - - 2.1.1 、explain extended
    - 2.1.2 、explain partitions
  - 2.2、explain中每个列的信息
  - - 1.id列
    - 2.select_type列
    - 3. table列
    - 4. type列
    - 5. possible_keys列
    - 6. key列
    - 7. key_len列
    - 8. ref列
    - 9. rows列
    - 10. Extra列

一、索引底层数据结构

1、Mysql不同引擎对应的数据结构

Mysql索引主要有两种结构：B+Tree索引和Hash索引

Inodb存储引擎默认是 B+Tree索引
MyISAM 存储引擎默认是Fulltext索引；
Memory 存储引擎默认 Hash索引；

因为Inodb存储引擎是最常用的引擎，这里主要对它的讲解

2、B+Tree数据结构

接下来说说它为什么要用B+Tree。

索引是什么？
索引是一种，排好序的数据结构，可以帮助我们快速获取到要查询的数据。
所以，索引底层数据结构的特点就是：要快速查询到数据。

2.1、二叉树（Binary Search Trees）

在一组数据中，要快速找到想要的数据，大家可能会想到最常见的数据结构：二叉树。
二叉树的特点：都是从最上面数开始，大于它的在右边，小于它的在左边，就这么一层层下去。

建立二叉树的时候，大于它的在右边，小于它的在左边。
弊端：
对于我们数据库的使用场景，我们插入数据，经常都是建立自增的数据，从1开始自增正无穷。
二叉树数据结构：变成了所有的数都向右边插入，那么这样的数据结构，对我们查询来说，就一点优势都不存在了，所以不采用这种二叉树数据结构。

2.2、红黑树（Red-Black Trees）

红黑树数据结构的特点：在二叉树的基础上可以自动平衡树的结构，不会像上面二叉树出现一条线的情况。

弊端：
当数据很多的时候，树的高度会变很高，而且自动平衡树的结构也要消耗性能。
每一个箭头，就代表一次寻址，一次磁盘IO，在数据库查询数据，磁盘IO是很耗时间的一件事。因为红黑树的高度不可控，IO次数不可控，所以不采用这种数据结构。

2.3、 B-Tree

B-Tree数据结构的高度，是可控的，最多就是4层。这就减少了IO次数，可以控制在4次以内。

弊端：
在数据库查询中，我们经常会用的到范围查询，比如要查询大于3小于10的数据，这样的应用场景，B-Tee数据结构就不太方便，则需要进行每一层的递归遍历。相邻的元素可能在内存中不相邻，所以就产生了B+Tree的数据结构。

2.4、 B+Tree

B+Tree 结构，解决了范围查找这个难题，它在最下面的叶子节点之间增加一个链指针。

在确定了数据结构，看看MySQL具体怎么运用它的。
在InnoDB引擎中，必须有主键索引(聚簇索引)，如果没有，MySQL会自己建立一个默认的索引。
主键索引的数据结构如下图：它的叶子节点是data（也就是数据表中那一行所有的数据），非叶子节点是索引列。

非主键索引：它的叶子节点是主键，非叶子节点是索引列。

通过上述的数据结构可知道，很多场景，我们通过非主键索引查询数据，先查到叶子节点里的主键，还要再拿着主键去主键索引里查询data数据。很多情况是要通过两次索引的。

注意：mysql在查询时候，会吧非叶子节点，都加载到内存中，然后再内存中寻址，非常的快。所以我们在建立索引的时候，索引列不能太大。

分享一个演示数据结构的网站
https://www.cs.usfca.edu/~galles/visualization/Algorithms.html

二、Explain用法

在MySQL的调优中，我们就要用到Explain。

1、Explain工具介绍

使用EXPLAIN关键字可以模拟优化器执行SQL语句，分析你的查询语句或是结构的性能瓶颈
在 select 语句之前增加 explain 关键字，MySQL 会在查询上设置一个标记，执行查询会返回执行计划的信息，而不是执行这条SQL
注意：如果 from 中包含子查询，仍会执行该子查询，将结果放入临时表中

2、Explain分析

我执行：

mysql> explain select * from actor;

会出现如下数据：

2.1、explain 两种扩展

2.1.1 、explain extended

会在 explain 的基础上额外提供一些查询优化的信息。紧随其后通过 show warnings 命令可
以得到优化后的查询语句，从而看出优化器优化了什么。额外还有 filtered 列，是一个半分比的值，rows *filtered/100 可以估算出将要和 explain 中前一个表进行连接的行数（前一个表指 explain 中的id值比当前表id值小的表）。

mysql> explain extended select * from film where id = 1;

mysql> show warnings;

2.1.2 、explain partitions

相比 explain 多了个 partitions 字段，如果查询是基于分区表的话，会显示查询将访问的分区。

2.2、explain中每个列的信息

1.id列

id列的编号是 select 的序列号，有几个 select 就有几个id，并且id的顺序是按 select 出现的顺序增长的。id列越大执行优先级越高，id相同则从上往下执行，id为NULL最后执行。

2.select_type列

select_type 表示对应行是简单还是复杂的查询。

simple：简单查询。查询不包含子查询和union
primary：复杂查询中最外层的 select
subquery：包含在 select 中的子查询（不在 from 子句中）
derived：包含在 from 子句中的子查询。MySQL会将结果存放在一个临时表中，也称为派生表（derived的英文含义）
union：在 union 中的第二个和随后的 select

3. table列

这一列表示 explain 的一行正在访问哪个表。
当 from 子句中有子查询时，table列是格式，表示当前查询依赖 id=N 的查询，于是先执行 id=N 的查询。
当有 union 时，UNION RESULT 的 table 列的值为<union1,2>，1和2表示参与 union 的 select 行id。

4. type列

这一列表示关联类型或访问类型，即MySQL决定如何查找表中的行，查找数据行记录的大概范围。
依次从最优到最差分别为：system > const > eq_ref > ref > range > index > ALL
一般来说，得保证查询达到range级别，最好达到ref

NULL：mysql能够在优化阶段分解查询语句，在执行阶段用不着再访问表或索引。例如：在索引列中选取最小值，可以单独查找索引来完成，不需要在执行时访问表。

const, system： mysql能对查询的某部分进行优化并将其转化成一个常量（可以看show warnings 的结果）。用于primary key 或 unique key 的所有列与常数比较时，所以表最多有一个匹配行，读取1次，速度比较快。system是const的特例，表里只有一条元组匹配时为system

eq_ref： primary key 或 unique key 索引的所有部分被连接使用，最多只会返回一条符合条件的记录。这可能是在const 之外最好的联接类型了，简单的 select 查询不会出现这种 type。

ref： 相比 eq_ref，不使用唯一索引，而是使用普通索引或者唯一性索引的部分前缀，索引要和某个值相比较，可能会找到多个符合条件的行。

range： 范围扫描通常出现在 in(), between ,> ,<, >= 等操作中。使用一个索引来检索给定范围的行。

index： 扫描全索引就能拿到结果，一般是扫描某个二级索引，这种扫描不会从索引树根节点开始快速查找，而是直接对二级索引的叶子节点遍历和扫描，速度还是比较慢的，这种查询一般为使用覆盖索引，二级索引一般比较小，所以这种通常比ALL快一些。

**ALL：**即全表扫描，扫描你的聚簇索引的所有叶子节点。通常情况下这需要增加索引来进行优化了。

5. possible_keys列

这一列显示查询可能使用哪些索引来查找。
explain 时可能出现 possible_keys 有列，而 key 显示 NULL 的情况，这种情况是因为表中数据不多，mysql认为索引对此查询帮助不大，选择了全表查询。
如果该列是NULL，则没有相关的索引。在这种情况下，可以通过检查 where 子句看是否可以创造一个适当的索引来提高查询性能，然后用 explain 查看效果。

6. key列

这一列显示mysql实际采用哪个索引来优化对该表的访问。
如果没有使用索引，则该列是 NULL。如果想强制mysql使用或忽视possible_keys列中的索引，在查询中使用 force index、ignore index。

7. key_len列

这一列显示了mysql在索引里使用的字节数，通过这个值可以算出具体使用了索引中的哪些列。
举例来说，film_actor的联合索引 idx_film_actor_id 由 film_id 和 actor_id 两个int列组成，并且每个int是4字节。通过结果中的key_len=4可推断出查询使用了第一个列：film_id列来执行索引查找。

8. ref列

这一列显示了在key列记录的索引中，表查找值所用到的列或常量，常见的有：const（常量），字段名（例：film.id）

9. rows列

这一列是mysql估计要读取并检测的行数，注意这个不是结果集里的行数。

10. Extra列

这一列展示的是额外信息。常见的重要值如下：
Using index：使用覆盖索引
Using where：使用 where 语句来处理结果，并且查询的列未被索引覆盖
Using index condition：查询的列不完全被索引覆盖，where条件中是一个前导列的范围；
Using temporary：mysql需要创建一张临时表来处理查询。出现这种情况一般是要进行优化的，首先是想到用索引来优化。
Using filesort：将用外部排序而不是索引排序，数据较小时从内存排序，否则需要在磁盘完成排序。这种情况下一般也是要考虑使用索引来优化的。
Select tables optimized away：使用某些聚合函数（比如 max、min）来访问存在索引的某个字段是

Mysql——索引底层数据结构与Explain用法相关推荐

面试官：MySQL索引底层数据结构原理与性能调优，你能回答多少？
哈喽!大家好,我是小奇,一位不靠谱的程序员小奇打算以轻松幽默的对话方式来分享一些技术,如果你觉得通过小奇的文章学到了东西,那就给小奇一个赞吧文章持续更新,可以微信搜索[小奇JAVA面试]第一时间阅 ...
MySQL索引底层数据结构
MySQL相信大家都不陌生,索引的日常使用应该也是比较频繁的,今天就聊一聊索引底层的数据结构; MySQL索引底层为什么使用B+树而不是二叉树;红黑树;B树? 索引:索引是帮助MySQL高效获取数据的 ...
深入理解Mysql索引底层数据结构与算法
索引索引是帮助MySQL高效获取数据的排好序的数据结构(容易忽略的点:排好序)(形象点就是教科书的目录) 索引存储在文件里(也就是说有IO操作) 索引结构: 这里说说在几种数据结构中,mysql为什 ...
mysql索引数据结构图解_深入理解Mysql索引底层数据结构与算法
索引的定义:索引(Index)是帮助MySQL高效获取数据的数据结构. Q1:大家使用索引有没有想过这个问题?为什么索引能够帮助mysql高效获取数据?我一一给大家道来!在给大家讲之前,先更大家分享一 ...
MySQL 索引底层数据结构实现
文章目录概述讨论范围查询数据结构查询数据结构种类及其高性能查询原理 MySQL 索引的底层数据结构 MySQL 索引的需求分析选择 MySQL 索引的底层数据结构 B- 树和 B+ 树的对比 ...
mysql 联合主键_深入理解Mysql索引底层数据结构与算法，背后的故事
引言索引是帮助MySQL高效获取数据的排好序的数据结构索引数据结构对比二叉树左边子节点的数据小于父节点数据,右边子节点的数据大于父节点数据.如果col2是索引,查找索引为89的行元素,那么只需 ...
mysql 索引底层数据结构与算法
索引:是帮助MySQL高效获取数据的排好序的数据结构. mysql 索引的底层数据结构: 二叉树:如果是规律性数据,比如1,2,3.....等数据,存储容易成线性结构,数据规模太大之后,查询太慢. 红 ...
MySQL索引底层数据结构原理剖析
一. 前言 1. 说明我们平时所说的:聚集索引(主键索引),次要索引,覆盖索引,复合索引,前缀索引,唯一索引在MySQL5.7和 8.0版本默认都是使用B+Tree索引,除此之外还有 Hash索引. ...
MySQL索引底层数据结构详解
索引是帮助MySQL高效获取数据的排好序的数据结构索引的数据结构: 1.二叉树通过一个简单的插入你可以看到,二叉树的插入会根据每个节点进行判断,每一个节点右边的数据一定是大于等于这个节点数据,而他 ...

Mysql——索引底层数据结构与Explain用法

Mysql——索引底层数据结构与Explain用法

一、索引底层数据结构

1、Mysql不同引擎对应的数据结构

2、B+Tree数据结构

2.1、二叉树（Binary Search Trees）

2.2、红黑树（Red-Black Trees）

2.3、 B-Tree

2.4、 B+Tree

二、Explain用法

1、Explain工具介绍

2、Explain分析

2.1、explain 两种扩展

2.1.1 、explain extended

2.1.2 、explain partitions

2.2、explain中每个列的信息

1.id列

2.select_type列

3. table列

4. type列

5. possible_keys列

6. key列

7. key_len列

8. ref列

9. rows列

10. Extra列

Mysql——索引底层数据结构与Explain用法相关推荐

最新文章

热门文章

Mysql——索引底层数据结构与Explain用法

Mysql——索引底层数据结构与Explain用法

一、索引底层数据结构

1、Mysql不同引擎对应的数据结构

2、B+Tree数据结构

2.1、 二叉树 （Binary Search Trees）

2.2、 红黑树（Red-Black Trees）

2.3、 B-Tree

2.4、 B+Tree

二、Explain用法

1、Explain工具介绍

2、Explain分析

2.1、explain 两种扩展

2.1.1 、explain extended

2.1.2 、explain partitions

2.2、explain中每个列的信息

1.id列

2.select_type列

3. table列

4. type列

5. possible_keys列

6. key列

7. key_len列

8. ref列

9. rows列

10. Extra列

Mysql——索引底层数据结构与Explain用法相关推荐

最新文章

热门文章

2.1、二叉树（Binary Search Trees）

2.2、红黑树（Red-Black Trees）