EXPLAIN 详解

  • 一、概述
    • 1.1、概述
  • 二、基本语法
  • 三、数据准备
    • 1. 建表
    • 2. 设置参数 log_bin_trust_function_creators
    • 3. 创建函数
    • 4. 创建存储过程
    • 5. 调用存储过程
  • 四、EXPLAIN各列作用
    • 1. table
    • 2. id
    • 3. select_type
    • 4 .partitions (可略)
    • 5.type ☆
    • 6. possible_keys和key
    • 7. key_len ☆
    • 8. ref
    • 9. rows ☆
    • 10. filtered
    • 11. Extra ☆
    • 12. 小结
  • 五、EXPLAIN的进一步使用
    • 1、 EXPLAIN四种输出格式
      • 1. 传统格式
      • 2. JSON格式
      • 3. TREE格式
      • 4. 可视化输出
    • 2 、SHOW WARNINGS的使用

一、概述

1.1、概述

定位了查询慢的SQL之后,我们就可以使用EXPLAIN或DESCRIBE 工具做针对性的分析查询语句。DESCRIBE语句的使用方法与EXPLAIN语句是一样的,并且分析结果也是一样的。

MySQL中有专门负责优化SELECT语句的优化器模块,主要功能:通过计算分析系统中收集到的统计信息,为客户端请求的Query提供它认为最优的执行计划(他认为最优的数据检索方式,但不见得是DBA认为是最优的,这部分最耗费时间)。

这个执行计划展示了接下来具体执行查询的方式,比如多表连接的顺序是什么,对于每个表采用什么访问方法来具体执行查询等等。MySQL为我们提供了EXPLAIN语句来帮助我们查看某个查询语句的具体执行计划,大家看懂EXPLAIN语句的各个输出项,可以有针对性的提升我们查询语句的性能。

1.能做什么?

  • 表的读取顺序
  • 数据读取操作的操作类型。
  • 哪些索引可以使用
  • 哪些索引被实际使用
  • 表之间的引用
  • 每张表有多少行被优化器查询

2.官网介绍

https://dev.mysql.com/doc/refman/5.7/en/explain-output.html

https://dev.mysql.com/doc/refman/8.0/en/explain-output.html

3.版本情况

  • MySQL 5.6.3以前只能EXPLAIN SELECT;MYSQL 5.6.3以后就可以 EXPLAIN SELECTUPDATEDELETE
  • 在5.7以前的版本中,想要显示 partitions 需要使用 explain partitions 命令;想要显示filtered 需要使用 explain extended 命令。在5.7版本后,默认explain直接显示partitions和 filtered中的信息。

二、基本语法

EXPLAIN 或 DESCRIBE语句的语法形式如下

EXPLAIN SELECT select_options
或者
DESCRIBE SELECT select_options

如果我们想看看某个查询的执行计划的话,可以在具体的查询语句前边加一个 EXPLAIN ,就像这样:

mysql> EXPLAIN SELECT 1;

注意:执行EXPLAIN时并没有真正的执行该后面的语句,因此可以安全的查看执行计划。

EXPLAIN 语句输出的各个列的作用如下:

三、数据准备

1. 建表

CREATE TABLE s1 ( id INT AUTO_INCREMENT, key1 VARCHAR(100), key2 INT, key3 VARCHAR(100), key_part1 VARCHAR(100), key_part2 VARCHAR(100), key_part3 VARCHAR(100), common_field VARCHAR(100), PRIMARY KEY (id), INDEX idx_key1 (key1), UNIQUE INDEX idx_key2 (key2), INDEX idx_key3 (key3), INDEX idx_key_part(key_part1, key_part2, key_part3)
) ENGINE=INNODB CHARSET=utf8;
CREATE TABLE s2 ( id INT AUTO_INCREMENT, key1 VARCHAR(100), key2 INT, key3 VARCHAR(100), key_part1 VARCHAR(100), key_part2 VARCHAR(100), key_part3 VARCHAR(100), common_field VARCHAR(100), PRIMARY KEY (id), INDEX idx_key1 (key1), UNIQUE INDEX idx_key2 (key2),INDEX idx_key3 (key3), INDEX idx_key_part(key_part1, key_part2, key_part3)
) ENGINE=INNODB CHARSET=utf8;

2. 设置参数 log_bin_trust_function_creators

创建函数,假如报错,需开启如下命令:允许创建函数设置:

set global log_bin_trust_function_creators=1; # 不加global只是当前窗口有效。

3. 创建函数

DELIMITER //
CREATE FUNCTION rand_string1(n INT) RETURNS VARCHAR(255) #该函数会返回一个字符串
BEGINDECLARE chars_str VARCHAR(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFJHIJKLMNOPQRSTUVWXYZ'; DECLARE return_str VARCHAR(255) DEFAULT ''; DECLARE i INT DEFAULT 0; WHILE i < n DO SET return_str =CONCAT(return_str,SUBSTRING(chars_str,FLOOR(1+RAND()*52),1)); SET i = i + 1; END WHILE; RETURN return_str;
END //
DELIMITER ;

4. 创建存储过程

创建往s1表中插入数据的存储过程:

DELIMITER //
CREATE PROCEDURE insert_s1 (IN min_num INT (10),IN max_num INT (10))
BEGINDECLARE i INT DEFAULT 0; SET autocommit = 0; REPEAT SET i = i + 1; INSERT INTO s1 VALUES( (min_num + i), rand_string1(6), (min_num + 30 * i + 5), rand_string1(6), rand_string1(10), rand_string1(5), rand_string1(10), rand_string1(10)); UNTIL i = max_num END REPEAT; COMMIT;
END //
DELIMITER ;

创建往s2表中插入数据的存储过程:

DELIMITER //
CREATE PROCEDURE insert_s2 (IN min_num INT (10),IN max_num INT (10))
BEGINDECLARE i INT DEFAULT 0; SET autocommit = 0; REPEAT SET i = i + 1; INSERT INTO s2 VALUES( (min_num + i), rand_string1(6), (min_num + 30 * i + 5), rand_string1(6), rand_string1(10), rand_string1(5), rand_string1(10), rand_string1(10)); UNTIL i = max_num END REPEAT; COMMIT;
END //
DELIMITER ;

5. 调用存储过程

s1表数据的添加:加入1万条记录:

CALL insert_s1(10001,10000);

s2表数据的添加:加入1万条记录:

CALL insert_s2(10001,10000);

四、EXPLAIN各列作用

为了让大家有比较好的体验,我们调整了下 EXPLAIN 输出列的顺序。

1. table

不论我们的查询语句有多复杂,里边儿 包含了多少个表 ,到最后也是需要对每个表进行 单表访问 的,所以MySQL规定EXPLAIN语句输出的每条记录都对应着某个单表的访问方法,该条记录的table列代表着该表的表名(有时不是真实的表名字,可能是简称)。

2. id

我们写的查询语句一般都以 SELECT 关键字开头,比较简单的查询语句里只有一个 SELECT关键字,比如下边这个查询语句:

SELECT * FROM s1 WHERE key1 = 'a';

稍微复杂一点的连接查询中也只有一个 SELECT 关键字,比如

SELECT * FROM s1
INNER JOIN s2
ON s1.key1 = s2.key1
WHERE s1.common_field = 'a';
mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a';

mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2;

mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key1 FROM s2) OR key3 = 'a';


从输出结果中我们可以看到,s1表在外层查询中,外层查询有一个独立的SELECT关键字,所以第一条记录的id值就是1,s2表在子查询中,子查询有一个独立的SELECT 关键字,所以第二条记录的id值就是2。

但是这里大家需要特别注意,查询优化器可能对涉及子查询的查询语句进行重写,从而转换为连接查询。所以如果我们想知道查询优化器对某个包含子查询的语句是否进行了重写,直接查看执行计划就好了,比如说:

mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key2 FROM s2 WHERE common_field = 'a');


查询优化器可能对涉及子查询的查询语句进行重写,转变为多表查询的操作,所以这里 id只有一个,他将后面的子查询转换为 Join了,相当于只有一个select
可以看到,虽然我们的查询语句是一个子查询,但是执行计划中s1和s2表对应的记录的id值全部是1,这就表明了查询优化器将子查询转换为了连接查询。
对于包含UNION子句的查询语句来说,每个SELECT关键字对应一个id值也是没错的,不过还是有点儿特别的东西,比方说下边这个查询:

mysql> EXPLAIN SELECT * FROM s1 UNION SELECT * FROM s2;

mysql> EXPLAIN SELECT * FROM s1 UNION ALL SELECT * FROM s2;

小结:

  • id如果相同,可以认为是一组,从上往下顺序执行
  • 在所有组中,id值越大,优先级越高,越先执行
  • 关注点:id号每个号码,表示一趟独立的查询, 一个sql的查询趟数越少越好

3. select_type

一条大的查询语句里边可以包含若干个SELECT关键字,每个SELECT关键字代表着一个小的查询语句,而每个SELECT关键字的FROM子句中都可以包含若干张表(这些表用来做连接查询),每一张表都对应着执行计划输出中的一条记录,对于在同一个SELECT关键字中的表来说,它们的id值是相同的。

MySQL为每一个SELECT关键字代表的小查询都定义了一个称之为select.type的属性,意思是我们只要知道了某个小查询的select_type属性,就知道了这个小查询在整个大查询中扮演了一个什么角色,我们看一下select_type都能取哪些值,请看官方文档:I

具体分析如下:

查询语句中不包含UNION或者子查询的查询都算作是SIMPIE类型

mysql> EXPLAIN SELECT * FROM s1;


当然,连接查询也算是 SIMPLE 类型,比如:

mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2;

  • PRIMARY

    对于包含UNION或者UNION ALL或者子查询的大查询来说,它是由几个小查询组成的,其中最左边的查询的select type值就是PRIMARY

    对于包含UNION或者UNION ALL的大查询来说,它是由几个小查询组成的,其中除了最左边的那个小查询以外,其余的小查询的select_type值就是UNION

    MysQIL选择使用临时表来完成UNION查询的去重工作,针对该临时表的查询的select_type就是UNION RESULT

    mysql> EXPLAIN SELECT * FROM s1 UNION SELECT * FROM s2;
    

  • UNION

  • UNION RESULT

  • SUBQUERY
    子查询:
    如果包含子查询的查询语句不能够转为对应的semi-join’的形式,并且该子查询是不相关了该子查询的第一个SELECT关键字代表的那个查询的select_type就是SUBQUERY

    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key1 FROM s2) OR key3 = 'a';
    

  • DEPENDENT SUBQUERY
    如果包含子查询的查询语句不能够转为对应的semi-join'的形式,并且该子查询是相关子查询则该子查询的第一个SELECT关键字代表的那个查询的select type 就是DEPENDENT SUBQUER.

    注意的是,select _type为DEPENDENT SUBQUERY的查询可能会被执行多次。

    mysql> EXPLAIN SELECT * FROM s1
    WHERE key1 IN (SELECT key1 FROM s2 WHERE s1.key2 = s2.key2) OR key3 = 'a';
    

  • DEPENDENT UNION
    在包含UTNION或者UNION ALL的大查询中,如果各个小查询都依赖于外层查询的话,那除了最左边的那个小查询之外,其余的小查询的select type的值就是DEPENDENT’ UNION

    mysql> EXPLAIN SELECT * FROM s1
    WHERE key1 IN (SELECT key1 FROM s2 WHERE key1 = 'a' UNION SELECT key1 FROM s1 WHERE key1 = 'b');
    

  • DERIVED
    对于包含派生表的查询,该派生表对应的子查询的select type就是DERIVED

    mysql> EXPLAIN SELECT * FROM (SELECT key1, count(*) as c FROM s1 GROUP BY key1) AS derived_s1 where c > 1;
    

  • MATERIALIZED
    当查询优化器在执行包含子查询的语句时,选择将子查询物化之后与外层查询进行连接查询时,该子查询对应的select type属性就是MATERIALIZED

    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key1 FROM s2);#子查询装换为物化表
    

  • UNCACHEABLE SUBQUERY

    不常用,就不多说了。

  • UNCACHEABLE UNION
    不常用

4 .partitions (可略)

  • 代表分区表中的命中情况,非分区表,该项为NULL。一般情况下我们的查询语句的执行计划的partitions列的值都是NULL

  • 如果想详细了解,可以如下方式测试。创建分区表:

    -- 创建分区表,
    -- 按照id分区,id<100 p0分区,其他p1分区
    CREATE TABLE user_partitions (
    id INT auto_increment,
    NAME VARCHAR(12),
    PRIMARY KEY(id))
    PARTITION BY RANGE(id)( PARTITION p0 VALUES less than(100), PARTITION p1 VALUES less than MAXVALUE
    );
    

DESC SELECT * FROM user_partitions WHERE id>200;

查询id大于200(200>100,p1分区)的记录,查看执行计划,partitions是p1,符合我们的分区规则

5.type ☆

执行计划的一条记录就代表着MySQL对某个表的执行查询时的访问方法,又称"访问类型”,其中的type列就表明了这个访问方法是啥,是较为重要的一个指标。比如,看到type列的值是ref,表明MySQL即将使用ref访问方法来执行对s1表的查询。

完整的访问方法如下: system , const , eq_ref , ref , fulltext , ref_or_null ,index_merge , unique_subquery , index_subquery , range , index , ALL

我们详细解释一下:

system

当表中只有一条记录并且该表使用的存储引擎的统计数据是精确的,比如MyISAM、Memory,那么对该表的访问方法就是system。比方说我们新建一个MyISAM表,并为其插入一条记录:

mysql> CREATE TABLE t(i int) Engine=MyISAM;
Query OK, 0 rows affected (0.05 sec) mysql> INSERT INTO t VALUES(1);
Query OK, 1 row affected (0.01 sec)

然后我们看一下查询这个表的执行计划:

mysql> EXPLAIN SELECT * FROM t;


这个在 Innodb中就不是system了,因为MyIsam有专门统计数据量的变量

const
当我们根据主键或者唯一二级索引列与常数进行等值匹配时,对单表的访问方法就是const

mysql> EXPLAIN SELECT * FROM s1 WHERE id = 10005;

eq_ref

在连接查询时,如果被驱动表是通过主键或者唯一二级索引列等值匹配的方式进行访问的(如果该主键或者唯一二级索引是联合索引的话,所有的索引列都必须进行等值比较),则对该被驱动表的访问方法就是eq_ref

mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.id = s2.id;


从执行计划的结果中可以看出,MySQL打算将s2作为驱动表,s1作为被驱动表,重点关注s1的访问方法是 eq_ref ,表明在访问s1表的时候可以 通过主键的等值匹配 来进行访问。

ref
当通过普通的二级索引列与常量进行等值匹配时来查询某个表,那么对该表的访问方法就可能是ref

mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a';

fulltext

全文索引

ref_or_null

当对普通二级索引进行等值匹配查询,该索引列的值也可以是NULL值时,那么对该表的访问方法就可能是ref_or_null

mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' OR key1 IS NULL;

index_merge

单表访问方法时在某些场景下可以使用IntersectionUnionSort-Union这三种索引合并的方式来执行查询,就是这种用or的情况

mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' OR key3 = 'a';


从执行计划的 type 列的值是 index_merge就可以看出,MySQL 打算使用索引合并的方式来执行对 s1 表的查询。

unique_subquery

unique_subquery是针对在一些包含IN子查询的查询语句中,如果查询优化器决定将IN子查询转换为EXISTS子查询,而且子查询可以使用到主键进行等值匹配的话,那么该子查询执行计划的type列的值就是unique_subquery

mysql> EXPLAIN SELECT * FROM s1 WHERE key2 IN (SELECT id FROM s2 where s1.key1 = s2.key1) OR key3 = 'a';

index_subquery

mysql> EXPLAIN SELECT * FROM s1 WHERE common_field IN (SELECT key3 FROM s2 where s1.key1 = s2.key1) OR key3 = 'a';

range
如果使用索引获取某些范围区间的记录,那么就可能使用到range访问方法

mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN ('a', 'b', 'c');


或者:

mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'a' AND key1 < 'b';

index

当我们可以使用索引覆盖,但需要扫描全部的索引记录时,该表的访问方法就是index

mysql> EXPLAIN SELECT key_part2 FROM s1 WHERE key_part3 = 'a';


上述查询中的搜索列表中只有key_part2一个列,而且搜索条件中也只有key_part3一个列,这两个列又怡好包含在idx_key_part这个索引中,可是搜索条件key_part3不能直接使用该索引进行ref或者range方式的访问,只能扫描整个idx_key_part索引的记录,所以查询计划的type列的值就是index。

再一次强调,对于使用InnoDB存储引擎的表来说,二级索引的记录只包含索引列!和主键列的值,而聚簇索引中包含用户定义的全部列以及一些隐藏列,所以扫描二级索引的代价比直接全表扫描,也就是扫描聚簇索引的代价更低一些。

ALL

最熟悉的全表扫描

mysql> EXPLAIN SELECT * FROM s1;

小结:

**结果值从最好到最坏依次是: system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

其中比较重要的几个提取出来(见上图中的红色)。SQL 性能优化的目标:至少要达到 range 级别,要求是 ref 级别,最好是 consts级别。(阿里巴巴开发手册要求)**

6. possible_keys和key

在EXPLAIN语句输出的执行计划中,possible_keys列表示在某个查询语句中,对某个表执行单表查询时可能用到的索引有哪些。一般查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询使用。key列表示实际用到的索引有哪些,如果为NULL,则没有使用索引。比方说下边这个查询:

mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'z' AND key3 = 'a';

7. key_len ☆

key_len:实际使用到的索引长度(即:字节数)

帮你检查是否充分的利用上了索引值越大越好,主要针对于联合索引,有一定的参考意义。

mysql> EXPLAIN SELECT * FROM s1 WHERE id = 10005;

mysql> EXPLAIN SELECT * FROM s1 WHERE key2 = 10126;

mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a';

mysql> EXPLAIN SELECT * FROM s1 WHERE key_part1 = 'a';

mysql> EXPLAIN SELECT * FROM s1 WHERE key_part1 = 'a' AND key_part2 = 'b';

练习:

key_len的长度计算公式:

varchar(10)变长字段且允许NULL = 10 * ( character set: utf8=3,gbk=2,latin1=1)+1(NULL)+2(变长字段) varchar(10)变长字段且不允许NULL = 10 * ( character set:utf8=3,gbk=2,latin1=1)+2(变长字段) char(10)固定字段且允许NULL = 10 * ( character set:utf8=3,gbk=2,latin1=1)+1(NULL) char(10)固定字段且不允许NULL = 10 * ( character set:utf8=3,gbk=2,latin1=1)

8. ref

ref:当使用索引列等值查询时,与索引列进行等值匹配的对象信息。

比如只是一个常数或者是某个列。

mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a';

mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.id = s2.id;

mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s2.key1 = UPPER(s1.key1);

9. rows ☆

rows:预估的需要读取的记录条数,值越小越好

mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'z';

10. filtered

filtered: 某个表经过搜索条件过滤后再满足接下来条件记录的百分比,越大越好

如果使用的是索引执行的单表扫描,那么计算时需要估计出满足除使用到对应索引的搜索条件外的其他搜索条件的记录有多少条。

mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'z' AND common_field = 'a';


比如说上面这里先经过条件key1 > 'z'过滤后满足的记录条数是266条,但是满足接下来的common_field = 'a'条件的 记录数占比 10% .

对于单表查询来说,这个filtered列的值没什么意义,我们更关注在连接查询中驱动表对应的执行计划记录的filtered值,它决定了被驱动表要执行的次数(即:rows * filtered)

mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.key1 = s2.key1 WHERE s1.common_field = 'a';

11. Extra ☆

顾名思义,Extra列是用来说明一些额外信息的,包含不适合在其他列中显示但十分重要的额外信息。我们可以通过这些额外信息来更准确的理解MySQL到底将如何执行给定的查询语句。MySQL提供的额外信息有好几十个,我们就不一个一个介绍了,所以我们只挑比较重要的额外信息介绍给大家。

  • No tables used
    当查询语句的没有FROM子句时将会提示该额外信息,比如:
mysql> EXPLAIN SELECT 1;

  • Impossible WHERE
    查询语句的WHERE子句永远为FALSE时将会提示该额外信息

    mysql> EXPLAIN SELECT * FROM s1 WHERE 1 != 1;
    

  • Using where
    当我们使用全表扫描来执行对某个表的查询,并且该语句的WHERE
    子句中有针对该表的搜索条件时,在Extra列中会提示上述额外信息。

    mysql> EXPLAIN SELECT * FROM s1 WHERE common_field = 'a';
    


    当使用索引访问来执行对某个表的查询,并且该语句的WHERE子句中
    有除了该索引包含的列之外的其他搜索条件时,在Extra列中也会提示上述额外信息。

    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' AND common_field = 'a';
    

  • No matching min/max row
    当查询列表处有MIN或者MAX聚合函数,但是并没有符合WHERE子句中的搜索条件的记录时,将会提示该额外信息

    mysql> EXPLAIN SELECT MIN(key1) FROM s1 WHERE key1 = 'abcdefg';
    

  • Using index
    当我们的查询列表以及搜索条件中只包含属于某个索引的列,也就是在可以使用覆盖索引的情况下,在Extra列将会提示该额外信息。比方说下边这个查询中只需要用到idx_key1而不需要回表操作:

    mysql> EXPLAIN SELECT key1 FROM s1 WHERE key1 = 'a';
    

  • Using index condition
    有些搜索条件中虽然出现了索引列,但却不能使用到索引

    SELECT * FROM s1 WHERE key1 > 'z' AND key1 LIKE '%a';
    

    其中的key1 > 'z'可以使用到索引,但是key1 LIKE'%a '却无法使用到索引,在以前版本的MySQL中,是按照下边步骤来执行这个查询的:

    • 先根据key1 > 'z'这个条件,从二级索引idx_key1中获取到对应的二级索引记录。
    • 根据上一步骤得到的二级索引记录中的主键值进行回表,找到完整的用户记录再检测该记录是否符合key1 LIKE '%a'这个条件,将符合条件的记录加入到最后的结果集。

    但是虽然key1 LIKE '%a'不能组成范围区间参与range访问方法的执行,但这个条件毕竟只涉及到了key1列,所以MySQL把上边的步骤改进了一下:

    • 先根据key1 > 'z'这个条件,定位到二级索引idx_key1中对应的二级索引记录。
    • 对于指定的二级索引记录,先不着急回表,而是先检测一下该记录是否满足key1 LIKE '%a '这个条件,如果这个条件不满足,则该二级索引记录压根儿就没必要回表。
    • 对于满足key1 LIKE '%a'这个条件的二级索引记录执行回表操作。

    我们说回表操作其实是一个随机IO,比较耗时,所以上述修改虽然只改进了一点点,但是可以省去好多回表操作的成本。MySQL把他们的这个改进称之为索引条件下推(英文名: Index Condition Pushdown )。如果在查询语句的执行过程中将要使用索引条件下推这个特性,在Extra列中将会显示Using indexcondition,比如这样:

    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'z' AND key1 LIKE '%b';
    

  • Using join buffer (Block Nested Loop)
    在连接查询执行过程中,当被驱动表不能有效的利用索引加快访问速度,MySQL一般会为其分配一块名叫join buffer的内存块来加快查询速度,也就是我们所讲的基于块的嵌套循环算法

    mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2
    ON s1.common_field = s2.common_field;
    

  • Not exists
    当我们使用左(外)连接时,如果WHERE子句中包含要求被驱动表的某个列等于NULL值的搜索条件,而且那个列又是不允许存储NULL值的,那么在该表的执行计划的Extra列就会提示Not exists额外信息

    mysql> EXPLAIN SELECT * FROM s1
    LEFT JOIN s2
    ON s1.key1 = s2.key1
    WHERE s2.id IS NULL;
    

  • Using intersect(…) 、 Using union(…) 和 Using sort_union(…)
    如果执行计划的Extra列出现了Using intersect(...)提示,说明准备使用Intersect索引合并的方式执行查询,括号中的...表示需要进行索引合并的索引名称;如果出现了Using union(...)提示,说明准备使用Union索引合并的方式执行查询;出现了Using sort_union(...)提示,说明准备使用Sort-Union索引合并的方式执行查询。

    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' OR key3 = 'a';
    

  • Zero limit
    当我们的LIMIT子句的参数为0时,表示压根儿不打算从表中读出任何记录,将会提示该额外信息

    mysql> EXPLAIN SELECT * FROM s1 LIMIT 0;
    

  • Using filesort
    有一些情况下对结果集中的记录进行排序是可以使用到索引的。

    mysql> EXPLAIN SELECT * FROM s1 ORDER BY key1 LIMIT 10;
    


    很多情况下排序操作无法使用到索引,只能在内存中(记录较少的时候)或者磁盘中(记录较多的时候)进行排序,MySQL把这种在内存中或者磁盘上进行排序的方式统称为文件排序(英文名:filesort)。

    如果某个查询需要使用文件排序的方式执行查询,就会在执行计划的Extra列中显示Using filesort提示

    mysql> EXPLAIN SELECT * FROM s1 ORDER BY common_field LIMIT 10;
    

  • Using temporary
    在许多查询的执行过程中,MySQL可能会借助临时表来完成一些功能,比如去重、排序之类的,比如我们在执行许多包含DISTINCTGROUP BYUNION等子句的查询过程中,如果不能有效利用索引来完成查询,MySQL很有可能寻求通过建立内部的临时表来执行查询。如果查询中使用到了内部的临时表,在执行计划的Extra列将会显示Using temporary提示

    mysql> EXPLAIN SELECT DISTINCT common_field FROM s1;
    


    再比如:

    mysql> EXPLAIN SELECT common_field, COUNT(*) AS amount
    FROM s1
    GROUP BY common_field;
    


    执行计划中出现Using temporary并不是一个好的征兆,因为建立与维护临时表要付出很大成本的,所以我们最好能使用索引来替代掉使用临时表。比如:扫描指定的索引idx_key1即可

    mysql> EXPLAIN SELECT key1, COUNT(*) AS amount FROM s1 GROUP BY key1;
    


    ExtraUsing index 的提示里我们可以看出,上述查询只需要扫描 idx_key1 索引就可以搞定了,不再需要临时表了。

  • 其它

    其它特殊情况这里省略

12. 小结

  • EXPLAIN不考虑各种Cache
  • EXPLAIN不能显示MySQL在执行查询时所作的优化工作
  • EXPLAIN不会告诉你关于触发器、存储过程的信息或用户自定义函数对查询的影响情况
  • 部分统计信息是估算的,并非精确值

五、EXPLAIN的进一步使用

1、 EXPLAIN四种输出格式

这里谈谈EXPLAIN的输出格式。EXPLAIN可以输出四种格式: 传统格式JSON格式TREE格式 以及 可视化输出。用户可以根据需要选择适用于自己的格式。

1. 传统格式

传统格式简单明了,输出是一个表格形式,概要说明查询计划。

mysql> EXPLAIN SELECT s1.key1, s2.key1 FROM s1
LEFT JOIN s2 ON s1.key1 = s2.key1
WHERE s2.common_field IS NOT NULL;

2. JSON格式

第1种格式中介绍的EXPLAIN语句输出中缺少了一个衡量执行计划好坏的重要属性―成本(单位是秒)。而JSON格式是四种格式里面输出信息最详尽的格式,里面包含了执行的成本信息。

  • JSON格式:在EXPLAIN单词和真正的查询语句中间加上FORMAT=JSON

    EXPLAIN FORMAT=JSON SELECT ....
    
  • EXPLAIN的Column与JSON的对应关系:(来源于MySQL 5.7文档)

mysql> EXPLAIN FORMAT=JSON SELECT * FROM s1 INNER JOIN s2 ON s1.key1 = s2.key2 -> WHERE s1.common_field = 'a'\G
*************************** 1. row ***************************
EXPLAIN: {"query_block": {"select_id": 1,"cost_info": {"query_cost": "1360.07"},"nested_loop": [{"table": {"table_name": "s1","access_type": "ALL","possible_keys": ["idx_key1"],"rows_examined_per_scan": 9895,"rows_produced_per_join": 989,"filtered": "10.00","cost_info": {"read_cost": "914.80","eval_cost": "98.95","prefix_cost": "1013.75","data_read_per_join": "1M"},"used_columns": ["id","key1","key2","key3","key_part1","key_part2","key_part3","common_field"],"attached_condition": "((`atguigudb1`.`s1`.`common_field` = 'a') and (`atguigudb1`.`s1`.`key1` is not null))"}},{"table": {"table_name": "s2","access_type": "eq_ref","possible_keys": ["idx_key2"],"key": "idx_key2","used_key_parts": ["key2"],"key_length": "5","ref": ["atguigudb1.s1.key1"],"rows_examined_per_scan": 1,"rows_produced_per_join": 989,"filtered": "100.00","index_condition": "(cast(`atguigudb1`.`s1`.`key1` as double) = cast(`atguigudb1`.`s2`.`key2` as double))","cost_info": {"read_cost": "247.38","eval_cost": "98.95","prefix_cost": "1360.08","data_read_per_join": "1M"},"used_columns": ["id","key1","key2","key3","key_part1","key_part2","key_part3","common_field"]}}]}
}
1 row in set, 2 warnings (0.01 sec)

我们使用 # 后边跟随注释的形式为大家解释了EXPLAIN FORMAT=JSON语句的输出内容,但是大家可能有疑问 "cost_info"里边的成本看着怪怪的,它们是怎么计算出来的?先看 s1 表的 "cost_info" 部分:

"cost_info": { "read_cost": "1840.84", "eval_cost": "193.76", "prefix_cost": "2034.60", "data_read_per_join": "1M"
}
  • read_cost是由下边这两部分组成的:

    • IO 成本
    • 检测 rows × (1 - filter) 条记录的 CPU 成本

小贴士: rows和filter都是我们前边介绍执行计划的输出列,在JSON格式的执行计划中,rows相当于rows_examined_per_scan,filtered名称不变。

  • eval_cost 是这样计算的:

    检测 rows × filter 条记录的成本。

  • prefix_cost就是单独查询 s1表的成本,也就是:

    read_cost + eval_cost

  • data_read_per_join 表示在此次查询中需要读取的数据量。

对于s2表的 "cost_info"部分是这样的:

"cost_info": {
"read_cost": "968.80","eval_cost": "193.76", "prefix_cost": "3197.16", "data_read_per_join": "1M"
}

由于 s2 表是被驱动表,所以可能被读取多次,这里的 read_costeval_cost 是访问多次 s2 表后累加起来的值,大家主要关注里边儿的 prefix_cost的值代表的是整个连接查询预计的成本,也就是单次查询 s1表和多次查询 s2 表后的成本的和,也就是:

968.80 + 193.76 + 2034.60 = 3197.16

3. TREE格式

TREE格式是8.0.16版本之后引入的新格式,主要根据查询的 各个部分之间的关系各部分的执行顺序来描述如何查询。

4. 可视化输出

可视化输出,可以通过MySQL Workbench可视化查看MySQL的执行计划。通过点击Workbench的放大镜图标,即可生成可视化的查询计划。

上图按从左到右的连接顺序显示表。红色框表示 全表扫描 ,而绿色框表示使用 索引查找 。对于每个表,显示使用的索引。还要注意的是,每个表格的框上方是每个表访问所发现的行数的估计值以及访问该表的成本。

2 、SHOW WARNINGS的使用

在我们使用EXPLAIN语句查看了某个查询的执行计划后,紧接着还可以使用SHOW WARNINGS语句查看与这个查询的执行计划有关的一些扩展信息,比如这样:

mysql> EXPLAIN SELECT s1.key1, s2.key1 FROM s1
LEFT JOIN s2
ON s1.key1 = s2.key1
WHERE s2.common_field IS NOT NULL;



大家可以看到 SHOW WARNINGS展示出来的信息有三个字段,分别是 LevelCodeMessage

我们最常见的就是Code为1003的信息,当Code值为1003时,Message字段展示的信息类似于查询优化器将我们的查询语句重写后的语句。比如我们上边的查询本来是一个左(外)连接查询,但是有一个s2.common_field IS NOT NULL的条件,这就会导致查询优化器把左(外)连接查询优化为内连接查询,从 SHOW WARNINGS的Message字段也可以看出来,原本的LEFT JOIN已经变成了JOIN。

分析查询语句 EXPLAIN 详解相关推荐

  1. Elasticsearch(es) 查询语句语法详解

    Elasticsearch 查询语句采用基于 RESTful 风格的接口封装成 JSON 格式的对象,称之为 Query DSL.Elasticsearch 查询分类大致分为全文查询.词项查询.复合查 ...

  2. SQL查询语句 select 详解

    查询select: 1.单表查询 2.多表查询 3.嵌套查询分类 1)单表查询 2)多表查询 A.连接查询 B.子查询 ①一般子查询 ②相关子查询*************************** ...

  3. 【MySQL】MySQL中的查询语句的详解----等值连接、左连接、右连接、全连接

    用两个表(t_worker,t_depart),关联字段t_worker.deptno和t_depart.deptno来演示一下MySQL的等值连接.左连接.右连接.全连接.数据库表:t_worker ...

  4. SQL查询语句分步详解——SELECT...FROM...WHERE...GROUP BY...

    GROUP BY : 分组查询命令 1.书写顺序: SELECT 字段名,函数,子查询 FROM 表名 WHERE 定位数据行条件 GROUP BY 分组字段 2.执行顺序: FROM-->WH ...

  5. mysql 分组查询 语句_详解MySQL中的分组查询与连接查询语句

    分组查询 group bygroup by 属性名 [having 条件表达式][ with rollup] "属性名 "指按照该字段值进行分组:"having 条件表达 ...

  6. 数据分析 | SQL基础查询语句+例题详解

    SQL 语法结构:select--from--where--group by--having--order by--limit 运行顺序: from--where--group by--having- ...

  7. MySQL查询语句(select)详解

    1.查询记录 select*from 表名 [where 条件];eg:select*from students;//查询 students 表中所有记录,所有字段的值都显示出来select fiel ...

  8. SQL查询语句分步详解——多字段分组查询

    多字段分组规则: 1.多字段分组时,分组字段出现顺序对于最终查询结果没有任何影响的. group by deptno,job 与 group by job,deptno查询最终结果是一致的 2.多字段 ...

  9. MySQL Explain详解,分析语句为何运行慢

    MySQL Explain详解 在日常工作中,我们会有时会开慢查询去记录一些执行时间比较久的SQL语句,找出这些SQL语句并不意味着完事了,些时我们常常用到explain这个命令来查看一个这些SQL语 ...

最新文章

  1. 【Linux入门到精通系列讲解】.bashrc 文件作用
  2. python 写入excel_实用小工具python数组快速写入excel表格
  3. 高等学校计算机规划教程,高等学校计算机应用规划教材:计算机组成原理简明教程...
  4. 利用耦合隐马尔可夫模型改进交易策略
  5. Leet Code OJ 102. Binary Tree Level Order Traversal [Difficulty: Easy]
  6. 深度学习(三十七)——CenterNet, Anchor-Free, NN Quantization
  7. DataProtection设置问题引起不同ASP.NET Core站点无法共享用户验证Cookie
  8. 华为海外版操作系统曝光?HUAWEI ARK OS现身
  9. mysql ext_RHEL5+postfix+mysql+extmai(源代码)(一)
  10. 20165323 第一周学习总结
  11. 2012CSDN年度博客之星评选http://vote.blog.csdn.net/item/blogstar/xyz_lmn
  12. Linux查看和修改IP地址
  13. 记一次非典型MySQL排错
  14. Prototype使用Template
  15. scala implicit隐式转化与隐式参数
  16. 财务系统需求分析 用户分析 功能需求
  17. Ubuntu 20.04安装搜狗输入法(图文详解)
  18. 前端开发实习生第一天都在做什么?需要准备什么东西
  19. 偶遇RandomAccessFile
  20. csv是什么意思中文_csv文件是什么意思

热门文章

  1. Python3中模拟打印机效果
  2. [碎碎念]坦白了,这是我最喜欢的一部动漫
  3. ARP 360度观察
  4. HTML中 :before 和 :after 的用法
  5. Mac上如何使用画中画?使用画中画的三种方法
  6. CVPR21小目标检测:上下文和注意力机制提升小目标检测(附论文下载)
  7. 计算机蓝屏的原因及解决方法,电脑启动就蓝屏怎么回事 电脑蓝屏的原因与解决办法...
  8. 极致加速:利用Really Static插件实现WordPress全站静态化
  9. 高分红背后,华宝股份如何谋得出路?
  10. C++如何保留两位有效数字!!!!