MySQL性能分析工具的使用

1、数据库服务器的优化步骤

  • 当我们遇到数据库调优问题的时候,该如何思考呢?这里把思考的流程整理成下面这张图。

  • 整个流程划分成了观察(Show status)行动(Action)两个部分。字母S的部分代表观察(会使用相应的分析工具),字母A代表的部分是行动(对应分析可以采取的行动)。

    • 首先在S1部分,我们需要观察服务器的状态是否存在周期性的波动。如果存在周期性波动,有可能是周期性节点的原因,比如双十一、促销活动等。这样的话,我们可以通过A1这一步骤解决,也就是加缓存,或者更改缓存失效策略。

    • 如果缓存策略没有解决,或者不是周期性波动的原因,我们就需要进一步分析查询延迟和卡顿的原因。接下来进入S2这一-步,我们需要开启慢查询。慢查询可以帮我们定位执行慢的SQL语句。我们可以通过设置long_query_time参数定义“慢”的阈值,如果SQL执行时间超过了long_query_time,则会认为是慢查询。当收集上来这些慢查询之后,我们就可以通过分析工具对慢查询日志进行分析。

    • 在S3这一步骤中,我们就知道了执行慢的SQL,这样就可以针对性地用EXPLAIN查看对应SQL语句的执行计划,或者使用show profile查看SQL中每一个步骤的时间成本。这样我们就可以了解SQL查询慢是因为执行时间长,还是等待时间长。

    • 如果是SQL等待时间长,我们进入A2步骤。在这一步骤中,我们可以调优服务器的参数,比如适当增加数据库缓冲池等。如果是SQL执行时间长,就进入A3步骤,这一步中我们需要考虑是索引设计的问题?还是查询关联的数据表过多?还是因为数据表的字段设计问题导致了这一现象。然后在这些维度上进行对应的调整。

    • 如果A2和A3都不能解决问题,我们需要考虑数据库自身的SQL查询性能是否已经达到了瓶颈,如果确认没有达到性能瓶颈,就需要重新检查,重复以上的步骤。如果已经达到了性能瓶颈,进入A4阶段,需要考虑增加服务器,采用读写分离的架构,或者考虑对数据库进行分库分表,比如垂直分库、垂直分表和水平分表等。

    • 以上就是数据库调优的流程思路。如果我们发现执行SQL时存在不规则延迟或卡顿的时候,就可以采用分析工具帮我们定位有问题的SQL,这三种分析工具你可以理解是SQL调优的三个步骤:慢查询、 EXPLAINSHOWPROFILING

  • 我们可以通过观察了解数据库整体的运行状态,通过性能分析工具可以让我们了解执行慢的SQL都有哪些,查看具体的SQL执行计划,甚至是SQL执行中的每一步的成本代价,这样才能定位问题所在,找到了问题,再采取相应的行动。

2、查看系统性能参数

  • 在MySQL中,可以使用SHOW STATUS语句查询一些MySQL数据库服务器的性能参数执行频率

  • SHOW STATUS语句语法如下:

    1
    SHOW [GLOBAL|SESSION] STATUS LIKE '参数';
  • 一些常用的性能参数如下:

    • Connections:连接MySQL服务器的次数。

      1
      2
      3
      4
      5
      6
      7
      mysql> show status like 'Connections';
      +---------------+-------+
      | Variable_name | Value |
      +---------------+-------+
      | Connections | 733 |
      +---------------+-------+
      1 row in set (0.00 sec)
    • Uptime:MySQL服务器的上线时间(秒)。

      1
      2
      3
      4
      5
      6
      7
      mysql> show status like 'Uptime';
      +---------------+--------+
      | Variable_name | Value |
      +---------------+--------+
      | Uptime | 938248 |
      +---------------+--------+
      1 row in set (0.00 sec)
    • Slow_queries:慢查询的次数。

      1
      2
      3
      4
      5
      6
      7
      mysql> show status like 'Slow_queries';
      +---------------+-------+
      | Variable_name | Value |
      +---------------+-------+
      | Slow_queries | 0 |
      +---------------+-------+
      1 row in set (0.00 sec)
    • Innodb_rows_read:Select查询返回的行数。

      1
      2
      3
      4
      5
      6
      7
      mysql> show status like 'Innodb_rows_read';
      +------------------+----------+
      | Variable_name | Value |
      +------------------+----------+
      | Innodb_rows_read | 11408033 |
      +------------------+----------+
      1 row in set (0.00 sec)
    • Innodb_rows_inserted:执行INSERT操作插入的行数。

    • Innodb_rows_updated:执行UPDATE操作更新的行数。

    • Innodb_rows_deleted:执行DELETE操作删除的行数。

      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      mysql> show status like 'innodb_rows_%';
      +----------------------+----------+
      | Variable_name | Value |
      +----------------------+----------+
      | Innodb_rows_deleted | 10 |
      | Innodb_rows_inserted | 2002295 |
      | Innodb_rows_read | 11408033 |
      | Innodb_rows_updated | 10 |
      +----------------------+----------+
      4 rows in set (0.00 sec)
    • Com_select:查询操作的次数。

    • Com_insert:插入操作的次数。对于批量插入的 INSERT 操作,只累加一次。

    • Com_update:更新操作的次数。

    • Com_delete:删除操作的次数。

3、统计SQL的查询成本:last_query_cost

  • 一条SQL查询语句在执行前需要确定查询执行计划,如果存在多种执行计划的话,MySQL会计算每个执行计划所需要的成本,从中选择成本最小的一个作为最终执行的执行计划。

  • 如果我们想要查看某条SQL语句的查询成本,可以在执行完这条SQL语句之后,通过查看当前会话中的
    last_query_cost变量值来得到当前查询的成本。它通常也是我们评价一个查询的执行效率的一个常用指标。这个查询成本对应的是SQL语句所需要读取的页的数量

  • 以student_info表为例:

    1
    2
    3
    4
    5
    6
    7
    8
    CREATE TABLE `student_info` (
    `id` INT(11) NOT NULL AUTO_INCREMENT,
    `student_id` INT NOT NULL ,
    `name` VARCHAR(20) DEFAULT NULL, `course_id` INT NOT NULL ,
    `class_id` INT(11) DEFAULT NULL,
    `create_time` DATETIME DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
    PRIMARY KEY (`id`)
    ) ENGINE=INNODB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
    • 如果我们想要查询id=900001的记录,然后看下查询成本,我们可以直接在聚簇索引上进行查找:

      1
      2
      3
      4
      5
      6
      7
      mysql> SELECT student_id,class_id,NAME,create_time FROM student_info WHERE id = 900001;
      +------------+----------+--------+---------------------+
      | student_id | class_id | NAME | create_time |
      +------------+----------+--------+---------------------+
      | 187417 | 10091 | qQfedg | 2022-04-20 07:01:48 |
      +------------+----------+--------+---------------------+
      1 row in set (0.01 sec)
    • 然后再看下查询优化器的成本,实际上我们只需要检索一个页即可:

      1
      2
      3
      4
      5
      6
      7
      mysql> SHOW STATUS LIKE 'last_query_cost';
      +-----------------+----------+
      | Variable_name | Value |
      +-----------------+----------+
      | Last_query_cost | 1.000000 |
      +-----------------+----------+
      1 row in set (0.00 sec)
    • 如果我们想要查询id在900001到9000100之间的学生记录呢?

      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      mysql> SELECT student_id, class_id, NAME, create_time FROM student_info WHERE id BETWEEN 900001 AND 900100;
      +------------+----------+--------+---------------------+
      | student_id | class_id | NAME | create_time |
      +------------+----------+--------+---------------------+
      | 187417 | 10091 | qQfedg | 2022-04-20 07:01:48 |
      | 72343 | 10145 | JezlIJ | 2022-04-20 07:01:48 |
      | 190400 | 10177 | fKkTPt | 2022-04-20 07:01:48 |
      | 184375 | 10055 | OjAaBH | 2022-04-20 07:01:48 |
      | 22627 | 10040 | YzDtgB | 2022-04-20 07:01:48 |
      …………
      | 73676 | 10045 | iMjJRj | 2022-04-20 07:01:48 |
      +------------+----------+--------+---------------------+
      100 rows in set (0.00 sec)
    • 然后再看下查询优化器的成本,这时我们大概需要进行20个页的查询。

      1
      2
      3
      4
      5
      6
      7
      mysql> SHOW STATUS LIKE 'last_query_cost';
      +-----------------+-----------+
      | Variable_name | Value |
      +-----------------+-----------+
      | Last_query_cost | 20.290501 |
      +-----------------+-----------+
      1 row in set (0.00 sec)

      你能看到页的数量是刚才的20倍,但是查询的效率并没有明显的变化,实际上这两个SQL查询的时间基本上一样,就是因为采用了顺序读取的方式将页面一次性加载到缓冲池中,然后再进行查找。虽然页数量(last_query_cost)增加了不少,但是通过缓冲池的机制,并没有增加多少查询时间

  • 使用场景:它对于比较开销是非常有用的,特别是我们有好几种查询方式可选的时候。

    SQL查询是一个动态的过程,从页加载的角度来看,我们可以得到以下两点结论:

    1. 位置决定效率。如果页就在数据库缓冲池中,那么效率是最高的,否则还需要从磁盘中进行
      读取,当然针对单个页的读取来说,如果页存在于内存中,会比在磁盘中读取效率高很多。

    2. 批量决定效率。如果我们从磁盘中对单一页进行随机读,那么效率是很低的(差不多10ms),而采用顺
      序读取的方式,批量对页进行读取,平均一页的读取效率就会提升很多,甚至要快于单个页面在内存中的随机读取。

    所以说,遇到/O并不用担心,方法找对了,效率还是很高的。我们首先要考虑数据存放的位置,如果是经常使用的数据就要尽量放到缓冲池中,其次我们可以充分利用磁盘的吞吐能力,一次性批量读取数据,这样单个页的读取效率也就得到了提升。

4、定位执行慢的SQL:慢查询日志

  • MySQL的慢查询日志,用来记录在MySQL中响应时间超过阀值的语句,具体指运行时间超过long_query_time值的SQL,则会被记录到慢查询日志中。long_query_time的默认值为10,意思是运行10秒以上(不含10秒)的语句,认为是超出了我们的最大忍耐时间值。
  • 它的主要作用是,帮助我们发现那些执行时间特别长的SQL查询,并且有针对性地进行优化,从而提高系统的整体效率。当我们的数据库服务器发生阻塞、运行变慢的时候,检查一下慢查询日志,找到那些慢查询,对解决问题很有帮助。比如一条sq|执行超过5秒钟,我们就算慢SQL,希望能收集超过5秒的sql,结合explain进行全面分析。
  • 默认情况下,MySQL数据库没有开启慢查询日志,需要我们手动来设置这个参数。如果不是调优需要的话,一般不建议启动该参数,因为开启慢查询日志会或多或少带来一定的性能影响。
  • 慢查询日志支持将日志记录写入文件。

4.1 开启慢查询日志参数

  • 开启slow_query_log

    • 在使用前,我们需要先看下慢查询是否已经开启,使用下面这条命令即可:

      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      14
      15
      16
      17
      18
      19
      20
      21
      22
      23
      mysql> show variables like '%slow_query_log';
      +----------------+-------+
      | Variable_name | Value |
      +----------------+-------+
      | slow_query_log | OFF |
      +----------------+-------+
      1 row in set (0.01 sec)

      # 开启慢查询日志
      mysql> set global slow_query_log='ON';
      Query OK, 0 rows affected (0.00 sec)

      # 查看下慢查询日志是否开启,以及慢查询日志文件的位置
      # 能看到这时慢查询分析已经开启,同时文件保存在/var/lib/mysql/f0796ad75d78-slow.log文件中
      # 慢查询日志文件名中的f0796ad75d78为主机名
      mysql> show variables like '%slow_query_log%';
      +---------------------+--------------------------------------+
      | Variable_name | Value |
      +---------------------+--------------------------------------+
      | slow_query_log | ON |
      | slow_query_log_file | /var/lib/mysql/f0796ad75d78-slow.log |
      +---------------------+--------------------------------------+
      2 rows in set (0.00 sec)
  • 修改long_query_time阈值

    • 接下来我们来看下慢查询的时间阈值设置,使用如下命令:

      1
      2
      3
      4
      5
      6
      7
      mysql> show variables like '%long_query_time%';
      +-----------------+-----------+
      | Variable_name | Value |
      +-----------------+-----------+
      | long_query_time | 10.000000 |
      +-----------------+-----------+
      1 row in set (0.00 sec)
    • 这里如果我们想把时间缩短,比如设置为1秒,可以这样设置:

      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      14
      15
      16
      17
      18
      19
      20
      21
      22
      23
      # 测试发现:设置global的方式对当前session的long_query_time失效。对新连接的客户端有效。所以可以一并执行下述语句
      mysql> set global long_query_time = 1;
      Query OK, 0 rows affected (0.00 sec)

      mysql> show global variables like '%long_query_time%';
      +-----------------+----------+
      | Variable_name | Value |
      +-----------------+----------+
      | long_query_time | 1.000000 |
      +-----------------+----------+
      1 row in set (0.01 sec)

      # 即更改global也更改了session变量
      mysql> set long_query_time = 1;
      Query OK, 0 rows affected (0.00 sec)

      mysql> show variables like '%long_query_time%';
      +-----------------+----------+
      | Variable_name | Value |
      +-----------------+----------+
      | long_query_time | 1.000000 |
      +-----------------+----------+
      1 row in set (0.00 sec)
    • 补充:配置文件中一并设置参数

      • 如下的方式相较于前面的命令行方式,可以看作是永久设置的方式。

      • 修改my.cnf 文件,[mysqld]下增加或修改参数long_query_timeslow_query_logslow_query_log_file后,然后重启MySQL服务器。

        1
        2
        3
        4
        5
        [mysqld]
        slow_query_log=ON # 开启慢查询日志的开关
        slow_query_log_file=/var/lib/mysql/my-slow.log # 慢查询日志的目录和文件名信息
        long_query_time=3 # 设置慢查询的阈值为3秒,超出此设定值的SQL即被记录到慢查询日志
        log_output=FILE
      • 如果不指定存储路径,慢查询日志将默认存储到MySQL数据库的数据文件夹下。如果不指定文件名,默认文件名为hostname-slow.log。

4.2 查看慢查询数目

  • 查询当前系统中有多少条慢查询记录:

    1
    2
    3
    4
    5
    6
    7
    mysql> SHOW GLOBAL STATUS LIKE '%Slow_queries%';
    +---------------+-------+
    | Variable_name | Value |
    +---------------+-------+
    | Slow_queries | 0 |
    +---------------+-------+
    1 row in set (0.00 sec)

4.3 案例演示

  • ①建表。

    1
    2
    3
    4
    5
    6
    7
    8
    CREATE TABLE `student` (
    `id` INT(11) NOT NULL AUTO_INCREMENT,
    `stuno` INT NOT NULL ,
    `name` VARCHAR(20) DEFAULT NULL,
    `age` INT(3) DEFAULT NULL,
    `classId` INT(11) DEFAULT NULL,
    PRIMARY KEY (`id`)
    ) ENGINE=INNODB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
  • ②创建模拟数据必需的存储函数。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    # 由于开启过慢查询日志bin-log, 我们就必须为我们的function指定一个参数。
    # 主从复制,主机会将写操作记录在bin-log日志中。从机读取bin-log日志,执行语句来同步数据。如果使用函数来操作数据,会导致从机和主键操作时间不一致。所以,默认情况下,mysql不开启创建函数设置。因此需要设置成允许创建函数(临时生效,重启服务失效):
    SET GLOBAL log_bin_trust_function_creators = 1;
    # 或者my.cnf[mysqld]加上(永久生效):
    log_bin_trust_function_creators= 1

    mysql> SELECT @@log_bin_trust_function_creators;
    +-----------------------------------+
    | @@log_bin_trust_function_creators |
    +-----------------------------------+
    | 1 |
    +-----------------------------------+
    1 row in set (0.00 sec)

    # 函数1:创建随机产生字符串函数
    DELIMITER //
    CREATE FUNCTION rand_string(n INT)
    RETURNS VARCHAR(255) #该函数会返回一个字符串
    BEGIN
    DECLARE chars_str VARCHAR(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFJHIJKLMNOPQRSTUVWXYZ';
    DECLARE return_str VARCHAR(255) DEFAULT '';
    DECLARE i INT DEFAULT 0;
    WHILE i < n DO
    SET return_str =CONCAT(return_str,SUBSTRING(chars_str,FLOOR(1+RAND()*52),1));
    SET i = i + 1;
    END WHILE;
    RETURN return_str;
    END //
    DELIMITER ;

    # 函数2:创建随机数函数
    DELIMITER //
    CREATE FUNCTION rand_num (from_num INT ,to_num INT) RETURNS INT(11)
    BEGIN
    DECLARE i INT DEFAULT 0;
    SET i = FLOOR(from_num +RAND()*(to_num - from_num+1)) ;
    RETURN i;
    END //
    DELIMITER ;
  • ③创建存储过程。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    DELIMITER //
    CREATE PROCEDURE insert_stu1( START INT , max_num INT )
    BEGIN
    DECLARE i INT DEFAULT 0;
    SET autocommit = 0; # 设置手动提交事务
    REPEAT # 循环
    SET i = i + 1; # 赋值
    INSERT INTO student (stuno, NAME ,age ,classId ) VALUES
    ((START+i),rand_string(6),rand_num(10,100),rand_num(10,1000));
    UNTIL i = max_num
    END REPEAT;
    COMMIT; # 提交事务
    END //
    DELIMITER ;
  • ⑤调用存储过程。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    # 调用刚刚写好的存储过程,4000000条记录,从100001号开始
    mysql> CALL insert_stu1(100001,4000000);
    Query OK, 0 rows affected (5 min 13.09 sec)

    mysql> select count(*) from student;
    +----------+
    | count(*) |
    +----------+
    | 4000000 |
    +----------+
    1 row in set (0.79 sec)

4.4 测试及分析

  • 测试。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    mysql> desc student;
    +---------+-------------+------+-----+---------+----------------+
    | Field | Type | Null | Key | Default | Extra |
    +---------+-------------+------+-----+---------+----------------+
    | id | int | NO | PRI | NULL | auto_increment |
    | stuno | int | NO | | NULL | |
    | name | varchar(20) | YES | | NULL | |
    | age | int | YES | | NULL | |
    | classId | int | YES | | NULL | |
    +---------+-------------+------+-----+---------+----------------+
    5 rows in set (0.01 sec)

    mysql> SELECT * FROM student WHERE stuno = 3453451;
    +---------+---------+--------+------+---------+
    | id | stuno | name | age | classId |
    +---------+---------+--------+------+---------+
    | 3353450 | 3453451 | MFQnRv | 58 | 442 |
    +---------+---------+--------+------+---------+
    1 row in set (1.08 sec)

    mysql> SELECT * FROM student WHERE name = 'MFQnRv';
    +---------+---------+--------+------+---------+
    | id | stuno | name | age | classId |
    +---------+---------+--------+------+---------+
    | 89542 | 189543 | mfQNrv | 13 | 956 |
    | 349742 | 449743 | MfqnrV | 62 | 121 |
    | 957888 | 1057889 | mfQNrv | 14 | 993 |
    | 1257989 | 1357990 | mfQNrv | 18 | 220 |
    | 1524639 | 1624640 | mFqNRV | 16 | 598 |
    | 1573362 | 1673363 | mfQNrv | 15 | 74 |
    | 1677458 | 1777459 | MFQnRv | 57 | 405 |
    | 2966821 | 3066822 | mfQNrv | 19 | 239 |
    | 3055462 | 3155463 | MFQnRv | 61 | 568 |
    | 3353450 | 3453451 | MFQnRv | 58 | 442 |
    | 3365428 | 3465429 | MfqnrV | 60 | 25 |
    | 3949671 | 4049672 | mfQNrv | 17 | 156 |
    | 3978913 | 4078914 | MfqnrV | 57 | 911 |
    +---------+---------+--------+------+---------+
    13 rows in set (1.16 sec)

    从上面的结果可以看出来,查询学生编号为“3453451”的学生信息花费时间为1.08秒。查询学生姓名为“MFQnRv”的学生信息花费时间为1.16秒。已经达到了秒的数量级,说明目前查询效率是比较低的,下面
    的小节我们分析一下原因。

  • 分析。

    1
    2
    3
    4
    5
    6
    7
    mysql> show status like 'slow_queries';
    +---------------+-------+
    | Variable_name | Value |
    +---------------+-------+
    | Slow_queries | 2 |
    +---------------+-------+
    1 row in set (0.00 sec)

    补充说明:

    除了上述变量,控制慢查询日志的还有一个系统变量:min_examined_row_limit。这个变量的意思是,查询扫描过的最少记录数。这个变量和查询执行时间,共同组成了判别一个查询是否是慢查询的条件。如果查询扫描过的记录数大于等于这个变量的值,并且查询执行时间超过long_query_time的值,那么,这个查询就被记录到慢查询日志中; 反之,则不被记录到慢查询日志中。

    1
    2
    3
    4
    5
    6
    7
    mysql> show variables like 'min%';
    +------------------------+-------+
    | Variable_name | Value |
    +------------------------+-------+
    | min_examined_row_limit | 0 |
    +------------------------+-------+
    1 row in set (0.00 sec)

    你也可以根据需要,通过修改“my.ini”文件,来修改”min_examined_row_limit”的值。

4.5 慢查询日志分析工具:mysqldumpslow

  • 在生产环境中,如果要手工分析日志,查找、分析SQL,显然是个体力活,MySQL提供了日志分析工具mysqldumpslow

  • 查看mysqldumpslow的帮助信息:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    root@f0796ad75d78:/# mysqldumpslow --help
    Usage: mysqldumpslow [ OPTS... ] [ LOGS... ]

    Parse and summarize the MySQL slow query log. Options are

    --verbose verbose
    --debug debug
    --help write this text to standard output

    -v verbose
    -d debug
    -s ORDER what to sort by (al, at, ar, c, l, r, t), 'at' is default
    al: average lock time
    ar: average rows sent
    at: average query time
    c: count
    l: lock time
    r: rows sent
    t: query time
    -r reverse the sort order (largest last instead of first)
    -t NUM just show the top n queries
    -a don't abstract all numbers to N and strings to 'S'
    -n NUM abstract numbers with at least n digits within names
    -g PATTERN grep: only consider stmts that include this string
    -h HOSTNAME hostname of db server for *-slow.log filename (can be wildcard),
    default is '*', i.e. match all
    -i NAME name of server instance (if using mysql.server startup script)
    -l don't subtract lock time from total time
    • -a: 不将数字抽象成N,字符串抽象成S
    • -s: 是表示按照何种方式排序:
      • c: 访问次数
      • l: 锁定时间
      • r: 返回记录
      • t: 查询时间
      • al:平均锁定时间
      • ar:平均返回记录数
      • at:平均查询时间 (默认方式)
      • ac:平均查询次数
    • -t: 即为返回前面多少条的数据;
    • -g: 后边搭配一个正则匹配模式,大小写不敏感的。
  • 我们想要按照查询时间排序,查看前五条SQL语句,这样写即可:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    root@f0796ad75d78:/# mysqldumpslow -a -s t -t 5 /var/lib/mysql/f0796ad75d78-slow.log

    Reading mysql slow query log from /var/lib/mysql/f0796ad75d78-slow.log
    Count: 1 Time=18531.83s (18531s) Lock=0.00s (0s) Rows=0.0 (0), root[root]@[120.239.20.191]
    DROP DATABASE `dbtest1`

    Count: 1 Time=313.09s (313s) Lock=0.00s (0s) Rows=0.0 (0), root[root]@localhost
    CALL insert_stu1(100001,4000000)

    Count: 1 Time=1.20s (1s) Lock=0.00s (0s) Rows=13.0 (13), root[root]@localhost
    SELECT * FROM student WHERE name = 'MFQNRV'

    Count: 1 Time=1.18s (1s) Lock=0.00s (0s) Rows=13.0 (13), root[root]@localhost
    SELECT * FROM student WHERE name = 'mFQnRv'

    Count: 1 Time=1.16s (1s) Lock=0.00s (0s) Rows=13.0 (13), root[root]@localhost
    SELECT * FROM student WHERE name = 'MFQnRv'
  • 工作常用参考:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    # 得到返回记录集最多的10个SQL
    mysqldumpslow -s r -t 10 /var/lib/mysql/atguigu-slow.log

    # 得到访问次数最多的10个SQL
    mysqldumpslow -s c -t 10 /var/lib/mysql/atguigu-slow.log

    # 得到按照时间排序的前10条里面含有左连接的查询语句
    mysqldumpslow -s t -t 10 -g "left join" /var/lib/mysql/atguigu-slow.log

    # 另外建议在使用这些命令时结合 | 和more 使用 ,否则有可能出现爆屏情况
    mysqldumpslow -s r -t 10 /var/lib/mysql/atguigu-slow.log | more

4.6 关闭慢查询日志

  • MySQL服务器停止慢查询日志功能有两种方法:

    • 方式1:永久性方式

      • 修改my.cnf或者my.ini文件,把[mysqld]组下的slow_query_log值设置为OFF,修改保存后,再重启MySQL服务,即可生效:

        1
        2
        [mysqld]
        slow_query_log=OFF
      • 或者,把slow_query_log一项注释掉或删除:

        1
        2
        [mysqld]
        # slow_query_log =OFF
      • 重启MySQL服务,执行如下语句查询慢日志功能。

        1
        2
        SHOW VARIABLES LIKE '%slow%'; # 查询慢查询日志所在目录
        SHOW VARIABLES LIKE '%long_query_time%'; # 查询超时时长

        可以看到,MySQL系统中的慢查询日志是关闭的。

    • 方式2:临时性方式

      • 使用SET语句来设置。停止MySQL慢查询日志功能,具体SQL语句如下。

        1
        SET GLOBAL slow_query_log=off;
      • 重启MySQL服务,使用SHOW语句查询慢查询日志功能信息,具体SQL语句如下:

        1
        2
        3
        SHOW VARIABLES LIKE '%slow%';
        # 以及
        SHOW VARIABLES LIKE '%long_query_time%';

4.7 删除慢查询日志

  • 使用SHOW语句显示慢查询日志信息,具体SQL语句如下。

    1
    2
    3
    4
    5
    6
    7
    8
    mysql> show variables like '%slow_query_log%';
    +---------------------+--------------------------------------+
    | Variable_name | Value |
    +---------------------+--------------------------------------+
    | slow_query_log | ON |
    | slow_query_log_file | /var/lib/mysql/f0796ad75d78-slow.log |
    +---------------------+--------------------------------------+
    2 rows in set (0.00 sec)
  • 从执行结果可以看出,慢查询日志的目录默认为MySQL的数据目录,在该目录下手动删除慢查询日志文件即可。

  • 使用命令mysqladmin flush-logs 来重新生成查询日志文件,具体命令如下,执行完毕会在数据目录下重新生成慢查询日志文件。

    1
    mysqladmin -uroot -p flush-logs slow

慢查询日志都是使用mysqladmin flush-logs命令来删除重建的。使用时一定要注意,一旦执行了这个命令,慢查询日志都只存在新的日志文件中,如果需要旧的查询日志,就必须事先备份。

5、查看SQL执行成本:SHOW PROFILE

  • Show Profile是MySQL提供的可以用来分析当前会话中SQL都做了什么、执行的资源消耗情况的工具,可用于sql调优的测量。默认情况下处于关闭状态,并保存最近15次的运行结果。

  • 我们可以在会话级别开启这个功能:

    1
    2
    3
    4
    5
    6
    7
    mysql> show variables like 'profiling';
    +---------------+-------+
    | Variable_name | Value |
    +---------------+-------+
    | profiling | OFF |
    +---------------+-------+
    1 row in set (0.01 sec)
  • 通过设置 profiling='ON’ 来开启 show profile:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    mysql> set profiling = 'ON';
    Query OK, 0 rows affected, 1 warning (0.00 sec)

    mysql> show variables like 'profiling';
    +---------------+-------+
    | Variable_name | Value |
    +---------------+-------+
    | profiling | ON |
    +---------------+-------+
    1 row in set (0.00 sec)
  • 然后执行相关的查询语句。接着看下当前会话都有哪些profiles,使用下面这条命令:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    mysql> show profiles;
    +----------+------------+---------------------------------------------+
    | Query_ID | Duration | Query |
    +----------+------------+---------------------------------------------+
    | 1 | 0.00162150 | show variables like 'profiling' |
    | 2 | 1.06210900 | SELECT * FROM student WHERE stuno = 3453451 |
    | 3 | 1.19709275 | SELECT * FROM student WHERE name = 'MFQnRv' |
    +----------+------------+---------------------------------------------+
    3 rows in set, 1 warning (0.00 sec)
  • 你能看到当前会话一共有2个查询。如果我们想要查看最近一次查询的开销,可以使用:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    mysql> show profile;
    +----------------------------+----------+
    | Status | Duration |
    +----------------------------+----------+
    | starting | 0.000150 |
    | checking permissions | 0.000014 |
    | Opening tables | 0.000071 |
    | init | 0.000011 |
    | System lock | 0.000013 |
    | optimizing | 0.000016 |
    | statistics | 0.000031 |
    | preparing | 0.000047 |
    | executing | 1.196567 |
    | end | 0.000027 |
    | query end | 0.000009 |
    | waiting for handler commit | 0.000014 |
    | closing tables | 0.000015 |
    | freeing items | 0.000033 |
    | logging slow query | 0.000054 |
    | cleaning up | 0.000021 |
    +----------------------------+----------+
    16 rows in set, 1 warning (0.00 sec)
  • 我们也可以查看指定的Query lD的开销,比如show profile for query 2查询结果是一样的。在SHOWPROFILE中我们可以查看不同部分的开销,比如cpu、block.io等:

    1
    mysql> show profile cpu,block io for query 3;

    如果是executing比较长就可能是代码哪里没写好,使用explain继续查询问题。

  • show profile的常用查询参数:

    • ①ALL:显示所有的开销信息。
    • ②BLOCK IO:显示块IO开销。
    • ③CONTEXT SWITCHES:上下文切换开销。
    • ④CPU:显示CPU开销信息。
    • ⑤IPC:显示发送和接收开销信息。
    • ⑥MEMORY:显示内存开销信息。
    • ⑦PAGE FAULTS:显示页面错误开销信息。
    • ⑧SOURCE:显示和Source_function,Source_file,Source_line相关的开销信息。
    • ⑨SWAPS:显示交换次数开销信息。
  • 日常开发需注意的结论:

    • converting HEAP to MyISAM: 查询结果太大,内存不够,数据往磁盘上搬了。
    • creating tmp table: 创建临时表。先拷贝数据到临时表,用完后再删除临时表。
    • Copying to tmp table on disk:把内存中临时表复制到磁盘上,警惕!
    • locked

    如果在show profile诊断结果中出现了以上4条结果中的任何一条,则sql语句需要优化。

  • 不过SHOW PROFILE命令将被弃用,我们可以从information_schema中的profiling数据表进行查看。

6、分析查询语句:EXPLAIN

6.1 概述

  • 定位了查询慢的SQL之后,我们就可以使用EXPLAIN或DESCRIBE工具做针对性的分析查询语句。DESCRIBE语句的使用方法与EXPLAIN语句是一样的,并且分析结果也是一样的。

  • MySQL中有专门负责优化SELECT语句的优化器模块,主要功能: 通过计算分析系统中收集到的统计信息,为客户端请求的Query提供它认为最优的执行计划(他认为最优的数据检索方式,但不见得是DBA认为是最优的,这部分最耗费时间)。

  • 这个执行计划展示了接下来具体执行查询的方式,比如多表连接的顺序是什么,对于每个表采用什么访问方法来具体执行查询等等。MySQL为我们提供了EXPLAIN语句来帮助我们查看某个查询语句的具体执行计划,大家看懂EXPLAIN语句的各个输出项,可以有针对性的提升我们查询语句的性能。

  • 能做什么?

    • 表的读取顺序
    • 数据读取操作的操作类型。
    • 哪些索引可以使用
    • 哪些索引被实际使用
    • 表之间的引用
    • 每张表有多少行被优化器查询
  • 版本情况

    • MySQL 5.6.3以前只能EXPLAIN SELECT;MYSQL 5.6.3以后就可以EXPLAIN SELECTUPDATEDELETE

    • 在5.7以前的版本中,想要显示partitions需要使用 explain partitions 命令;想要显示filtered需要使用explain extended命令。在5.7版本后,默认explain直接显示partitions和filtered中的信息。

6.2 基本语法

  • EXPLAIN或DESCRIBE语句的语法形式如下:

    1
    2
    3
    EXPLAIN SELECT select_options
    # 或者两个是一样的
    DESCRIBE SELECT select_options
  • 如果我们想看看某个查询的执行计划的话,可以在具体的查询语句前边加一个EXPLAIN,就像这样:

    1
    mysql> EXPLAIN SELECT 1;
    • 输出的上述信息就是所谓的执行计划。在这个执行计划的辅助下,我们需要知道应该怎样改进自己的查询语句以使查询执行起来更高效。其实除了以SELECT开头的查询语句,其余的 DELETE、INSERT、REPLACE以及UPDATE 语句等都可以加上EXPLAIN,用来查看这些语句的执行计划,只是平时我们对SELECT语句更感兴趣。
    • 注意:执行EXPLAIN时并没有真正的执行该后面的语句,因此可以安全的查看执行计划。
  • EXPLAIN语句输出的各个列的作用如下:

    列名 描述
    id 在一个大的查询语句中每个SELECT关键字都对应一个 唯一的id
    select_type SELECT关键字对应的那个查询的类型
    table 表名
    partitions 匹配的分区信息
    type 针对单表的访问方法(重要)
    possible_keys 可能用到的索引
    key 实际上使用的索引
    key_len 实际使用到的索引长度
    ref 当使用索引列等值查询时,与索引列进行等值匹配的对象信息
    rows 预估的需要读取的记录条数
    filtered 某个表经过搜索条件过滤后剩余记录条数的百分比
    Extra 一些额外的信息

6.3 数据准备

  • ①建表。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    CREATE TABLE s1 (
    id INT AUTO_INCREMENT,
    key1 VARCHAR(100),
    key2 INT,
    key3 VARCHAR(100),
    key_part1 VARCHAR(100),
    key_part2 VARCHAR(100),
    key_part3 VARCHAR(100),
    common_field VARCHAR(100),
    PRIMARY KEY (id),
    INDEX idx_key1 (key1),
    UNIQUE INDEX idx_key2 (key2),
    INDEX idx_key3 (key3),
    INDEX idx_key_part(key_part1, key_part2, key_part3)
    ) ENGINE=INNODB CHARSET=utf8;

    CREATE TABLE s2 (
    id INT AUTO_INCREMENT,
    key1 VARCHAR(100),
    key2 INT,
    key3 VARCHAR(100),
    key_part1 VARCHAR(100),
    key_part2 VARCHAR(100),
    key_part3 VARCHAR(100),
    common_field VARCHAR(100),
    PRIMARY KEY (id),
    INDEX idx_key1 (key1),
    UNIQUE INDEX idx_key2 (key2),
    INDEX idx_key3 (key3),
    INDEX idx_key_part(key_part1, key_part2, key_part3)
    ) ENGINE=INNODB CHARSET=utf8;
  • ②创建函数。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    SET GLOBAL log_bin_trust_function_creators=1; 

    DELIMITER //
    CREATE FUNCTION rand_string1(n INT)
    RETURNS VARCHAR(255) #该函数会返回一个字符串
    BEGIN
    DECLARE chars_str VARCHAR(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFJHIJKLMNOPQRSTUVWXYZ';
    DECLARE return_str VARCHAR(255) DEFAULT '';
    DECLARE i INT DEFAULT 0;
    WHILE i < n DO
    SET return_str =CONCAT(return_str,SUBSTRING(chars_str,FLOOR(1+RAND()*52),1));
    SET i = i + 1;
    END WHILE;
    RETURN return_str;
    END //
    DELIMITER ;
  • ③创建并调用存储过程。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    DELIMITER //
    CREATE PROCEDURE insert_s1 (IN min_num INT (10),IN max_num INT (10))
    BEGIN
    DECLARE i INT DEFAULT 0;
    SET autocommit = 0;
    REPEAT
    SET i = i + 1;
    INSERT INTO s1 VALUES(
    (min_num + i),
    rand_string1(6),
    (min_num + 30 * i + 5),
    rand_string1(6),
    rand_string1(10),
    rand_string1(5),
    rand_string1(10),
    rand_string1(10));
    UNTIL i = max_num
    END REPEAT;
    COMMIT;
    END //
    DELIMITER ;


    DELIMITER //
    CREATE PROCEDURE insert_s2 (IN min_num INT (10),IN max_num INT (10))
    BEGIN
    DECLARE i INT DEFAULT 0;
    SET autocommit = 0;
    REPEAT
    SET i = i + 1;
    INSERT INTO s2 VALUES(
    (min_num + i),
    rand_string1(6),
    (min_num + 30 * i + 5),
    rand_string1(6),
    rand_string1(10),
    rand_string1(5),
    rand_string1(10),
    rand_string1(10));
    UNTIL i = max_num
    END REPEAT;
    COMMIT;
    END //
    DELIMITER ;

    # 调用存储过程
    # s1表数据的添加:加入1万条记录
    mysql> CALL insert_s1(10001,10000);
    Query OK, 0 rows affected (3.11 sec)

    # s2表数据的添加:加入1万条记录
    mysql> CALL insert_s2(10001,10000);
    Query OK, 0 rows affected (3.10 sec)

    mysql> SELECT COUNT(*) FROM s1;
    +----------+
    | COUNT(*) |
    +----------+
    | 10000 |
    +----------+
    1 row in set (0.02 sec)

    mysql> SELECT COUNT(*) FROM s2;
    +----------+
    | COUNT(*) |
    +----------+
    | 10000 |
    +----------+
    1 row in set (0.00 sec)

6.4 EXPLAIN各列作用

6.4.1 table

  • 不论我们的查询语句有多复杂,里边儿 包含了多少个表 ,到最后也是需要对每个表进行 单表访问 的,所
    以MySQL规定EXPLAIN语句输出的每条记录都对应着某个单表的访问方法,该条记录的table列代表着该
    表的表名(有时不是真实的表名字,可能是简称)

    1
    2
    # 查询的每一行记录都对应着一个单表
    mysql> explain select count(*) from s1;
    1
    2
    # s1:驱动表  s2:被驱动表
    mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2;

    用到多少个表,就会有多少条记录。

6.4.2 id

  • 查询语句中每出现一个SELECT关键字,MySQL就会为它分配一个唯一的id值。这个id值就是EXPLAIN语句的第一个列,比如下边这个查询中只有一个SELECT关键字,所以EXPLAIN的结果中也就只有一条id列为1的记录:

    1
    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a';
    1
    2
    # 对于连接查询来说,一个SELECT关键字后边的FROM子句中可以跟随多个表,所以在连接查询的执行计划中,每个表都会对应一条记录,但是这些记录的id值都是相同的,比如:
    mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2;

    可以看到,上述连接查询中参与连接的s1和s2表分别对应一条记录,但是这两条记录对应的id值都是1。这里需要大家记住的是,在连接查询的执行计划中,每个表都会对应一条记录,这些记录的id列的值是相同的,出现在前边的表表示驱动表,出现在后边的表表示被驱动表。所以从上边的EXPLAIN输出中我们可以看出,查询优化器准备让s1表作为驱动表,让s2表作为被驱动表来执行查询。

    1
    2
    # 对于包含子查询的查询语句来说,就可能涉及多个SELECT关键字,所以在包含子查询的查询语句的执行计划中,每个SELECT关键字都会对应一个唯一的id值,比如这样:
    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key1 FROM s2) OR key3 = 'a';
  • 查询优化器优化:

    1
    2
    3
    # 查询优化器可能对涉及子查询的查询语句进行重写,转变为多表查询的操作
    # 查询优化器可能对涉及子查询的查询语句进行重写,从而转换为连接查询。所以如果我们想知道查询优化器对某个包含子查询的语句是否进行了重写,直接查看执行计划就好了,比如说:
    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key2 FROM s2 WHERE common_field = 'a');

    可以看到,虽然我们的查询语句是一个子查询,但是执行计划中s1和s2表对应的记录的id值全部是1,这就表明了查询优化器将子查询转换为了连接查询

  • union去重,union all不去重:

    1
    mysql> EXPLAIN SELECT * FROM s1 UNION SELECT * FROM s2;

    这个语句的执行计划的第三条记录是什么?为何id值是NULL,而且table列也很奇怪?UNION!它会把多个查询的结果集合并起来并对结果集中的记录进行去重,怎么去重呢?MySQL使用的是内部的临时表。正如上边的查询计划中所示,UNION子句是为了把id为1的查询和id为2的查询的结果集合并起来并去重,所以在内部创建了一个名为<union1,2>的临时表(就是执行计划第三条记录的table列的名称),id为NULL表明这个临时表是为了合并两个查询的结果集而创建的。

    1
    2
    # 跟UNION对比起来,UNION ALL就不需要为最终的结果集进行去重,它只是单纯的把多个查询的结果集中的记录合并成一个并返回给用户,所以也就不需要使用临时表。所以在包含UNIONALL子句的查询的执行计划中,就没有那个id为NULL的记录,如下所示:
    mysql> EXPLAIN SELECT * FROM s1 UNION ALL SELECT * FROM s2;
  • 小结:

    • id如果相同,可以认为是一组,从上往下顺序执行。
    • 在所有组中,id值越大,优先级越高,越先执行。
    • 关注点:id号每个号码,表示一趟独立的查询, 一个sql的查询趟数越少越好。

6.4.3 select_type

  • 一条大的查询语句里边可以包含若干个SELECT关键字,每个SELECT关键字代表着一个小的查询语句,而每个SELECT关键字的FROM子句中都可以包含若干张表(这些表用来做连接查询),每一张表都对应着执行计划输出中的一条记录,对于在同一个SELECT关键字中的表来说,它们的id值是相同的。

  • MySQL为每一个SELECT关键字代表的小查询都定义了一个称之为select_type的属性,意思是我们只要知道了某个小查询的select_type属性,就知道了这个小查询在整个大查询中扮演了一个什么角色,我们看一下
    select_type都能取哪些值,请看官方文档:

    名称 描述
    SIMPLE Simple SELECT (not using UNION or subqueries)
    PRIMARY Outermost SELECT
    UNION Second or later SELECT statement in a UNION
    UNION RESULT Result of a UNION
    SUBQUERY First SELECT in subquery
    DEPENDENT SUBQUERY First SELECT in subquery, dependent on outer query
    DEPENDENT UNION Second or later SELECT statement in a UNION, dependent on outer query
    DERIVED Derived table
    MATERIALIZED Materialized subquery
    UNCACHEABLE SUBQUERY A subquery for which the result cannot be cached and must be re-evaluated for each row of the outer query
    UNCACHEABLE UNION The second or later select in a UNION that belongs to an uncacheable subquery (see UNCACHEABLE SUBQUERY)
    • SIMPLE

      • 查询语句中不包含UNION或者不包含子查询的查询都算作是SIMPLE类型。

        1
        mysql> EXPLAIN SELECT * FROM s1;
        1
        2
        # 连接查询也算是`SIMPLE`类型
        mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2;
    • PRIMARYUNIONUNION RESULT

      • 对于包含UNION或者UNION ALL或者子查询的大查询来说,它是由几个小查询组成的,其中最左边的那个查询的select_type值就是PRIMARY

      • 对于包含UNION或者UNION ALL的大查询来说,它是由几个小查询组成的,其中除了最左边的那个小查询以外,其余的小查询的select_type值就是UNION

      • MySQL选择使用临时表来完成UNION查询的去重工作,针对该临时表的查询的select_type就是UNION RESULT

        1
        mysql> EXPLAIN SELECT * FROM s1 UNION SELECT * FROM s2;
        1
        mysql> EXPLAIN SELECT * FROM s1 UNION ALL SELECT * FROM s2;
    • SUBQUERY

      • 如果包含子查询的查询语句不能够转为对应的semi-join的形式,并且该子查询是不相关子查询。该子查询的第一个SELECT关键字代表的那个查询的select_type就是SUBQUERY

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key1 FROM s2) OR key3 = 'a';

        可以看到,外层查询的select_type就是PRIMARY,子查询的select_type就是SUBQUERY。需要大家注意的是,由于select_type为SUBQUERY的子查询会被物化,所以只需要执行一遍。

    • DEPENDENT SUBQUERY

      • 如果包含子查询的查询语句不能够转为对应的semi-join的形式,并且该子查询是相关子查询,则该子查询的第一个SELECT关键字代表的那个查询的select_type就是DEPENDENT SUBQUERY。注意的是,select_type为DEPENDENT SUBQUERY的查询可能会被执行多次。

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key1 FROM s2 WHERE s1.key2 = s2.key2) OR key3 = 'a';
    • DEPENDENT UNION

      • 在包含UNION或者UNION ALL的大查询中,如果各个小查询都依赖于外层查询的话,那除了最左边的那个小查询之外,其余的小查询的select_type的值就是DEPENDENT UNION

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key1 FROM s2 WHERE key1 = 'a' UNION SELECT key1 FROM s1 WHERE key1 = 'b');

        这个查询比较复杂,大查询里包含了一个子查询,子查询里又是由UNION连起来的两个小查询。从执行计划中可以看出来,SELECT key1 FROM s2 WHERE key1=a这个小查询由于是子查询中第一个查询,所以它的select_typeDEPENDENT SUBQUERY,而SELECT key1 FROM s1 WHERE key1='b'这个查询的select_type就是DEPENDENT UNION。

    • DERIVED

      • 对于包含派生表的查询,该派生表对应的子查询的select_type就是DERIVED

        1
        mysql> EXPLAIN SELECT * FROM (SELECT key1, COUNT(*) AS c FROM s1 GROUP BY key1) AS derived_s1 WHERE c > 1;

        从执行计划中可以看出,id为2的记录就代表子查询的执行方式,它的select_typeDERIVED,说明该子查询是以物化的方式执行的。id为1的记录代表外层查询,大家注意看它的table列显示的是<derived2>,表示该查询是针对将派生表物化之后的表进行查询的。

    • MATERIALIZED

      • 当查询优化器在执行包含子查询的语句时,选择将子查询物化之后与外层查询进行连接查询时,该子查询对应的select_type属性就是MATERIALIZED

        1
        2
        # 子查询被转为了物化表
        mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key1 FROM s2);

6.4.4 partitions

  • 代表分区表中的命中情况,非分区表,该项为NULL。一般情况下我们的查询语句的执行计划的partitions列的值都是NULL。

  • https://dev.mysql.com/doc/refman/5.7/en/alter-table-partition-operations.html

  • 如果想详细了解,可以如下方式测试。创建分区表:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    -- 创建分区表,
    -- 按照id分区,id<100 p0分区,其他p1分区
    CREATE TABLE user_partitions (
    id INT auto_increment,
    NAME VARCHAR(12),PRIMARY KEY(id))
    PARTITION BY RANGE(id)(
    PARTITION p0 VALUES less than(100),
    PARTITION p1 VALUES less than MAXVALUE
    );
    1
    DESC SELECT * FROM user_partitions WHERE id>200;

    查询id大于200(200>100,p1分区)的记录,查看执行计划,partitions是p1,符合我们的分区规则:

6.4.5 type ☆

  • 执行计划的一条记录就代表着MySQL对某个表的执行查询时的访问方法,又称”访问类型”,其中的type列就表明了这个访问方法是啥,是较为重要的一个指标。比如,看到type列的值是ref,表明MySQL即将使用ref访问方法来执行对s1表的查询。

  • 完整的访问方法如下: systemconsteq_refreffulltextref_or_nullindex_mergeunique_subqueryindex_subqueryrangeindexALL

  • 我们详细解释一下:

    • system

      • 当表中只有一条记录并且该表使用的存储引擎的统计数据是精确的,比如MyISAM、Memory,那么对该表的访问方法就是system。比方说我们新建一个MyISAM表,并为其插入一条记录:

        1
        2
        3
        4
        5
        CREATE TABLE t(i INT) ENGINE=MYISAM;

        INSERT INTO t VALUES(1);

        mysql> EXPLAIN SELECT * FROM t;
      • 换成InnoDB。

        1
        2
        3
        4
        5
        CREATE TABLE tt(i INT) ENGINE=INNODB;

        INSERT INTO tt VALUES(1);

        EXPLAIN SELECT * FROM tt;
    • const

      • 当我们根据主键或者唯一二级索引列与常数进行等值匹配时,对单表的访问方法就是const

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE id = 10005;
        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key2 = 10066;
    • eq_ref

      • 在连接查询时,如果被驱动表是通过主键或者唯一二级索引列等值匹配的方式进行访问的(如果该主键或者唯一二级索引是联合索引的话,所有的索引列都必须进行等值比较),则对该被驱动表的访问方法就是eq_ref

        1
        mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.id = s2.id;

        从执行计划的结果中可以看出,MySQL打算将s2作为驱动表,s1作为被驱动表,重点关注s1的访问方法是eq-ref,表明在访问s1表的时候可以通过主键的等值匹配来进行访问。

    • ref

      • 当通过普通的二级索引列与常量进行等值匹配时来查询某个表,那么对该表的访问方法就可能是ref

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a';
    • ref_or_null

      • 当对普通二级索引进行等值匹配查询,该索引列的值也可以是NULL值时,那么对该表的访问方法就可能是ref_or_null

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' OR key1 IS NULL;
    • index_merge

      • 单表访问方法时在某些场景下可以使用IntersectionUnionSort-Union这三种索引合并的方式来执行查询。

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' OR key3 = 'a';
    • unique_subquery

      • unique_subquery是针对在一些包含IN子查询的查询语句中,如果查询优化器决定将IN子查询
        #转换为EXISTS子查询,而且子查询可以使用到主键进行等值匹配的话,那么该子查询执行计划的type列的值就是unique_subquery

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key2 IN (SELECT id FROM s2 WHERE s1.key1 = s2.key1) OR key3 = 'a';
    • range

      • 如果使用索引获取某些范围区间的记录,那么就可能使用到range访问方法。

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN ('a', 'b', 'c');
        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'a' AND key1 < 'b';
    • index

      • 当我们可以使用索引覆盖,但需要扫描全部的索引记录时,该表的访问方法就是index

        1
        mysql> EXPLAIN SELECT key_part2 FROM s1 WHERE key_part3 = 'a';

        上述查询中的搜索列表中只有key_part2一个列,而且搜索条件中也只有key_part3一个列,这两个列又恰好包含在idx-key_part这个索引中,可是搜索条件key-part3不能直接使用该索引进行ref或者range方式的访问,只能扫描整个idx_key-part索引的记录,所以查询计划的type列的值就是index。

        再一次强调,对于使用InnoDB存储引擎的表来说,二级素引的记录只包含索引列和主键列的值,而聚簇索引中包含用户定义的全部列以及一些隐列,所以扫描二级索引的代价比直接全表扫描,也就是扫描聚簇索引的代价更低一些。

    • ALL

      • 最熟悉的全表扫描。

        1
        mysql> EXPLAIN SELECT * FROM s1;
  • 一般来说,这些访问方法中除了All这个访问方法外,其余的访问方法都能用到索引,除了index_merge访问方法外,其余的访问方法都最多只能用到一个索引。

  • 小结:

    • 结果值从最好到最坏依次是:
      • system > const > eq_ref > ref >fulltext > ref_or_null > index_merge >unique_subquery > index_subquery > range > index> ALL
    • SQL性能优化的目标:至少要达到range级别,要求是ref级别,最好是consts级别。(阿里巴巴
      开发手册要求)

6.4.6 possible_keys和key

  • 在EXPLAIN语句输出的执行计划中,possible_keys列表示在某个查询语句中,对某个表执行单表查询时可能用到的索引有哪些。一般查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询使用。key列表示实际用到的索引有哪些,如果为NULL,则没有使用索引。比方说下边这个查询:

    1
    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'z' AND key3 = 'a';

    上述执行计划的possible_keys列的值是idx_key1,idx_key3,表示该查询可能使用到idx_key1 , idx_key3两个索引,然后key列的值是idx_key3,表示经过查询优化器计算使用不同索引的成本后,最后决定使用idx_key3来执行查询比较划算。

6.4.7 key_len ☆

  • 实际使用到的索引长度(即:字节数)。

  • 帮你检查是否充分的利用上了索引值越大越好,主要针对于联合索引,有一定的参考意义。

    1
    mysql> EXPLAIN SELECT * FROM s1 WHERE id = 10005;
    1
    mysql> EXPLAIN SELECT * FROM s1 WHERE key2 = 10126;
    1
    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a';
    1
    mysql> EXPLAIN SELECT * FROM s1 WHERE key_part1 = 'a';
    1
    mysql> EXPLAIN SELECT * FROM s1 WHERE key_part1 = 'a' AND key_part2 = 'b';
    1
    mysql> EXPLAIN SELECT * FROM s1 WHERE key_part1 = 'a' AND key_part2 = 'b' AND key_part3 = 'c';
    1
    mysql> EXPLAIN SELECT * FROM s1 WHERE key_part3 = 'a';
  • key_len的长度计算公式:

    1
    2
    3
    4
    5
    6
    7
    varchar(10)变长字段且允许NULL = 10 * ( character set:utf8=3,gbk=2,latin1=1)+1(NULL)+2(变长字段)

    varchar(10)变长字段且不允许NULL = 10 * ( character set:utf8=3,gbk=2,latin1=1)+2(变长字段)

    char(10)固定字段且允许NULL = 10 * ( character set:utf8=3,gbk=2,latin1=1)+1(NULL)

    char(10)固定字段且不允许NULL = 10 * ( character set:utf8=3,gbk=2,latin1=1)

6.4.8 ref

  • 当使用索引列等值查询时,与索引列进行等值匹配的对象信息。比如只是一个常数或者是某个列。

  • 当使用索引列等值匹配的条件去执行查询时,也就是在访问方法是const、eqref、ref、ref_or_nul1、unique_subquery、index_subquery其中之一时,ref列展示的就是与索引列作等值匹配的结构是什么,比如只是一个常数或者是某个列。大家看下边这个查询:

    1
    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a';

    可以看到ref列的值是const,表明在使用idx-key1索引执行查询时,与key1列作等值匹配的对象是一个常数,当然有时候更复杂一点:

    1
    mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.id = s2.id;
    1
    mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s2.key1 = UPPER(s1.key1);

6.4.9 rows ☆

  • 表示预估的需要读取的记录条数,值越小越好

    1
    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'z';

6.4.10 filtered

  • 某个表经过搜索条件过滤后剩余记录条数的百分比。

  • 如果使用的是索引执行的单表扫描,那么计算时需要估计出满足除使用到对应索引的搜索条件外的其他搜索条件的记录有多少条,越大越好

    1
    mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'z' AND common_field = 'a';
  • 对于单表查询来说,这个filtered列的值没什么意义,我们更关注在连接查询中驱动表对应的执行计划记录的filtered值,它决定了被驱动表要执行的次数(即:rows * filtered):

    1
    mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.key1 = s2.key1 WHERE s1.common_field = 'a';

    从执行计划中可以看出来,查询优化器打算把s1当作驱动表,s2当作被驱动表。我们可以看到驱动表s1表的执行计划的rows列为9895,filtered列为10.00,这意味着驱动表s1的扇出值就是9895×10.00%=
    989.5,这说明还要对被驱动表执行大约989次查询。

6.4.11 Extra ☆

  • 顾名思义,Extra列是用来说明一些额外信息的,包含不适合在其他列中显示但十分重要的额外信息。我们可以通过这些额外信息来更准确的理解MySQL到底将如何执行给定的查询语句。MySQL提供的额外信息有好几十个,我们就不一个一个介绍了,所以我们只挑比较重要的额外信息介绍给大家。

    • No tables used

      • 当查询语句的没有FROM子句时将会提示该额外信息,比如:

        1
        mysql> EXPLAIN SELECT 1;
    • Impossible WHERE

      • 查询语句的WHERE子句永远为FALSE时将会提示该额外信息。

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE 1 != 1;
    • Using where

      • 当我们使用全表扫描来执行对某个表的查询,并且该语句的WHERE子句中有针对该表的搜索条件时,在Extra列中会提示上述额外信息。

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE common_field = 'a';
      • 当使用索引访问来执行对某个表的查询,并且该语句的WHERE子句中有除了该索引包含的列之外的其他搜索条件时,在Extra列中也会提示上述额外信息。

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' AND common_field = 'a';
    • No matching min/max row

      • 当查询列表处有MIN或者MAX聚合函数,但是并没有符合WHERE子句中的搜索条件的记录时,将会提示该额外信息。

        1
        mysql> EXPLAIN SELECT MIN(key1) FROM s1 WHERE key1 = 'abcdefg';
        1
        2
        # NlPros是s1表中key1字段真实存在的数据
        mysql> EXPLAIN SELECT MIN(key1) FROM s1 WHERE key1 = 'wpjdMC';
    • Using index

      • 当我们的查询列表以及搜索条件中只包含属于某个索引的列,也就是在可以使用覆盖索引的情况下,在Extra列将会提示该额外信息。比方说下边这个查询中只需要用到idx_key1而不需要回表操作:

        1
        mysql> EXPLAIN SELECT key1,id FROM s1 WHERE key1 = 'a';
    • Using index condition

      • 有些搜索条件中虽然出现了索引列,但却不能使用到索引。

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'z' AND key1 LIKE '%a';

        其中的key1>'z'可以使用到索引,但是key1 LIKE '%a'却无法使用到索引,在以前版本的MySQL中,是按照下边步骤来执行这个查询的:

        • ①先根据key1>'z'这个条件,从二级索引idx_key1中获取到对应的二级索引记录。
        • ②根据上一步骤得到的二级索引记录中的主键值进行回表,找到完整的用户记录再检测该记录是否符合key1 LIKE '%a'这个条件,将符合条件的记录加入到最后的结果集。

        但是虽然key1 LIKE '%a'不能组成范围区间参与range访问方法的执行,但这个条件毕竟只涉及到了key1列,所以MySQL把上边的步骤改进了一下:

        • ①先根据key1>'z'这个条件,定位到二级索引idx_key1中对应的二级索引记录。
        • ②对于指定的二级索引记录,先不着急回表,而是先检测一下该记录是否满足key1 LIKE '%a'这个条件,如果这个条件不满足,则该二级索引记录压根儿就没必要回表。
        • ③对于满足key1 LIKE '%a'这个条件的二级索引记录执行回表操作。

        我们说回表操作其实是一个随机IO,比较耗时,所以上述修改虽然只改进了一点点,但是可以省去好多回表操作的成本。MySQL把他们的这个改进称之为索引条件下推(英文名:Index Condition Pushdown)。如果在查询语句的执行过程中将要使用索引条件下推这个特性,在Extra列中将会显示Using index condition

    • Using join buffer (Block Nested Loop)

      • 在连接查询执行过程中,当被驱动表不能有效的利用索引加快访问速度,MySQL一般会为其分配一块名叫join buffer的内存块来加快查询速度,也就是我们所讲的基于块的嵌套循环算法

        1
        mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.common_field = s2.common_field;
    • Not exists

      • 当我们使用左(外)连接时,如果WHERE子句中包含要求被驱动表的某个列等于NULL值的搜索条件,而且那个列又是不允许存储NULL值的,那么在该表的执行计划的Extra列就会提示Not exists额外信息。

        1
        mysql> EXPLAIN SELECT * FROM s1 LEFT JOIN s2 ON s1.key1 = s2.key1 WHERE s2.id IS NULL;
    • Using intersect(...) 、 Using union(...) 和 Using sort_union(...)

      • 如果执行计划的Extra列出现了Using intersect(...)提示,说明准备使用Intersect索引

      • 合并的方式执行查询,括号中的...表示需要进行索引合并的索引名称;

      • 如果出现了Using union(...)提示,说明准备使用Union索引合并的方式执行查询;

      • 出现了Using sort_union(...)提示,说明准备使用Sort-Union索引合并的方式执行查询。

        1
        mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' OR key3 = 'a';
    • Zero limit

      • 当我们的LIMIT子句的参数为0时,表示压根儿不打算从表中读出任何记录,将会提示该额外信息。

        1
        mysql> EXPLAIN SELECT * FROM s1 LIMIT 0;
    • Using filesort

      • 有一些情况下对结果集中的记录进行排序是可以使用到索引的,比如下边这个查询:

        1
        mysql> EXPLAIN SELECT * FROM s1 ORDER BY key1 LIMIT 10;
      • 这个查询语句可以利用idx_key1索引直接取出key1列的10条记录,然后再进行回表操作就好了。但是很多情况下排序操作无法使用到索引,只能在内存中(记录较少的时候)或者磁盘中(记录较多的时候)进行排序,MySQL把这种在内存中或者磁盘上进行排序的方式统称为文件排序(英文名: filesort)。如果某个查询需要使用文件排序的方式执行查询,就会在执行计划的Extra列中显示Using filesort提示:

        1
        mysql> EXPLAIN SELECT * FROM s1 ORDER BY common_field LIMIT 10;

        需要注意的是,如果查询中需要使用filesort的方式进行排序的记录非常多,那么这个过程是很耗费性能的,我们最好想办法将使用文件排序的执行方式改为使用索引进行排序

    • Using temporary

      • 在许多查询的执行过程中,MySQL可能会借助临时表来完成一些功能,比如去重、排序之类的,比如我们在执行许多包含DISTINCTGROUP BYUNION等子句的查询过程中,如果不能有效利用索引来完成查询,MySQL很有可能寻求通过建立内部的临时表来执行查询。如果查询中使用到了内部的临时表,在执行计划的Extra列将会显示Using temporary提示。

        1
        mysql> EXPLAIN SELECT DISTINCT common_field FROM s1;
        1
        mysql> EXPLAIN SELECT common_field, COUNT(*) AS amount FROM s1 GROUP BY common_field;
      • 执行计划中出现Using temporary并不是一个好的征兆,因为建立与维护临时表要付出很大成本的,所以我们最好能使用索引来替代掉使用临时表。比如:扫描指定的索引idx_key1即可。

        1
        mysql> EXPLAIN SELECT key1, COUNT(*) AS amount FROM s1 GROUP BY key1;

6.4.12 小结

  • EXPLAIN不考虑各种Cache。
  • EXPLAIN不能显示MySQL在执行查询时所作的优化工作。
  • EXPLAIN不会告诉你关于触发器、存储过程的信息或用户自定义函数对查询的影响情况。
  • 部分统计信息是估算的,并非精确值。

7. EXPLAIN的进一步使用

7.1 EXPLAIN四种输出格式

  • 这里谈谈EXPLAIN的输出格式。EXPLAIN可以输出四种格式: 传统格式JSON格式TREE格式 以及
    视化输出 。用户可以根据需要选择适用于自己的格式。

7.1.1 传统格式

  • 传统格式简单明了,输出是一个表格形式,概要说明查询计划。

    1
    mysql> EXPLAIN SELECT s1.key1, s2.key1 FROM s1 LEFT JOIN s2 ON s1.key1 = s2.key1 WHERE s2.common_field IS NOT NULL;

7.1.2 JSON格式

  • 第1种格式中介绍的EXPLAIN语句输出中缺少了一个衡量执行计划好坏的重要属性——成本。而JSON格式是四种格式里面输出信息最详尽的格式,里面包含了执行的成本信息。

    • JSON格式:在EXPLAIN单词和真正的查询语句中间加上FORMAT=JSON

      1
      EXPLAIN FORMAT=JSON SELECT ....
    • EXPLAIN的Column与JSON的对应关系:(来源于MySQL 5.7文档):

  • 这样我们就可以得到一个json格式的执行计划,里面包含该计划花费的成本,比如这样:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    mysql> EXPLAIN FORMAT=JSON SELECT * FROM s1 INNER JOIN s2 ON s1.key1 = s2.key2 WHERE s1.common_field = 'a' \G
    *************************** 1. row ***************************
    EXPLAIN: {
    "query_block": {
    "select_id": 1, # 整个查询语句只有1个SELECT关键字,该关键字对应的id号为1
    "cost_info": {
    "query_cost": "1360.07" # 整个查询的执行成本预计为1360.07
    },
    "nested_loop": [ # 几个表之间采用嵌套循环连接算法执行
    # 以下是参与嵌套循环连接算法的各个表的信息
    {
    "table": {
    "table_name": "s1", # s1是驱动表
    "access_type": "ALL", # 访问方法为ALL,意味着使用全表扫描访问
    "possible_keys": [ # 可能使用的索引
    "idx_key1"
    ],
    "rows_examined_per_scan": 9895, # 查询一次s1表大致需要扫描9895条记录
    "rows_produced_per_join": 989, # 驱动表s1的扇出是989
    "filtered": "10.00", # condition filtering代表的百分比
    "cost_info": {
    "read_cost": "914.80", # 稍后解释
    "eval_cost": "98.95", # 稍后解释
    "prefix_cost": "1013.75", # 单次查询s1表总共的成本
    "data_read_per_join": "1M" # 读取的数据量
    },
    "used_columns": [ # 执行查询中涉及到的列
    "id",
    "key1",
    "key2",
    "key3",
    "key_part1",
    "key_part2",
    "key_part3",
    "common_field"
    ],
    # 对s1表访问时针对单表查询的条件
    "attached_condition": "((`dbtest2`.`s1`.`common_field` = 'a') and (`dbtest2`.`s1`.`key1` is not null))"
    }
    },
    {
    "table": {
    "table_name": "s2", # s2是被驱动表
    "access_type": "eq_ref", # 访问方法为ref,意味着使用索引等值匹配的方式访问
    "possible_keys": [ # 可能使用的索引
    "idx_key2"
    ],
    "key": "idx_key2", # 实际使用的索引
    "used_key_parts": [ # 使用到的索引列
    "key2"
    ],
    "key_length": "5", # key_len
    "ref": [ # 与key2列进行等值匹配的对象
    "dbtest2.s1.key1"
    ],
    "rows_examined_per_scan": 1, # 查询一次s2表大致需要扫描1条记录
    "rows_produced_per_join": 989, # 被驱动表s2的扇出是968(由于后边没有多余的表进行连接,所以这个值也没啥用)
    "filtered": "100.00", # condition filtering代表的百分比
    "index_condition": "(cast(`dbtest2`.`s1`.`key1` as double) = cast(`dbtest2`.`s2`.`key2` as double))",
    "cost_info": {
    "read_cost": "247.38", # 稍后解释
    "eval_cost": "98.95", # 稍后解释
    "prefix_cost": "1360.08", # 单次查询s1、多次查询s2表总共的成本
    "data_read_per_join": "1M" # 读取的数据量
    },
    "used_columns": [ # 执行查询中涉及到的列
    "id",
    "key1",
    "key2",
    "key3",
    "key_part1",
    "key_part2",
    "key_part3",
    "common_field"
    ]
    }
    }
    ]
    }
    }
    1 row in set, 2 warnings (0.00 sec)
    • 我们使用#后边跟随注释的形式为大家解释了EXPLAIN FORMAT=JSON语句的输出内容,但是大家可能
      有疑问”cost_info“里边的成本看着怪怪的,它们是怎么计算出来的?先看s1表的”cost_info“部分:

      1
      2
      3
      4
      5
      6
      "cost_info": {
      "read_cost": "914.80",
      "eval_cost": "98.95",
      "prefix_cost": "1013.75",
      "data_read_per_join": "1M"
      }
      • read_cost是由下边这两部分组成的:

        • IO成本。
        • 检测rows × (1 - filter)条记录的CPU成本。

        小贴士: rows和filter都是我们前边介绍执行计划的输出列,在JSON格式的执行计划中,rows相当于rows_examined_per_scan,filtered名称不变。

      • eval_cost是这样计算的:

        • 检测rows × filter条记录的成本。
      • prefix_cost就是单独查询s1表的成本,也就是:

        • read_cost + eval_cost
      • data_read_per_join 表示在此次查询中需要读取的数据量。

    • 对于s2表的”cost_info”部分是这样的:

      1
      2
      3
      4
      5
      6
      "cost_info": {
      "read_cost": "247.38",
      "eval_cost": "98.95",
      "prefix_cost": "1360.08",
      "data_read_per_join": "1M"
      }
      • 由于s2表是被驱动表,所以可能被读取多次,这里的read_costeval_cost是访问多次s2表后累加起来的值,大家主要关注里边儿的prefix_cost的值代表的是整个连接查询预计的成本,也就是单次查询s1表和多次查询s2表后的成本的和,也就是:

        1
        247.38 + 98.95 + 1013.75 = 1360.08

7.1.3 TREE格式

  • TREE格式是8.0.16版本之后引入的新格式,主要根据查询的各个部分之间的关系各部分的执行顺序来描
    述如何查询:

    1
    2
    3
    4
    5
    6
    7
    8
    mysql> EXPLAIN FORMAT=tree SELECT * FROM s1 INNER JOIN s2 ON s1.key1 = s2.key2 WHERE s1.common_field = 'a'\G
    *************************** 1. row ***************************
    EXPLAIN: -> Nested loop inner join (cost=1360.08 rows=990)
    -> Filter: ((s1.common_field = 'a') and (s1.key1 is not null)) (cost=1013.75 rows=990)
    -> Table scan on s1 (cost=1013.75 rows=9895)
    -> Single-row index lookup on s2 using idx_key2 (key2=s1.key1), with index condition: (cast(s1.key1 as double) = cast(s2.key2 as double)) (cost=0.25 rows=1)

    1 row in set, 1 warning (0.00 sec)

7.1.4 可视化输出

  • 可视化输出,可以通过MySQL Workbench可视化查看MySQL的执行计划。通过点击Workbench的放大镜图
    标,即可生成可视化的查询计划。

  • 上图按从左到右的连接顺序显示表。红色框表示全表扫描,而绿色框表示使用索引查找。对于每个表,
    显示使用的索引。还要注意的是,每个表格的框上方是每个表访问所发现的行数的估计值以及访问该表
    的成本。

7.2 SHOW WARNINGS的使用

  • 在我们使用EXPLAIN语句查看了某个查询的执行计划后,紧接着还可以使用SHOW WARNINGS语句查看与这个查询的执行计划有关的一些扩展信息,比如这样:

    1
    mysql> EXPLAIN SELECT s1.key1, s2.key1 FROM s1 LEFT JOIN s2 ON s1.key1 = s2.key1 WHERE s2.common_field IS NOT NULL;
  • 使用完explain后紧接着使用`SHOW WARNINGS \G:

    1
    2
    3
    4
    5
    6
    mysql> SHOW WARNINGS\G
    *************************** 1. row ***************************
    Level: Note
    Code: 1003
    Message: /* select#1 */ select `dbtest2`.`s1`.`key1` AS `key1`,`dbtest2`.`s2`.`key1` AS `key1` from `dbtest2`.`s1` join `dbtest2`.`s2` where ((`dbtest2`.`s1`.`key1` = `dbtest2`.`s2`.`key1`) and (`dbtest2`.`s2`.`common_field` is not null))
    1 row in set (0.00 sec)

    大家可以看到SHOW WARNINGS展示出来的信息有三个字段,分别是LevelCodeMessage。我们最常见的就是Code为1003的信息,当Code值为1003时,Message字段展示的信息类似于查询优化器将我们的查询语句重写后的语句。比如我们上边的查询本来是一个左(外)连接查询,但是有一个s2.common_field IS NOT NULL的条件,这就会导致查询优化器把左(外)连接查询优化为内连接查询,从SHOW WARNINGSMessage字段也可以看出来,原本的LEFT JOIN已经变成了JOIN

8、分析优化器执行计划:trace

  • OPTIMIZER_TRACE 是MySQL 5.6引入的一项跟踪功能,它可以跟踪优化器做出的各种决策(比如访问表的方法、各种开销计算、各种转换等),并将跟踪结果记录到INFORMATION_SCHEMA.OPTIMIZER_TRACE表中。

  • 此功能默认关闭。开启trace,并设置格式为JSON,同时设置trace最大能够使用的内存大小,避免解析过程中因为默认内存过小而不能够完整展示。

    1
    2
    3
    SET optimizer_trace="enabled=on",end_markers_in_json=on;

    set optimizer_trace_max_mem_size=1000000;
  • 开启后,可分析如下语句:

    • SELECT
    • INSERT
    • REPLACE
    • UPDATE
    • DELETE
    • EXPLAIN
    • SET
    • DECLARE
    • CASE
    • IF
    • RETURN
    • CALL
  • 测试:执行如下SQL语句。

    1
    select * from student where id < 10;
  • 最后, 查询information_schema.optimizer_trace就可以知道MySQL是如何执行SQL的:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    136
    137
    138
    139
    140
    141
    142
    143
    144
    145
    146
    147
    148
    149
    150
    151
    152
    153
    154
    155
    156
    157
    158
    159
    160
    161
    162
    163
    164
    165
    166
    167
    168
    169
    170
    171
    172
    173
    174
    175
    176
    177
    178
    179
    180
    181
    182
    183
    184
    185
    186
    187
    188
    189
    190
    191
    192
    193
    194
    195
    196
    197
    198
    199
    200
    201
    202
    203
    204
    205
    206
    207
    mysql> select * from information_schema.optimizer_trace\G
    *************************** 1. row ***************************
    // 第1部分:查询语句
    QUERY: select * from student where id < 10
    // 第2部分:QUERY字段对应语句的跟踪信息
    TRACE: {
    "steps": [
    {
    "join_preparation": { /*预备工作*/
    "select#": 1,
    "steps": [
    {
    "expanded_query": "/* select#1 */ select `student`.`id` AS `id`,`student`.`stuno` AS `stuno`,`student`.`name` AS `name`,`student`.`age` AS `age`,`student`.`classId` AS `classId` from `student` where (`student`.`id` < 10)"
    }
    ] /* steps */
    } /* join_preparation */
    },
    {
    "join_optimization": {/*进行优化*/
    "select#": 1,
    "steps": [
    {
    "condition_processing": {/*条件处理*/
    "condition": "WHERE",
    "original_condition": "(`student`.`id` < 10)",
    "steps": [
    {
    "transformation": "equality_propagation",
    "resulting_condition": "(`student`.`id` < 10)"
    },
    {
    "transformation": "constant_propagation",
    "resulting_condition": "(`student`.`id` < 10)"
    },
    {
    "transformation": "trivial_condition_removal",
    "resulting_condition": "(`student`.`id` < 10)"
    }
    ] /* steps */
    } /* condition_processing */
    },
    {
    "substitute_generated_columns": {/*替换生成的列*/
    } /* substitute_generated_columns */
    },
    {
    "table_dependencies": [ /* 表的依赖关系*/
    {
    "table": "`student`",
    "row_may_be_null": false,
    "map_bit": 0,
    "depends_on_map_bits": [
    ] /* depends_on_map_bits */
    }
    ] /* table_dependencies */
    },
    {
    "ref_optimizer_key_uses": [ /* 使用键*/
    ] /* ref_optimizer_key_uses */
    },
    {
    "rows_estimation": [ /*行判断*/
    {
    "table": "`student`",
    "range_analysis": {
    "table_scan": {
    "rows": 3945207,
    "cost": 404306
    } /* table_scan */,/*表扫描*/
    "potential_range_indexes": [
    {
    "index": "PRIMARY",
    "usable": true,
    "key_parts": [
    "id"
    ] /* key_parts */
    }
    ] /* potential_range_indexes */,
    "setup_range_conditions": [
    ] /* 设置条件范围 */,
    "group_index_range": {
    "chosen": false,
    "cause": "not_group_by_or_distinct"
    } /* group_index_range */,
    "skip_scan_range": {
    "potential_skip_scan_indexes": [
    {
    "index": "PRIMARY",
    "usable": false,
    "cause": "query_references_nonkey_column"
    }
    ] /* potential_skip_scan_indexes */
    } /* skip_scan_range */,
    "analyzing_range_alternatives": {/*分析范围选项*/
    "range_scan_alternatives": [
    {
    "index": "PRIMARY",
    "ranges": [
    "id < 10"
    ] /* ranges */,
    "index_dives_for_eq_ranges": true,
    "rowid_ordered": true,
    "using_mrr": false,
    "index_only": false,
    "in_memory": 0.159895,
    "rows": 9,
    "cost": 1.79883,
    "chosen": true
    }
    ] /* range_scan_alternatives */,
    "analyzing_roworder_intersect": {
    "usable": false,
    "cause": "too_few_roworder_scans"
    } /* analyzing_roworder_intersect */
    } /* analyzing_range_alternatives */,
    "chosen_range_access_summary": {/*选择范围访问摘要*/
    "range_access_plan": {
    "type": "range_scan",
    "index": "PRIMARY",
    "rows": 9,
    "ranges": [
    "id < 10"
    ] /* ranges */
    } /* range_access_plan */,
    "rows_for_plan": 9,
    "cost_for_plan": 1.79883,
    "chosen": true
    } /* chosen_range_access_summary */
    } /* range_analysis */
    }
    ] /* rows_estimation */
    },
    {
    "considered_execution_plans": [/*考虑执行计划*/
    {
    "plan_prefix": [
    ] /* plan_prefix */,
    "table": "`student`",
    "best_access_path": {/*最佳访问路径*/
    "considered_access_paths": [
    {
    "rows_to_scan": 9,
    "access_type": "range",
    "range_details": {
    "used_index": "PRIMARY"
    } /* range_details */,
    "resulting_rows": 9,
    "cost": 2.69883,
    "chosen": true
    }
    ] /* considered_access_paths */
    } /* best_access_path */,
    "condition_filtering_pct": 100, /*行过滤百分比*/
    "rows_for_plan": 9,
    "cost_for_plan": 2.69883,
    "chosen": true
    }
    ] /* considered_execution_plans */
    },
    {
    "attaching_conditions_to_tables": { /*将条件附加到表上*/
    "original_condition": "(`student`.`id` < 10)",
    "attached_conditions_computation": [
    ] /* attached_conditions_computation */,
    "attached_conditions_summary": [ /*附加条件概要*/
    {
    "table": "`student`",
    "attached": "(`student`.`id` < 10)"
    }
    ] /* attached_conditions_summary */
    } /* attaching_conditions_to_tables */
    },
    {
    "finalizing_table_conditions": [
    {
    "table": "`student`",
    "original_table_condition": "(`student`.`id` < 10)",
    "final_table_condition ": "(`student`.`id` < 10)"
    }
    ] /* finalizing_table_conditions */
    },
    {
    "refine_plan": [ /*精简计划*/
    {
    "table": "`student`"
    }
    ] /* refine_plan */
    }
    ] /* steps */
    } /* join_optimization */
    },
    {
    "join_execution": { /*执行*/
    "select#": 1,
    "steps": [
    ] /* steps */
    } /* join_execution */
    }
    ] /* steps */
    }
    /
    /*第3部分:跟踪信息过长时,被截断的跟踪信息的字节数。*/
    MISSING_BYTES_BEYOND_MAX_MEM_SIZE: 0 /*丢失的超出最大容量的字节*/
    /*第4部分:执行跟踪语句的用户是否有查看对象的权限。当不具有权限时,该列信息为1且TRACE字段为空,一般在
    调用带有SQL SECURITY DEFINER的视图或者是存储过程的情况下,会出现此问题。*/
    INSUFFICIENT_PRIVILEGES: 0 /*缺失权限*/
    1 row in set (0.01 sec)

9、MySQL监控分析视图-sys schema

  • 关于MySQL的性能监控和问题诊断,我们一般都从performance_schema中去获取想要的数据,在MySQL5.7.7版本中新增sys schema,它将performance_schema和information_schema中的数据以更容易理解的方式总结归纳为”视图”,其目的就是为了降低查询performance_schema的复杂度,让DBA能够快速的定位问题。下面看看这些库中都有哪些监控表和视图,掌握了这些,在我们开发和运维的过程中就起到了事半功倍的效果。

9.1 Sys schema视图摘要

  • 1. 主机相关:以host_summary开头,主要汇总了IO延迟的信息。

  • 2. Innodb相关:以innodb开头,汇总了innodb buffer信息和事务等待innodb锁的信息。

  • 3. I/o相关:以io开头,汇总了等待I/O、I/O使用量情况。

  • 4.内存使用情况:以memory开头,从主机、线程、事件等角度展示内存的使用情况

  • 5.连接与会话信息:processlist和session相关视图,总结了会话相关信息。

  • 6. 表相关:以schema_table开头的视图,展示了表的统计信息。

  • 7. 索引信息:统计了索引的使用情况,包含冗余索引和未使用的索引情况。

  • 8.语句相关:以statement开头,包含执行全表扫描、使用临时表、排序等的语句信息。

  • 9. 用户相关:以user开头的视图,统计了用户使用的文件I/O、执行语句统计信息。

  • 10.等待事件相关信息:以wait开头,展示等待事件的延迟情况。

9.2 Sys schema视图使用场景

  • 索引情况

    1
    2
    3
    4
    5
    6
    7
    # 1. 查询冗余索引
    select * from sys.schema_redundant_indexes;
    # 2. 查询未使用过的索引
    select * from sys.schema_unused_indexes;
    # 3. 查询索引的使用情况
    select index_name,rows_selected,rows_inserted,rows_updated,rows_deleted
    from sys.schema_index_statistics where table_schema='dbname';
  • 表相关

    1
    2
    3
    4
    5
    6
    7
    8
    # 1. 查询表的访问量
    select table_schema,table_name,sum(io_read_requests+io_write_requests) as io from
    sys.schema_table_statistics group by table_schema,table_name order by io desc;
    # 2. 查询占用bufferpool较多的表
    select object_schema,object_name,allocated,data
    from sys.innodb_buffer_stats_by_table order by allocated limit 10;
    # 3. 查看表的全表扫描情况
    select * from sys.statements_with_full_table_scans where db='dbname';
  • 语句相关

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    # 1. 监控SQL执行的频率
    select db,exec_count,query from sys.statement_analysis
    order by exec_count desc;
    # 2. 监控使用了排序的SQL
    select db,exec_count,first_seen,last_seen,query
    from sys.statements_with_sorting limit 1;
    # 3. 监控使用了临时表或者磁盘临时表的SQL
    select db,exec_count,tmp_tables,tmp_disk_tables,query
    from sys.statement_analysis where tmp_tables>0 or tmp_disk_tables >0
    order by (tmp_tables+tmp_disk_tables) desc;
  • IO 相关

    1
    2
    3
    # 1. 查看消耗磁盘IO的文件
    select file,avg_read,avg_write,avg_read+avg_write as avg_io
    from sys.io_global_by_file_by_bytes order by avg_read limit 10;
  • Innodb相关

    1
    2
    # 1. 行锁阻塞情况
    select * from sys.innodb_lock_waits;

风险提示:

通过sys库去查询时,MySQL会消耗大量资源去收集相关信息,严重的可能会导致业务请求被阻塞,从而引起故障。建议生产上不要频繁的去查询sys或者performance_schema、information_schema来完成监控、巡检等工作。