mysql优化概述

MySQL参数设置

通用配置

  1. max_connections : MySQL能创建的最大连接数,如果数据库的并发量比较大,建议调高此值,以增加并行连接数量,当然连接数越多,由于MySQL会为每个连接创建连接缓冲区,连接数越多会消耗更多内存

  2. open_files_limit : MySQL打开的文件描述符限制,默认最小1024

  3. key_buffer_size : key_buffer_size指定索引缓冲区的大小,它决定索引处理的速度,尤其是索引读的速度。

  4. query_cache_size : 使用查询缓冲,MySQL将查询结果存放在缓冲区中,今后对于同样的SELECT语句(区分大小写),将直接从缓冲区中读取结果。

  5. wait_timeout : 一个请求的最大连接时间

InnoDB相关配置

bin log 刷盘

sync_binlog, binlog的刷新写入方式,这个参数不仅影响到binlog对MySQL所带来的性能损耗,而且还影响到MySQL中数据的完整性。参数设置说明如下:

  • 0: 事务提交时, write 到 page cache, 由 os 决定什么时候刷盘
  • 1: 事务提交时, 执行 fsync 刷盘
  • n: n个事务提交后, 调用 fsync 刷盘
redo log 刷盘

innodb_flush_logs_at_trx_commit, redo log 刷新方式

  • 0: 事务提交时,直接 write 到 redo log buffer, innodb 后台线程每 1 s执行一次 write 到 page cache, 并执行 fsync 刷盘
  • 1: 事务提交时,每次都 write 到 page cache, 并执行 fsync 刷盘
  • 2: 事务提交时, write 到 page cache, 由 innodb 线程每秒执行一次 fsync 刷盘 (与 0 是同一个 innodb 后台线程)

事务组提交

  • binlog_group_commit_sync_delay = n, n 微妙后提交一次 bin log
  • binlog_group_commit_sync_no_delay_count=n, n组事务后提交一次 bin log

这两个是或关系, 任意满足一个就会执行

innodb 其他相关参数
  1. innodb_buffer_pool_size

这是Innodb最重要的一个配置参数,这个参数控制Innodb本身的缓冲大小,也影响到,多少数据能在缓存中。建议该参数的配置在物理内存的70%-80%之间

  1. innodb_log_file_size

这个参数是设置 redo log大小。规则很简单:小日志文件写入慢,恢复快;大日志文件写入快,恢复慢。目前设置的是128M

SQL性能/锁分析

连接性能缝隙

  1. 最大连接数

查看系统最大连接数:

1
SHOW VARIABLES LIKE 'max_connections';

设置连接数, 在 my.conf 中:

1
max_connections = 2000
  1. 当前开放的连接/当前运行的连接
  • Thread_conneted: 代表当前已建立连接的数量,因为一个连接就需要一个线程,所以也可以看成当前被使用的线程数,
  • Thread_running: 代表当前激活的(当前并发执行的statement/command的)线程数。有时候连接已建立,但是连接处于sleep状态。如果sql性能足够好.可能 thread running 极少就可以处理,当 sql 出了问题 running 就会飙升

threads_running 飙高表示server目前压力较大,一般是客户端压力突增/IO问题/CPU问题/异常SQL等原因引起,需要定位问题源头并马上解决,否则上层应用受到更大影响,可能导致”server hang住”

查看 Thread 相关:

1
show status like 'Thread%' \G;
  1. show engine innodb status 查看

慢查询分析

系统慢SQL记录,使用 slowLog记录,开启慢查询日志:

1
2
3
4
5
6
7
8
# 检查是否开启慢查询日志
show variables like '%slow%';
# 如果没有开启,也可以在运行时动态开启这个参数
set global slow_query_log=ON;
# 设置慢查询记录查询耗时多长的SQL,这里设置成100毫秒
set long_query_time = 0.1;
# 设置慢查询日志路径
set slow_query_log_file = /data/log/mysql/slow_query.log

这里在慢查询日志中找到了慢SQL后,就需要用执行计划来查看SQL语句是否命中索引,根据具体情况来优化SQL

锁分析

information_schema下面有三张表:INNODB_TRXINNODB_LOCKSINNODB_LOCK_WAITS,通过这三张表,可以更简单地监控当前的事务并分析可能存在的问题。

  1. INNODB_TRX
  • trx_id:InnoDB存储引擎内部唯一的事物ID
  • trx_status:当前事务的状态
  • trx_status:事务的开始时间
  • trx_requested_lock_id:等待事务的锁ID
  • trx_wait_started:事务等待的开始时间
  • trx_weight:事务的权重,反应一个事务修改和锁定的行数,当发现死锁需要回滚时,权重越小的值被回滚
  • trx_mysql_thread_id:MySQL中的进程ID,与show processlist中的ID值相对应
  • trx_query:事务运行的SQL语句
  1. INNODB_LOCKS
  • LOCK_ID 一个唯一的锁ID号,内部为 InnoDB。
  • LOCK_TRX_ID 持有锁的交易的ID
  • LOCK_MODE 如何请求锁定。允许锁定模式描述符 S,X, IS,IX, GAP,AUTO_INC。锁定模式描述符可以组合使用以识别特定的锁定模式。
  • LOCK_TYPE 锁的类型
  • LOCK_TABLE 已锁定或包含锁定记录的表的名称
  • LOCK_INDEX 索引的名称,如果LOCK_TYPE是 RECORD; 否则NULL
  • LOCK_SPACE 锁定记录的表空间ID,如果 LOCK_TYPE是RECORD; 否则NULL
  • LOCK_PAGE 锁定记录的页码,如果 LOCK_TYPE是RECORD; 否则NULL。
  • LOCK_REC 页面内锁定记录的堆号,如果 LOCK_TYPE是RECORD; 否则NULL。
  • LOCK_DATA 与锁相关的数据(如果有)。如果 LOCK_TYPE是RECORD,是锁定的记录的主键值,否则NULL。
    此列包含锁定行中主键列的值,格式为有效的SQL字符串。如果没有主键,LOCK_DATA则是唯一的InnoDB内部行ID号。如果对键值或范围高于索引中的最大值的间隙锁定,则LOCK_DATA 报告supremum pseudo-record。当包含锁定记录的页面不在缓冲池中时(如果在保持锁定时将其分页到磁盘),InnoDB不从磁盘获取页面,以避免不必要的磁盘操作。相反, LOCK_DATA设置为 NULL。
  1. INNODB_LOCK_WAITS
  • REQUESTING_TRX_ID 请求(阻止)事务的ID。
  • REQUESTED_LOCK_ID 事务正在等待的锁的ID。
  • BLOCKING_TRX_ID 阻止事务的ID。
  • BLOCKING_LOCK_ID 由阻止另一个事务继续进行的事务所持有的锁的ID

explain 执行计划分析

一条查询语句在经过MySQL查询优化器的各种基于成本和规则的优化会后生成一个执行计划,这个执行计划展示了接下来具体执行查询的方式,比如多表连接的顺序是什么,对于每个表采用什么访问方法来具体执行查询等等。大概使用如下:

1
2
3
4
5
6
mysql> EXPLAIN SELECT 1;
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------+
| 1 | SIMPLE | NULL | NULL | NULL | NULL | NULL | NULL | NULL | NULL | NULL | No tables used |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------+

每个列的作用:

列名描述
id在一个大的查询语句中每个SELECT关键字都对应一个唯一的id
select_typeSELECT关键字对应的那个查询的类型
table表名
partitions分区信息
type单表的访问方法
possible_keys可能用到的索引
key实际用上的索引
key_len实际使用的索引的长度
ref当使用索引列等值查询时,与索引列进行等值匹配的对象信息
rows预估的需要读取的记录条数
filtered某个表经过搜索条件过滤后剩余记录条数的百分比
Extra额外提示信息

执行计划各列详细信息

id

查询语句中每出现一个SELECT关键字,MySQL就会为它分配一个唯一的id值。通常简单的查询语句只还有一个SELECT关键字,但是有两种情况会出现多个SELECT关键字:

  1. 包含子查询的情况:SELECT * FROM s1 WHERE key1 IN (SELECT key3 FROM s2)。这个查询语句就包含两个SELECT关键字
  2. 包含union关键字: SELECT * FROM s1 UNION SELECT * FROM s2

针对于连接查询,一个SELECT关键字后边的FROM子句中可以跟随多个表,所以在连接查询的执行计划中,每个表都会对应一条记录,但是这些记录的id值都是相同的. 在连接查询中,每个表都会对应一条记录,这些记录的id列的值是相同的,出现在前边的表表示驱动表,出现在后边的表表示被驱动表。比如:

1
2
3
4
5
6
7
mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2;
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+---------------------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+---------------------------------------+
| 1 | SIMPLE | s1 | NULL | ALL | NULL | NULL | NULL | NULL | 9688 | 100.00 | NULL |
| 1 | SIMPLE | s2 | NULL | ALL | NULL | NULL | NULL | NULL | 9954 | 100.00 | Using join buffer (Block Nested Loop) |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+---------------------------------------+

对于包含子查询的查询语句来说,就可能涉及多个SELECT关键字,所以在包含子查询的查询语句的执行计划中,每个SELECT关键字都会对应一个唯一的id值,比如这样:

1
2
3
4
5
6
7
mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN (SELECT key1 FROM s2) OR key3 = 'a';
+----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-------------+
| 1 | PRIMARY | s1 | NULL | ALL | idx_key3 | NULL | NULL | NULL | 9688 | 100.00 | Using where |
| 2 | SUBQUERY | s2 | NULL | index | idx_key1 | idx_key1 | 303 | NULL | 9954 | 100.00 | Using index |
+----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-------------+
select_type

每一个SELECT关键字代表的小查询都定义了一个称之为select_type的属性,代表着这个小查询在整个大查询中的查询类型,select_type的取值为:

名称描述
SIMPLE查询语句中不包含UNION或者子查询
PRIMARY对于包含UNIONUNION ALL或者子查询的大查询来说,它是由几个小查询组成的,其中最左边的那个查询的select_type值就是PRIMARY(顾名思义为主查询)
UNION对于包含UNION或者UNION ALL的大查询来说,它是由几个小查询组成的,其中除了最左边的那个小查询以外,其余的小查询的select_type值就是UNION
UNION RESULTMySQL选择使用临时表来完成UNION查询的去重工作(UNION ALL),针对该临时表的查询的select_type就是UNION RESULT
SUBQUERY子查询的第一个SELECT(被物化,只执行一次)
DEPENDENT SUBQUERY子查询的第一个SELECT(可能会被执行多次,取决外层的查询)
DEPENDENT UNION在包含UNION或者UNION ALL的大查询中,如果各个小查询都依赖于外层查询的话,那除了最左边的那个小查询之外,其余的小查询的select_type的值就是DEPENDENT UNION
DERIVED导出表的SELECT(FROM子句的子查询)
MATERIALIZED
table

不论查询语句有多复杂,里面包含了多少个表,到最后也是需要对每个表进行单表访问的,MySQLEXPLAIN语句输出的每条记录都对应着某个单表的访问方法,该条记录的table列代表着该表的表名。假如一个连接查询,执行计划如下:

1
2
3
4
5
6
7
mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2;
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+---------------------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+---------------------------------------+
| 1 | SIMPLE | s1 | NULL | ALL | NULL | NULL | NULL | NULL | 9688 | 100.00 | NULL |
| 1 | SIMPLE | s2 | NULL | ALL | NULL | NULL | NULL | NULL | 9954 | 100.00 | Using join buffer (Block Nested Loop) |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+---------------------------------------+
type

执行计划的一条记录就代表着MySQL对某个表的执行查询时的访问方法,其中的type列就表明了这个访问方法是什么。完整的访问方法依次从好到差如下:system > const > eq_ref > ref > fulltext > ref_or_null > unique_subquery > index_subquery > range > index_merge > index > ALL

  • system : 表中只有一条记录, 并且存储引擎的统计是精确的(如 Myisam,表结构会存储表中有多少条记录。 InnoDB只会存一个大概的值,并不精确)

  • const: 根据主键或者唯一二级索引列(unique)与常数进行等值匹配。

    EXPLAIN SELECT * FROM s1 WHERE id = 5, 一次就能匹配到

  • eq_ref: 在连接查询时,如果被驱动表是通过主键或者唯一二级索引(unique)等值匹配的方式进行访问的,则对该被驱动表的访问方法就是eq_ref。如:

    1
    2
    3
    4
    5
    6
    7
    mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.id = s2.id;
    +----+-------------+-------+------------+--------+---------------+---------+---------+-----------------+------+----------+-------+
    | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
    +----+-------------+-------+------------+--------+---------------+---------+---------+-----------------+------+----------+-------+
    | 1 | SIMPLE | s1 | NULL | ALL | PRIMARY | NULL | NULL | NULL | 9688 | 100.00 | NULL |
    | 1 | SIMPLE | s2 | NULL | eq_ref | PRIMARY | PRIMARY | 4 | xiaohaizi.s1.id | 1 | 100.00 | NULL |
    +----+-------------+-------+------------+--------+---------------+---------+---------+-----------------+------+----------+-------+

    从执行计划的结果中可以看出,s1作为驱动表,s2作为被驱动表,s2的访问方法是eq_ref表明在访问s2表的时候可以通过主键的等值匹配来进行访问

  • ref : 当通过普通的二级索引列与常量进行等值匹配时来查询某个表,那么对该表的访问方法就可能是ref

  • fulltext: 全文索引

  • ref_or_null: 当对普通二级索引进行等值匹配查询,该索引列的值也可以是NULL值时,那么对该表的访问方法就可能是ref_or_null。如EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' OR key1 IS NULL,该查询条件表明 key1 的取值可能是 null, 所以这个查询的 type 就是 ref_or_null

  • index_merge: 一般情况下对于某个表的查询只能使用到一个索引,但在某些场景下可以使用IntersectionUnionSort-Union这三种索引合并的方式来执行查询。

  • unique_subquery: 类似于两表连接中被驱动表的eq_ref访问方法,unique_subquery是针对在一些包含IN子查询的查询语句中,如果查询优化器决定将IN子查询转换为EXISTS子查询,而且子查询可以使用到主键进行等值匹配的话,那么该子查询执行计划的type列的值就是unique_subquery

  • index_subquery: index_subqueryunique_subquery类似,只不过访问子查询中的表时使用的是普通的索引

  • range: 如果使用索引获取某些范围区间的记录,那么就可能使用到range访问方法

  • index : 当可以使用索引覆盖,但需要扫描全部的索引记录时(full index scan),该表的访问方法就是index。 所要查询的数据直接在索引树中就可以获取到, 而不需要扫描聚簇索引数据. 当是这种情况时, Extra 字段 会显示 Using index

  • ALL: 全表扫描

possible key 和 key

possible_keys列表示在某个查询语句中,对某个表执行单表查询时可能用到的索引有哪些,key列表示实际用到的索引有哪些。

key_len

key_len列表示当优化器决定使用某个索引执行查询时,该索引记录的最大长度。计算方法如下:

  • 对于使用固定长度类型的索引列来说,它实际占用的存储空间的最大长度就是该固定值,对于指定字符集的变长类型的索引列来说,比如某个索引列的类型是VARCHAR(100),使用的字符集是utf8,那么该列实际占用的最大存储空间就是100 × 3 = 300个字节
  • 如果该索引列可以存储NULL值,则key_len比不可以存储NULL值时多1个字节
  • 对于变长字段来说,都会有2个字节的空间来存储该变长列的实际长度
ref

当使用索引列等值匹配的条件去执行查询时,也就是在访问方法是consteq_refrefref_or_nullunique_subqueryindex_subquery其中之一时,ref列展示的就是与索引列作等值匹配的是什么,比如只是一个常数或者是某个列。

一般情况下 ref 的值是const,代表与索引列作等值匹配的是常数。也有复杂一些的情况:

1
2
3
4
5
6
7
mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.id = s2.id;
+----+-------------+-------+------------+--------+---------------+---------+---------+-----------------+------+----------+-------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+--------+---------------+---------+---------+-----------------+------+----------+-------+
| 1 | SIMPLE | s1 | NULL | ALL | PRIMARY | NULL | NULL | NULL | 9688 | 100.00 | NULL |
| 1 | SIMPLE | s2 | NULL | eq_ref | PRIMARY | PRIMARY | 4 | test.s1.id | 1 | 100.00 | NULL |
+----+-------------+-------+------------+--------+---------------+---------+---------+-----------------+------+----------+-------+

可以看到对被驱动表s2的访问方法是eq_ref,而对应的ref列的值是test.s1.id,这说明在对被驱动表进行访问时会用到PRIMARY索引,也就是聚簇索引与一个列进行等值匹配的条件,于s2表的id作等值匹配的对象就是test.s1.id列(注意这里把数据库名也写出来了)。

rows

如果查询优化器决定使用全表扫描的方式对某个表执行查询时,执行计划的rows列就代表预计需要扫描的行数,如果使用索引来执行查询时,执行计划的rows列就代表预计扫描的索引记录行数。

filterd

连接查询的成本中有个condition filtering的概念,就是MySQL在计算驱动表扇出时采用的一个策略:

  • 如果使用的是全表扫描的方式执行的单表查询,那么计算驱动表扇出时需要估计出满足搜索条件的记录到底有多少条。
  • 如果使用的是索引执行的单表扫描,那么计算驱动表扇出的时候需要估计出满足除使用到对应索引的搜索条件外的其他搜索条件的记录有多少条。
extra

Extra列是用来说明一些额外信息的,我们可以通过这些额外信息来更准确的理解MySQL到底将如何执行给定的查询语句。常见的提示信息大概有:

  • Using index : 查询列表以及搜索条件中只包含属于某个索引的列,也就是在可以使用索引覆盖,不需要回表。

  • Using index condition: 有些搜索条件中虽然出现了索引列,但却不能使用到索引。

    比如SELECT * FROM s1 WHERE key1 > 'z' AND key1 LIKE '%a'

    在原来的 MySQL 版本中(5.7一下),执行步骤如下:

    1. 先根据key1 > 'z'这个条件,从二级索引idx_key1中获取到对应的二级索引记录
    2. 根据上一步骤得到的二级索引记录中的主键值进行回表,找到完整的用户记录再检测该记录是否符合key1 LIKE '%a'这个条件,将符合条件的记录加入到最后的结果集

    虽然key1 LIKE '%a'不能组成范围区间参与range访问方法的执行,但这个条件毕竟只涉及到了key1列,所以MySQL对上边的步骤进行了一下改进:

    1. 先根据key1 > 'z'这个条件,定位到二级索引idx_key1中对应的二级索引记录
    2. 对于指定的二级索引记录,先不着急回表,而是先检测一下该记录是否满足key1 LIKE '%a'这个条件,如果这个条件不满足,则该二级索引记录压根儿就没必要回表
    3. 对于满足key1 LIKE '%a'这个条件的二级索引记录执行回表操作

    回表操作其实是一个随机IO,比较耗时,所以上述修改虽然只改进了一点,但是可以省去很多回表操作的成本。MySQL这个改进称之为索引条件下推Index Condition Pushdown)。

  • Using where : 使用全表扫描来执行对某个表的查询,并且该语句的WHERE子句中有针对该表的搜索条件

  • Using filesort: 排序操作无法使用到索引,只能在内存中(记录较少的时候)或者磁盘中(记录较多的时候)进行排序,MySQL中把这种在内存中或者磁盘上进行排序的方式统称为文件排序(filesort)。如果某个查询需要使用文件排序的方式执行查询,就会在执行计划的Extra列中显示Using filesort提示

  • Using join buffer (Block Nested Loop): 在连接查询执行过程中,当被驱动表不能有效的利用索引加快访问速度,MySQL一般会为其分配一块名叫join buffer的内存块来加快查询速度,也就是我们所讲的基于块的嵌套循环算法

    比如以下语句:

    1
    2
    3
    4
    5
    6
    7
    mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.common_field = s2.common_field;
    +----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------------------------------------------+
    | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
    +----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------------------------------------------+
    | 1 | SIMPLE | s1 | NULL | ALL | NULL | NULL | NULL | NULL | 9688 | 100.00 | NULL |
    | 1 | SIMPLE | s2 | NULL | ALL | NULL | NULL | NULL | NULL | 9954 | 10.00 | Using where; Using join buffer (Block Nested Loop) |
    +----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------------------------------------------+

    可以在对s2表的执行计划的Extra列显示了两个提示:

    • Using join buffer (Block Nested Loop):这是因为对表s2的访问不能有效利用索引,只好退而求其次,使用join buffer来减少对s2表的访问次数,从而提高性能。
    • Using where:可以看到查询语句中有一个s1.common_field = s2.common_field条件,因为s1是驱动表,s2是被驱动表,所以在访问s2表时,s1.common_field的值已经确定下来了,所以实际上查询s2表的条件就是s2.common_field = 一个常数,所以提示了Using where额外信息。

参考资料


mysql优化概述
https://haobin.work/2019/12/06/mysql/mysql优化概述/
作者
Leo Hao
发布于
2019年12月6日
许可协议