mysql优化概述
MySQL参数设置
通用配置
max_connections
: MySQL能创建的最大连接数,如果数据库的并发量比较大,建议调高此值,以增加并行连接数量,当然连接数越多,由于MySQL会为每个连接创建连接缓冲区,连接数越多会消耗更多内存open_files_limit
: MySQL打开的文件描述符限制,默认最小1024key_buffer_size
: key_buffer_size指定索引缓冲区的大小,它决定索引处理的速度,尤其是索引读的速度。query_cache_size
: 使用查询缓冲,MySQL将查询结果存放在缓冲区中,今后对于同样的SELECT语句(区分大小写),将直接从缓冲区中读取结果。wait_timeout
: 一个请求的最大连接时间
InnoDB相关配置
bin log 刷盘
sync_binlog, binlog
的刷新写入方式,这个参数不仅影响到binlog
对MySQL所带来的性能损耗,而且还影响到MySQL中数据的完整性。参数设置说明如下:
- 0: 事务提交时, write 到 page cache, 由 os 决定什么时候刷盘
- 1: 事务提交时, 执行 fsync 刷盘
- n: n个事务提交后, 调用 fsync 刷盘
redo log 刷盘
innodb_flush_logs_at_trx_commit, redo log 刷新方式
- 0: 事务提交时,直接 write 到 redo log buffer, innodb 后台线程每 1 s执行一次 write 到 page cache, 并执行 fsync 刷盘
- 1: 事务提交时,每次都 write 到 page cache, 并执行 fsync 刷盘
- 2: 事务提交时, write 到 page cache, 由 innodb 线程每秒执行一次 fsync 刷盘 (与 0 是同一个 innodb 后台线程)
事务组提交
- binlog_group_commit_sync_delay = n, n 微妙后提交一次 bin log
- binlog_group_commit_sync_no_delay_count=n, n组事务后提交一次 bin log
这两个是或关系, 任意满足一个就会执行
innodb 其他相关参数
- innodb_buffer_pool_size
这是Innodb最重要的一个配置参数,这个参数控制Innodb本身的缓冲大小,也影响到,多少数据能在缓存中。建议该参数的配置在物理内存的70%-80%
之间
- innodb_log_file_size
这个参数是设置 redo log
大小。规则很简单:小日志文件写入慢,恢复快;大日志文件写入快,恢复慢。目前设置的是128M
SQL性能/锁分析
连接性能缝隙
- 最大连接数
查看系统最大连接数:
1 |
|
设置连接数, 在 my.conf
中:
1 |
|
- 当前开放的连接/当前运行的连接
Thread_conneted
: 代表当前已建立连接的数量,因为一个连接就需要一个线程,所以也可以看成当前被使用的线程数,Thread_running
: 代表当前激活的(当前并发执行的statement/command的)线程数。有时候连接已建立,但是连接处于sleep状态。如果sql性能足够好.可能 thread running 极少就可以处理,当 sql 出了问题 running 就会飙升
threads_running 飙高表示server目前压力较大,一般是客户端压力突增/IO问题/CPU问题/异常SQL等原因引起,需要定位问题源头并马上解决,否则上层应用受到更大影响,可能导致”server hang住”
查看 Thread 相关:
1 |
|
- show engine innodb status 查看
慢查询分析
系统慢SQL记录,使用 slowLog
记录,开启慢查询日志:
1 |
|
这里在慢查询日志中找到了慢SQL后,就需要用执行计划来查看SQL语句是否命中索引,根据具体情况来优化SQL
锁分析
在information_schema
下面有三张表:INNODB_TRX
、INNODB_LOCKS
、INNODB_LOCK_WAITS
,通过这三张表,可以更简单地监控当前的事务并分析可能存在的问题。
- INNODB_TRX
- trx_id:InnoDB存储引擎内部唯一的事物ID
- trx_status:当前事务的状态
- trx_status:事务的开始时间
- trx_requested_lock_id:等待事务的锁ID
- trx_wait_started:事务等待的开始时间
- trx_weight:事务的权重,反应一个事务修改和锁定的行数,当发现死锁需要回滚时,权重越小的值被回滚
- trx_mysql_thread_id:MySQL中的进程ID,与show processlist中的ID值相对应
- trx_query:事务运行的SQL语句
- INNODB_LOCKS
- LOCK_ID 一个唯一的锁ID号,内部为 InnoDB。
- LOCK_TRX_ID 持有锁的交易的ID
- LOCK_MODE 如何请求锁定。允许锁定模式描述符 S,X, IS,IX, GAP,AUTO_INC。锁定模式描述符可以组合使用以识别特定的锁定模式。
- LOCK_TYPE 锁的类型
- LOCK_TABLE 已锁定或包含锁定记录的表的名称
- LOCK_INDEX 索引的名称,如果LOCK_TYPE是 RECORD; 否则NULL
- LOCK_SPACE 锁定记录的表空间ID,如果 LOCK_TYPE是RECORD; 否则NULL
- LOCK_PAGE 锁定记录的页码,如果 LOCK_TYPE是RECORD; 否则NULL。
- LOCK_REC 页面内锁定记录的堆号,如果 LOCK_TYPE是RECORD; 否则NULL。
- LOCK_DATA 与锁相关的数据(如果有)。如果 LOCK_TYPE是RECORD,是锁定的记录的主键值,否则NULL。
此列包含锁定行中主键列的值,格式为有效的SQL字符串。如果没有主键,LOCK_DATA则是唯一的InnoDB内部行ID号。如果对键值或范围高于索引中的最大值的间隙锁定,则LOCK_DATA 报告supremum pseudo-record。当包含锁定记录的页面不在缓冲池中时(如果在保持锁定时将其分页到磁盘),InnoDB不从磁盘获取页面,以避免不必要的磁盘操作。相反, LOCK_DATA设置为 NULL。
- INNODB_LOCK_WAITS
- REQUESTING_TRX_ID 请求(阻止)事务的ID。
- REQUESTED_LOCK_ID 事务正在等待的锁的ID。
- BLOCKING_TRX_ID 阻止事务的ID。
- BLOCKING_LOCK_ID 由阻止另一个事务继续进行的事务所持有的锁的ID
explain 执行计划分析
一条查询语句在经过MySQL
查询优化器的各种基于成本和规则的优化会后生成一个执行计划
,这个执行计划展示了接下来具体执行查询的方式,比如多表连接的顺序是什么,对于每个表采用什么访问方法来具体执行查询等等。大概使用如下:
1 |
|
每个列的作用:
列名 | 描述 |
---|---|
id | 在一个大的查询语句中每个SELECT 关键字都对应一个唯一的id |
select_type | SELECT 关键字对应的那个查询的类型 |
table | 表名 |
partitions | 分区信息 |
type | 单表的访问方法 |
possible_keys | 可能用到的索引 |
key | 实际用上的索引 |
key_len | 实际使用的索引的长度 |
ref | 当使用索引列等值查询时,与索引列进行等值匹配的对象信息 |
rows | 预估的需要读取的记录条数 |
filtered | 某个表经过搜索条件过滤后剩余记录条数的百分比 |
Extra | 额外提示信息 |
执行计划各列详细信息
id
查询语句中每出现一个SELECT
关键字,MySQL
就会为它分配一个唯一的id
值。通常简单的查询语句只还有一个SELECT
关键字,但是有两种情况会出现多个SELECT
关键字:
- 包含子查询的情况:
SELECT * FROM s1 WHERE key1 IN (SELECT key3 FROM s2)
。这个查询语句就包含两个SELECT
关键字 - 包含
union
关键字:SELECT * FROM s1 UNION SELECT * FROM s2
针对于连接查询,一个SELECT
关键字后边的FROM
子句中可以跟随多个表,所以在连接查询的执行计划中,每个表都会对应一条记录,但是这些记录的id值都是相同的. 在连接查询中,每个表都会对应一条记录,这些记录的id列的值是相同的,出现在前边的表表示驱动表,出现在后边的表表示被驱动表。比如:
1 |
|
对于包含子查询的查询语句来说,就可能涉及多个SELECT
关键字,所以在包含子查询的查询语句的执行计划中,每个SELECT
关键字都会对应一个唯一的id
值,比如这样:
1 |
|
select_type
每一个SELECT
关键字代表的小查询都定义了一个称之为select_type
的属性,代表着这个小查询在整个大查询中的查询类型,select_type
的取值为:
名称 | 描述 |
---|---|
SIMPLE | 查询语句中不包含UNION 或者子查询 |
PRIMARY | 对于包含UNION 、UNION ALL 或者子查询的大查询来说,它是由几个小查询组成的,其中最左边的那个查询的select_type 值就是PRIMARY (顾名思义为主查询) |
UNION | 对于包含UNION 或者UNION ALL 的大查询来说,它是由几个小查询组成的,其中除了最左边的那个小查询以外,其余的小查询的select_type 值就是UNION |
UNION RESULT | MySQL选择使用临时表来完成UNION 查询的去重工作(UNION ALL),针对该临时表的查询的select_type 就是UNION RESULT |
SUBQUERY | 子查询的第一个SELECT(被物化,只执行一次) |
DEPENDENT SUBQUERY | 子查询的第一个SELECT(可能会被执行多次,取决外层的查询) |
DEPENDENT UNION | 在包含UNION 或者UNION ALL 的大查询中,如果各个小查询都依赖于外层查询的话,那除了最左边的那个小查询之外,其余的小查询的select_type 的值就是DEPENDENT UNION 。 |
DERIVED | 导出表的SELECT(FROM子句的子查询) |
MATERIALIZED |
table
不论查询语句有多复杂,里面包含了多少个表,到最后也是需要对每个表进行单表访问的,MySQL
EXPLAIN语句输出的每条记录都对应着某个单表的访问方法,该条记录的table列代表着该表的表名。假如一个连接查询,执行计划如下:
1 |
|
type
执行计划的一条记录就代表着MySQL
对某个表的执行查询时的访问方法,其中的type
列就表明了这个访问方法是什么。完整的访问方法依次从好到差如下:system > const > eq_ref > ref > fulltext > ref_or_null > unique_subquery > index_subquery > range > index_merge > index > ALL
。
system
: 表中只有一条记录, 并且存储引擎的统计是精确的(如 Myisam,表结构会存储表中有多少条记录。 InnoDB只会存一个大概的值,并不精确)const
: 根据主键或者唯一二级索引列(unique
)与常数进行等值匹配。如
EXPLAIN SELECT * FROM s1 WHERE id = 5
, 一次就能匹配到eq_ref
: 在连接查询时,如果被驱动表是通过主键或者唯一二级索引(unique
)等值匹配的方式进行访问的,则对该被驱动表的访问方法就是eq_ref
。如:1
2
3
4
5
6
7mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.id = s2.id;
+----+-------------+-------+------------+--------+---------------+---------+---------+-----------------+------+----------+-------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+--------+---------------+---------+---------+-----------------+------+----------+-------+
| 1 | SIMPLE | s1 | NULL | ALL | PRIMARY | NULL | NULL | NULL | 9688 | 100.00 | NULL |
| 1 | SIMPLE | s2 | NULL | eq_ref | PRIMARY | PRIMARY | 4 | xiaohaizi.s1.id | 1 | 100.00 | NULL |
+----+-------------+-------+------------+--------+---------------+---------+---------+-----------------+------+----------+-------+从执行计划的结果中可以看出,
s1
作为驱动表,s2
作为被驱动表,s2
的访问方法是eq_ref
表明在访问s2
表的时候可以通过主键的等值匹配来进行访问ref
: 当通过普通的二级索引列与常量进行等值匹配时来查询某个表,那么对该表的访问方法就可能是ref
fulltext
: 全文索引ref_or_null
: 当对普通二级索引进行等值匹配查询,该索引列的值也可以是NULL
值时,那么对该表的访问方法就可能是ref_or_null
。如EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' OR key1 IS NULL
,该查询条件表明 key1 的取值可能是 null, 所以这个查询的 type 就是ref_or_null
index_merge
: 一般情况下对于某个表的查询只能使用到一个索引,但在某些场景下可以使用Intersection
、Union
、Sort-Union
这三种索引合并的方式来执行查询。unique_subquery
: 类似于两表连接中被驱动表的eq_ref
访问方法,unique_subquery
是针对在一些包含IN
子查询的查询语句中,如果查询优化器决定将IN
子查询转换为EXISTS
子查询,而且子查询可以使用到主键进行等值匹配的话,那么该子查询执行计划的type
列的值就是unique_subquery
。index_subquery
:index_subquery
与unique_subquery
类似,只不过访问子查询中的表时使用的是普通的索引range
: 如果使用索引获取某些范围区间
的记录,那么就可能使用到range
访问方法index
: 当可以使用索引覆盖,但需要扫描全部的索引记录时(full index scan),该表的访问方法就是index
。 所要查询的数据直接在索引树中就可以获取到, 而不需要扫描聚簇索引数据. 当是这种情况时, Extra 字段 会显示Using index
ALL
: 全表扫描
possible key 和 key
possible_keys
列表示在某个查询语句中,对某个表执行单表查询时可能用到的索引有哪些,key
列表示实际用到的索引有哪些。
key_len
key_len
列表示当优化器决定使用某个索引执行查询时,该索引记录的最大长度。计算方法如下:
- 对于使用固定长度类型的索引列来说,它实际占用的存储空间的最大长度就是该固定值,对于指定字符集的变长类型的索引列来说,比如某个索引列的类型是
VARCHAR(100)
,使用的字符集是utf8
,那么该列实际占用的最大存储空间就是100 × 3 = 300
个字节 - 如果该索引列可以存储
NULL
值,则key_len
比不可以存储NULL
值时多1个字节 - 对于变长字段来说,都会有2个字节的空间来存储该变长列的实际长度
ref
当使用索引列等值匹配的条件去执行查询时,也就是在访问方法是const
、eq_ref
、ref
、ref_or_null
、unique_subquery
、index_subquery
其中之一时,ref
列展示的就是与索引列作等值匹配的是什么,比如只是一个常数或者是某个列。
一般情况下 ref
的值是const
,代表与索引列作等值匹配的是常数。也有复杂一些的情况:
1 |
|
可以看到对被驱动表s2
的访问方法是eq_ref
,而对应的ref
列的值是test.s1.id
,这说明在对被驱动表进行访问时会用到PRIMARY
索引,也就是聚簇索引与一个列进行等值匹配的条件,于s2
表的id
作等值匹配的对象就是test.s1.id
列(注意这里把数据库名也写出来了)。
rows
如果查询优化器决定使用全表扫描的方式对某个表执行查询时,执行计划的rows
列就代表预计需要扫描的行数,如果使用索引来执行查询时,执行计划的rows
列就代表预计扫描的索引记录行数。
filterd
连接查询的成本中有个condition filtering
的概念,就是MySQL
在计算驱动表扇出时采用的一个策略:
- 如果使用的是全表扫描的方式执行的单表查询,那么计算驱动表扇出时需要估计出满足搜索条件的记录到底有多少条。
- 如果使用的是索引执行的单表扫描,那么计算驱动表扇出的时候需要估计出满足除使用到对应索引的搜索条件外的其他搜索条件的记录有多少条。
extra
Extra
列是用来说明一些额外信息的,我们可以通过这些额外信息来更准确的理解MySQL
到底将如何执行给定的查询语句。常见的提示信息大概有:
Using index
: 查询列表以及搜索条件中只包含属于某个索引的列,也就是在可以使用索引覆盖,不需要回表。Using index condition
: 有些搜索条件中虽然出现了索引列,但却不能使用到索引。比如
SELECT * FROM s1 WHERE key1 > 'z' AND key1 LIKE '%a'
。在原来的 MySQL 版本中(5.7一下),执行步骤如下:
- 先根据
key1 > 'z'
这个条件,从二级索引idx_key1
中获取到对应的二级索引记录 - 根据上一步骤得到的二级索引记录中的主键值进行回表,找到完整的用户记录再检测该记录是否符合
key1 LIKE '%a'
这个条件,将符合条件的记录加入到最后的结果集
虽然
key1 LIKE '%a'
不能组成范围区间参与range
访问方法的执行,但这个条件毕竟只涉及到了key1
列,所以MySQL
对上边的步骤进行了一下改进:- 先根据
key1 > 'z'
这个条件,定位到二级索引idx_key1
中对应的二级索引记录 - 对于指定的二级索引记录,先不着急回表,而是先检测一下该记录是否满足
key1 LIKE '%a'
这个条件,如果这个条件不满足,则该二级索引记录压根儿就没必要回表 - 对于满足
key1 LIKE '%a'
这个条件的二级索引记录执行回表操作
回表操作其实是一个随机
IO
,比较耗时,所以上述修改虽然只改进了一点,但是可以省去很多回表操作的成本。MySQL
这个改进称之为索引条件下推
(Index Condition Pushdown
)。- 先根据
Using where
: 使用全表扫描来执行对某个表的查询,并且该语句的WHERE
子句中有针对该表的搜索条件Using filesort
: 排序操作无法使用到索引,只能在内存中(记录较少的时候)或者磁盘中(记录较多的时候)进行排序,MySQL
中把这种在内存中或者磁盘上进行排序的方式统称为文件排序(filesort
)。如果某个查询需要使用文件排序的方式执行查询,就会在执行计划的Extra
列中显示Using filesort
提示Using join buffer (Block Nested Loop)
: 在连接查询执行过程中,当被驱动表不能有效的利用索引加快访问速度,MySQL
一般会为其分配一块名叫join buffer
的内存块来加快查询速度,也就是我们所讲的基于块的嵌套循环算法
。比如以下语句:
1
2
3
4
5
6
7mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.common_field = s2.common_field;
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------------------------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------------------------------------------+
| 1 | SIMPLE | s1 | NULL | ALL | NULL | NULL | NULL | NULL | 9688 | 100.00 | NULL |
| 1 | SIMPLE | s2 | NULL | ALL | NULL | NULL | NULL | NULL | 9954 | 10.00 | Using where; Using join buffer (Block Nested Loop) |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------------------------------------------+可以在对
s2
表的执行计划的Extra
列显示了两个提示:Using join buffer (Block Nested Loop)
:这是因为对表s2
的访问不能有效利用索引,只好退而求其次,使用join buffer
来减少对s2
表的访问次数,从而提高性能。Using where
:可以看到查询语句中有一个s1.common_field = s2.common_field
条件,因为s1
是驱动表,s2
是被驱动表,所以在访问s2
表时,s1.common_field
的值已经确定下来了,所以实际上查询s2
表的条件就是s2.common_field = 一个常数
,所以提示了Using where
额外信息。