MySql联接算法,查询优化之

永利皇宫登录网址 ,MySQL 查询优化之 Block Nested-Loop 与 Batched Key Access Joins

在MySQL中,能够选择批量密钥访问(BKA)连接算法,该算法使用对连接表的目录访问和连接缓冲区。

BKA算法扶助:内三番五次,外接连和半连接操作,包含嵌套外接连。

BKA的优点:特别连忙的表扫描提升了连接属性。

除此以外,先前仅用于内接连的块嵌套循环(BNL)连接算法现已扩充,可用以外连接半连接操作,包括嵌套外连接

以下部分切磋了连接缓冲区管理,它是原始BNL算法扩大,扩展BNL算法和BKA算法的底蕴。
有关半三番五次策略的新闻,请参见“使用半老是转换优化子查询,派生表和视图引用”

  • Nested Loop Join
    算法

  • Block Nested-Loop
    算法

  • Batched Key Access
    算法

  • BNL和BKA算法的优化器Hint

连接算法是MySql数据库用于拍卖联接的物理策略。在MySql
5.5版本仅帮忙Nested-Loops Join算法,假诺联接表上有索引时,Nested-Loops
Join是可怜高效的算法。假设有目录时间复杂度为O(N),若未有索引,则可身为最坏的意况,时间复杂度为O(N²)。MySql根据分歧的选用境况,协助三种Nested-Loops
Join算法,一种是Simple Nested-Loops Join算法,其它一种是Block
Nested-Loops Join算法。

Nested Loop Join算法

将外层表的结果集作为循环的功底数据,然后循环从该结果集每趟一条获取数据作为下3个表的过滤条件去查询数据,然后合并结果。假诺有多个表join,那么相应将前方的表的结果集作为循环数据,取结果集中的每一行再到下1个表中继续展开巡回匹配,获取结果集并回到给客户端。

伪代码如下

for each row in t1 matching range {
  for each row in t2 matching reference key {
     for each row in t3 {
      if row satisfies join conditions,
      send to client
    }
  }
 }

 

寻常的Nested-Loop
Join算法二回只可以将一行数据传入内部存款和储蓄器循环,所以外层循环结果集有多少行,那么内部存款和储蓄器循环就要执行多少次。

###Simple Nested-Loops Join算法
从一张表中年老年是读取一条记下,然后将记录与嵌套表中的记录进行相比较。算法如下:

Block Nested-Loop算法

MySQL
BNL算法原本只匡助内连接,今后已匡助外连接半连接操作,包括嵌套外连接

BNL算法原理:将外层循环的行/结果集存入join
buffer,内部存款和储蓄器循环的每壹行数据与任何buffer中的记录做相比较,能够减小内层循环的扫视次数

举个差不离的事例:外层循环结果集有一千行数据,使用NLJ算法需求扫描内层表一千次,但若是选择BNL算法,则先取出外层表结果集的100行存放到join
buffer,
然后用内层表的每一行数据去和那100行结果集做相比较,能够2次性与100行数据举办相比较,那样内层表其实只须要循环一千/十0=1伍遍,减弱了9/拾。

伪代码如下

for each row in t1 matching range {
   for each row in t2 matching reference key {
    store used columns from t1, t2 in join buffer
    if buffer is full {
      for each row in t3 {
         for each t1, t2 combination in join buffer {
          if row satisfies join conditions,
          send to client
        }
        }
       empty buffer
     }
   }
 }

 if buffer is not empty {
    for each row in t3 {
     for each t1, t2 combination in join buffer {
       if row satisfies join conditions,
       send to client
      }
   }
 }

 

假设t一, t二出席join的列长度只和为s, c为双方组合数, 那么t3表被围观的次数为

(S * C)/join_buffer_size + 1

 

扫描t3的次数随着join_buffer_size的附加而压缩, 直到join
buffer能够容纳全体的t壹, t贰结合, 再增大join buffer size, query
的进程就不会再变快了。

 

optimizer_switch系统变量的block_nested_loop标志控制优化器是不是采取块嵌套循环算法。

暗中同意意况下,block_nested_loop已启用。

在EXPLAIN输出中,当Extra值包含Using join buffer(Block Nested Loop)type值为ALL,index或range时,表示使用BNL。

示例

mysql> explain SELECT  a.gender, b.dept_no FROM employees a, dept_emp b WHERE a.birth_date = b.from_date;
+----+-------------+-------+------------+------+---------------+------+---------+------+--------+----------+----------------------------------------------------+
| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows   | filtered | Extra                                              |
+----+-------------+-------+------------+------+---------------+------+---------+------+--------+----------+----------------------------------------------------+
|  1 | SIMPLE      | a     | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 298936 |   100.00 | NULL                                               |
|  1 | SIMPLE      | b     | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 331143 |    10.00 | Using where; Using join buffer (Block Nested Loop) |
+----+-------------+-------+------------+------+---------------+------+---------+------+--------+----------+----------------------------------------------------+
2 rows in set, 1 warning (0.00 sec)

 

For each row r in R do
    For each row s in S do
        If r and s satisfy the join condition
            Then output the tuple <r, s>

Batched Key Access 算法

对此多表join语句,当MySQL使用索引访问第四个join表的时候,使用叁个join
buffer来收集第二个操作对象生成的有关列值。BKA营造好key后,批量传给引擎层做索引查找。key是经过MLacrosseXC90接口提交给引擎的,那样,MCRUISERPRADO使得查询更有作用。

倘若外部表扫描的是主键,那么表中的记录走访都以相比平稳的,然而即使连接的列是非主键索引,那么对于表中著录的走访只怕正是分外离散的。因而对此非主键索引的交接,Batched
Key Access
Join算法将能相当大提升SQL的履行功效。BKA算法协助内三番五次,外接连和半连接操作,包蕴嵌套外接连。

Batched Key Access Join算法的劳作步骤如下:

  • 1) 将表面表中相关的列放入Join Buffer中。

  • 二) 批量的将Key(索引键值)发送到Multi-Range Read(M普拉多大切诺基)接口。

  • 三) Multi-Range
    Read(M普拉多福睿斯)通过吸收的Key,依照其对应的ROWID进行排序,然后再拓展多少的读取操作。

  • 四) 重临结果集给客户端。

Batched Key Access Join算法的真面目上来说依然Simple Nested-Loops
Join算法,其发生的尺度为内部表上有索引,并且该索引为非主键,并且连接必要拜访内部表主键上的目录。那时Batched
Key Access Join算法会调用Multi-Range
Read(M库罗德Tiguan)接口,批量的开始展览索引键的协作和主键索引上获取数据的操作,以此来增加联接的实践功能,因为读取数据是以一一磁盘IO而不是轻易磁盘IO举办的。

使用BKA时,join_buffer_size的值定义了对存款和储蓄引擎的种种请求中批量密钥的尺寸。缓冲区越大,对连日操作的左侧表的顺序访问就越多,那足以显着升高质量。

要使用BKA,必须将optimizer_switch系统变量的batched_key_access申明设置为on。
BKA使用MSportage奥迪Q7,因而mrr标志也亟须打开。方今,M安德拉奥迪Q5的本钱估算过于悲观。因而,mrr_cost_based也不可能不关闭才能运用BKA。

以下设置启用BKA:

mysql> SET optimizer_switch='mrr=on,mrr_cost_based=off,batched_key_access=on';

 

在EXPLAIN输出中,当Extra值包含Using join buffer(Batched Key Access)且类型值为refeq_ref时,表示使用BKA。

示例:

mysql> show index from employees;
+-----------+------------+----------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table     | Non_unique | Key_name       | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+-----------+------------+----------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| employees |          0 | PRIMARY        |            1 | emp_no      | A         |      298936 |     NULL | NULL   |      | BTREE      |         |               |
| employees |          1 | idx_name       |            1 | last_name   | A         |        1679 |     NULL | NULL   |      | BTREE      |         |               |
| employees |          1 | idx_name       |            2 | first_name  | A         |      277495 |     NULL | NULL   |      | BTREE      |         |               |
| employees |          1 | idx_birth_date |            1 | birth_date  | A         |        4758 |     NULL | NULL   |      | BTREE      |         |               |
+-----------+------------+----------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
4 rows in set (0.00 sec)


mysql> explain SELECT a.gender, b.dept_no FROM employees a, dept_emp b WHERE a.birth_date = b.from_date;
+----+-------------+-------+------------+------+----------------+----------------+---------+-----------------------+--------+----------+-------+
| id | select_type | table | partitions | type | possible_keys  | key            | key_len | ref                   | rows   | filtered | Extra |
+----+-------------+-------+------------+------+----------------+----------------+---------+-----------------------+--------+----------+-------+
|  1 | SIMPLE      | b     | NULL       | ALL  | NULL           | NULL           | NULL    | NULL                  | 331143 |   100.00 | NULL  |
|  1 | SIMPLE      | a     | NULL       | ref  | idx_birth_date | idx_birth_date | 3       | employees.b.from_date |     62 |   100.00 | NULL  |
+----+-------------+-------+------------+------+----------------+----------------+---------+-----------------------+--------+----------+-------+

#使用hint,强制走bka

mysql> explain SELECT /*+ bka(a)*/ a.gender, b.dept_no FROM employees a, dept_emp b WHERE a.birth_date = b.from_date;
+----+-------------+-------+------------+------+----------------+----------------+---------+-----------------------+--------+----------+----------------------------------------+
| id | select_type | table | partitions | type | possible_keys  | key            | key_len | ref                   | rows   | filtered | Extra                                  |
+----+-------------+-------+------------+------+----------------+----------------+---------+-----------------------+--------+----------+----------------------------------------+
|  1 | SIMPLE      | b     | NULL       | ALL  | NULL           | NULL           | NULL    | NULL                  | 331143 |   100.00 | NULL                                   |
|  1 | SIMPLE      | a     | NULL       | ref  | idx_birth_date | idx_birth_date | 3       | employees.b.from_date |     62 |   100.00 | Using join buffer (Batched Key Access) |
+----+-------------+-------+------------+------+----------------+----------------+---------+-----------------------+--------+----------+----------------------------------------+
2 rows in set, 1 warning (0.00 sec)

 

若是在两张表PRADO和S上开展过渡的列都不含有索引,算法的扫描次数为:Tiguan+RubiconxS,扫描开支为O(奇骏xS)。

BNL和BKA算法的优化器Hint

而外行使optimizer_switch系统变量来决定优化程序在对话范围内使用BNL和BKA算法之外,MySQL还帮助优化程序提醒,以便在各样语句的底子上影响优化程序。
请参见“优化程序Hint”。

要动用BNL或BKA提醒为外部联接的任何内部表启用联接缓冲,必须为外部联接的具备内部表启用联接缓冲。

永利皇宫登录网址 1

使用qb_name

SELECT /*+ QB_NAME(qb1) MRR(@qb1 t1) BKA(@qb2) NO_MRR(@qb3t1 idx1, id2) */ ...
  FROM (SELECT /*+ QB_NAME(qb2) */ ...
  FROM (SELECT /*+ QB_NAME(qb3) */ ... FROM ...)) ...

 

假如t一,t2和t三三张表执行INNEOdyssey JOIN查询,并且每张表使用的联网类型如下:

Table   Join Type
t1      range
t2      ref
t3      ALL

比方应用了Simple Nested-Loops Join算法,则算法完结的伪代码如下:

for each row in t1 matching range {
  for each row in t2 matching reference key {
    for each row in t3 {
      if row satisfies join conditions,
      send to client
    }
  }
}

然而当个中表对所联网的列含有索引时,Simple Nested-Loops
Join算法能够采纳索引的风味来举办高效协作,此时的算法调整为如下:

For each row r in R do
    lookup r in S index
        If find s == r
           Then output the tuple <r, s>

对于联接的列含有索引的情形,外部表的每条记下不再须要扫描整张内部表,只供给扫描内部表上的目录即可获取联接的判断结果。

在INNEBMWX3 JOIN中,两张联接表的1一是能够转换的,依照前边描述的Simple
Nested-Loops
Join算法,优化器在一般景色下再而三选用将连接列含有索引的表作为内表。倘使两张表Sportage和S在联接列上都有目录,并且索引的惊人壹样,那么优化器会接纳记录数少的表作为外部表,那是因为在那之中表的围观次数再三再四索引的万丈,与记录的多寡非亲非故。
上面那条SQL语句:

SELECT * FROM driver join user on driver.driver_id = user.uid;

其实施布署如下:

永利皇宫登录网址 2

能够见见SQL先查询user表,然后将表driver上的目录和表user上的列uid进行匹配。

此间怎么首先应用user表,因为user表的连片列uid并未索引,而driver表的连接列driver_id有目录,所以Simple
Nested-Loops Join算法将driver表作为个中表。

注意:最后优化器鲜明联接表的次第只会遵照适合的扫描花费来规定,即:M(外表)+M(外表)*N(内表);那里的外表和内表分别指的是外部和内表的扫描次数,若是含有索引,正是索引B+树的冲天,其余壹般都以表的记录数。

###Block Nested-Loops Join算法 要是联接表未有索引时,Simple
Nested-Loops Join算法扫描内部表多次,执行成效会分外差。而Block
Nested-Loops Join算法就是针对性未有索引的对接情形统筹的,其使用Join
Buffer(联接缓存)来压缩中间循环取表的次数。

MySql数据库使用Join Buffer的尺度如下:

  • 系统变量Join_buffer_size决定了Join Buffer的大小。
  • Join Buffer可被用来联接是ALL、index、和range的花色。
  • 每一次联接使用一个Join Buffer,因而多表的联网能够选择八个Join Buffer。
  • Join Buffer在对接爆发在此以前开始展览分配,在SQL语句执行完后开始展览释放。
  • Join Buffer只存款和储蓄要举行询问操作的相关列数据,而不是整行的记录。

对此地方提到的多少个表举办衔接操作,假诺利用Join
Buffer,则算法的伪代码如下:

for each row in t1 matching range {
  for each row in t2 matching reference key {
    store used columns from t1, t2 in join buffer
    if buffer is full {
      for each row in t3 {
        for each t1, t2 combination in join buffer {
          if row satisfies join conditions,
          send to client
        }
      }
      empty buffer
    }
  }
}
if buffer is not empty {
  for each row in t3 {
    for each t1, t2 combination in join buffer {
      if row satisfies join conditions,
      send to client
    }
  }
}

举3个例证,把driver表的_create_date列和user表的create_date列的目录删除,实行衔接查询,执行上面包车型客车SQL语句:

网站地图xml地图