技术开发 频道

MySQL Group By 实现原理分析

  2.使用紧凑(Tight)索引扫描实现 GROUP BY

  紧凑索引扫描实现 GROUP BY 和松散索引扫描的区别主要在于他需要在扫描索引的时候,读取所有满足条件的索引键,然后再根据读取恶的数据来完成 GROUP BY 操作得到相应结果。

1  sky@localhost : example 08:55:14> EXPLAIN
2
3   -> SELECT max(gmt_create)
4
5   -> FROM group_message
6
7   -> WHERE group_id = 2
8
9   -> GROUP BY user_id\G
10
11   *************************** 1. row ***************************
12
13   id: 1
14
15   select_type: SIMPLE
16
17   table: group_message
18
19   type: ref
20
21   possible_keys: idx_group_message_gid_uid,idx_gid_uid_gc
22
23   key: idx_gid_uid_gc
24
25   key_len: 4
26
27   ref: const
28
29   rows: 4
30
31   Extra: Using where; Using index
32
33   1 row in set (0.01 sec)

  这时候的执行计划的 Extra 信息中已经没有“Using index for group-by”了,但并不是说 MySQL 的 GROUP BY 操作并不是通过索引完成的,只不过是需要访问 WHERE 条件所限定的所有索引键信息之后才能得出结果。这就是通过紧凑索引扫描来实现 GROUP BY 的执行计划输出信息。

  下面这张图片展示了大概的整个执行过程:

  在 MySQL 中,MySQL Query Optimizer 首先会选择尝试通过松散索引扫描来实现 GROUP BY 操作,当发现某些情况无法满足松散索引扫描实现 GROUP BY 的要求之后,才会尝试通过紧凑索引扫描来实现。

  当 GROUP BY 条件字段并不连续或者不是索引前缀部分的时候,MySQL Query Optimizer 无法使用松散索引扫描,设置无法直接通过索引完成 GROUP BY 操作,因为缺失的索引键信息无法得到。但是,如果 Query 语句中存在一个常量值来引用缺失的索引键,则可以使用紧凑索引扫描完成 GROUP BY 操作,因为常量填充了搜索关键字中的“差距”,可以形成完整的索引前缀。这些索引前缀可以用于索引查找。而如果需要排序GROUP BY结果,并且能够形成索引前缀的搜索关键字,MySQL还可以避免额外的排序操作,因为使用有顺序的索引的前缀进行搜索已经按顺序检索到了所有关键字。

1
相关文章