技术开发 频道

MySQL:由浅入深理解索引的实现

  【IT168技术】首先,需要对相关背景知识进行了解:B-Tree & B+Tree、折半查找(Binary Search)、 数据库的性能问题和数据的基本存储结构。下面做简要分析:

  1.B-Tree & B+Tree

  http://en.wikipedia.org/wiki/B%2B_tree

  http://en.wikipedia.org/wiki/B-tree

  2.半查找(Binary Search)

  http://en.wikipedia.org/wiki/Binary_search_algorithm

  3.数据库的性能问题

  ① 磁盘IO性能非常低,严重的影响数据库系统的性能。

  ② 磁盘顺序读写比随机读写的性能高很多。

  4.数据的基本存储结构

  ①磁盘空间被划分为许多大小相同的块(Block)或者页(Page).

  ② 一个表的这些数据块以链表的方式串联在一起。

  ③ 数据是以行(Row)为单位一行一行的存放在磁盘上的块中,如图所示.

  ④ 在访问数据时,一次从磁盘中读出或者写入至少一个完整的Block。

MySQL:由浅入深理解索引的实现

  数据基本操作的实现

  基本操作包括:INSERT、UPDATE、DELETE、SELECT。

  1.SELECT

  ①定位数据

  ② 读出数据所在的块,对数据加工

  ③ 返回数据给用户

  2.UPDATE、DELETE

  ①定位数据

  ②读出数据所在的块,修改数据

  ③写回磁盘

  3.INSERT

  ①定位数据要插入的页(如果数据需要排序)

  ②读出要插入的数据页,插入数据.

  ③ 写回磁盘

  如何定位数据?

  4.表扫描(Table Scan)

  从磁盘中依次读出所有的数据块,一行一行的进行数据匹配。

  时间复杂度 是O(n), 如果所有的数据占用了100个块。尽管只查询一行数据,也需要读出所有100个块的数据。

   需要大量的磁盘IO操作,极大的影响了数据定位的性能。

  因为数据定位操作是所有数据操作必须的操作,数据定位操作的效率会直接影响所有的数据操作的效率。

  因此我们开始思考,如何来减少磁盘的IO?

  5.减少磁盘IO

  减少数据占用的磁盘空间:压缩算法、优化数据存储结构

  减少访问数据的总量:读出或写入的数据中,有一部分是数据操作所必须的,这部分称作有效数据。剩余的部分则不是数据操作必须的数据,称为无效数据。例如,查询姓名是‘张三’的记录。那么这条记录是有效记录,其他记录则是无效记录。我们要努力减少无效数据的访问。

0
相关文章