索引类型
在MySQL有两种索引类型
- hash
- B+树
hash
hash索引原理比较简单就是利用了一个hash表
优点
- 查找速度快,理论上hash的查找时间复杂度是O(1),只要求出索引值的hash值就能直接找相应的数据。当然如果多个值的hash值相同存在hash冲突的情况就会影响速度
缺点
- 只能索引确定的值,不能用来查找范围。因为索引是在hash表中是随机分布的,所以不能用来查找范围条件,如大于、小于、between。只适用于查找确定的值,如"=",“IN"这样的,“IN"其实就是多个”=”。
这也导致hash索引不能用来排序 - 不能使用部分索引。比如建立了一个组合索引a b,在索引时就一定要同时写上a,b的条件,不能只索引一个a。因为在建立索引时是求a+b的hash值而不是一个一个求的。
B+tree
说B+树之前先要了解B+树的数据结构。不废话,先上图。
对B+树做一些解释,参考上图。
- B+树的数据都在叶子节点上
- 非叶子节点上的这些都是范围。举例:最上面的根节点上的数据是5,28,65代表的是它的三个子树上的数据,根节点下有三个子树,第一个子树上的数据范围值大于等于5,小于28;第二个子树上的数据范围是大于等于28,小于65;第三个子树上的数据是大于等于65的。
- 如2所说,在非叶子节点上是划分范围的,那么数据在叶子节点上也是按大小排列的。
- 如图Data,类似一个链表的结构,叶子节点之间有指针相连。例如左数第一个叶子节点和左数第二个叶子节点之间通过指针相连,后面的同理。这样做的好处是方便范围查找,比如我要找20~30之间的数,图中20,26,27在同一个叶子节点上而28,30在另一个也字节点上,那么在找到(20,26,27)这个节点后可以直接通过指针找到(28,30,33)这个节点,如果没有这个这个指针,就要回溯到最上面的根节点才能找到(28,30,33)这个节点。
优点
- 适合返回查找,原因参考上面4条
- 相较与二叉树,树的高度小,这使得磁盘IO减少
- 相较与B-树,数据都在叶子节点,查询效率稳定
缺点
- 数据有冗余,在非叶子节点上出现过代表范围的数据又在叶子节点出现
下一篇讲最左匹配原则。