简介
1.说明
1)索引是数据库对象之一,用于加快数据的检索,类似于书籍的索引。在数据库中索引可以减少数据库程序查询结果时需要读取的数据量,类似于在书籍中我们利用索引可以不用翻阅整本书即可找到想要的信息。
2)索引是建立在表上的可选对象;索引的关键在于通过一组排序后的索引键来取代默认的全表扫描检索方式,从而提高检索效率
3)索引在逻辑上和物理上都与相关的表和数据无关,当创建或者删除一个索引时,不会影响基本的表;
4)oracle创建主键时会自动在该列上创建索引
索引分类
物理上分为分布式索引/集中式索引,B-tree索引,bitmap索引;逻辑上分为单列索引/联合索引,唯一索引/不唯一索引,寄予函数的索引,域内索引。
1. B树索引(默认索引,保存经排序过的索引列和对应的rowid值)
1)说明:
1.oracle中最常用的索引;B树索引就是一颗二叉树;叶子节点(双向链表)包含索引列和指向表中每个匹配行的ROWID值
2.所有叶子节点具有相同的深度,因而不管查询条件怎样,查询速度基本相同
3.能够适应精确查询、模糊查询和比较查询
2)分类:
UNIQUE,NON-UNIQUE(默认),REVERSE KEY(数据列中的数据是反向存储的)
3)创建例子
craete index index_sno on student(\'sno\');
4)Btree索引原理
如;CREATE INDEX employees_last_name ON employees(last_name);
Oracle 数据库在 employees 表 last_name 列上排序。然后,按已排序的顺序加载带有 last_name 和相应 rowid 值的索引。当使用索引时,Oracle 数据库通过已排序的 last_name 值快速查询,之后,使用与其相关的 rowid 值来定位行。
5)适合使用场景:
列基数(列不重复值的个数)大时适合使用B数索引
2. 位图索引
1)说明:
2)创建例子
create bitmap index index_sno on student(sno);
3)实现原理
如果用户查询的列的基数非常的小, 即只有的几个固定值,如性别、婚姻状况、行政区等等。要为这些基数值比较小的列建索引,就需要建立位图索引。
对于性别这个列,位图索引形成两个向量,男向量为10100...,向量的每一位表示该行是否是男,如果是则位1,否为0,同理,女向量位01011。
|
RowId |
1 |
2 |
3 |
4 |
5 |
... |
|
男 |
1 |
0 |
1 |
0 |
0 |
|
|
女 |
0 |
1 |
0 |
1 |
1 |
|
对于婚姻状况这一列,位图索引生成三个向量,已婚为11000...,未婚为00100...,离婚为00010...。
|
RowId |
1 |
2 |
3 |
4 |
5 |
... |
|
已婚 |
1 |
1 |
0 |
0 |
0 |
|
|
未婚 |
0 |
0 |
1 |
0 |
1 |
|
|
离婚 |
0 |
0 |
0 |
1 |
0 |
|
当我们使用查询语句“select * from table where Gender=‘男’ and Marital=“未婚”;”的时候 首先取出男向量10100...,然后取出未婚向量00100...,将两个向量做and操作,这时生成新向量00100...,可以发现第三位为1,表示该表的第三行数据就是我们需要查询的结果。
|
RowId |
1 |
2 |
3 |
4 |
5 |
|
男 |
1 |
0 |
1 |
0 |
0 |
|
and |
|
|
|
|
|
|
未婚 |
0 |
0 |
1 |
0 |
1 |
|
结果 |
0 |
0 |
1 |
0 |
0 |
4) 适合场景:
对于基数小的列适合简历位图索引(例如性别等)
3.单列索引和复合索引(基于多个列创建)
1)说明
单列索引:仅在一列上建立索引
复合索引:将两个列组合并在一起建成索引。
2) 注意:
即如果索引建立在多个列上(复合索引),只有它的第一个列被where子句引用时,优化器才会使用该索引,即至少要包含组合索引的第一列
4.唯一索引和非唯一索引
唯一索引:每行都是唯一值,如主键
非唯一索引:列值可以相同
5. 函数索引
1)说明:
1. 当经常要访问一些函数或者表达式时,可以将其存储在索引中,这样下次访问时,该值已经计算出来了,可以加快查询速度
2. 函数索引既可以使用B数索引,也可以使用位图索引;当函数结果不确定时采用B树索引,结果是固定的某几个值时使用位图索引
3. 函数索引中可以使用用len、trim、substr、upper(每行返回独立结果),不能使用如sum、max、min、avg等
索引失效
Oracle 索引的目标是避免全表扫描,提高查询效率,但有些时候却适得其反。
例如一张表中有上百万条数据,对某个字段加了索引,但是查询时性能并没有什么提高,这可能是 oracle 索引失效造成的。oracle 索引有一些限制条件,如果你违反了这些索引限制条件,那么即使你已经加了索引,oracle还是会执行一次全表扫描,查询的性能不会比不加索引有所提高,反而可能由于数据库维护索引的系统开销造成性能更差。 下面就是总结的能使 Oracle 索引失效的几大限制条件。
1. 没有 WHERE 子句
2. 使用 IS NULL 和 IS NOT NULL
SELECT ... FROM emp WHERE comm IS NULL; comm 列的索引会失效
3. WHERE 子句中使用函数,可以对索引列建立函数索引解决问题
如果没有使用基于函数的索引,那么 where 子句中对存在索引的列使用函数时,会使优化器忽略掉这些索引。例如:
select * from staff where trunc(birthdate) = \'01-MAY-82\';
但是把函数应用在条件上,索引是可以生效的,把上面的语句改成下面的语句,就可以通过索引进行查找。
select * from staff where birthdate < (to_date(\'01-MAY-82\') + 0.9999);
注意:对于 MIN, MAX 函数,Oracle 仍然使用索引。
4. 使用 LIKE ‘%T’ 进行模糊查询,可以使用instr建立函数索引解决问题
SELECT ... FROM emp WHERE comm like ‘%tttt’; comm 列的索引会失效
5. WHERE 子句中使用不等于操作
不等于操作包括:<>, !=, NOT colum >= ?, NOT colum <= ? 、not in 、not exist,等大多数情况下认为结果集很大,一般大于5%-15%就不走索引而走FTS。
对于这个限制条件可以通过 OR 替代,例如: colum <> 0 ===> colum>0 OR colum<0
6. 等于和范围索引不会被合并使用
SELECT emp_id, emp_m, salary_q ... FROM emp WHERE job=\'manager\' AND deptno>10
job 和 deptno 都是非唯一索引,这种条件下 oracle 不会合并索引,它只会使用第一个索引。
7. 比较不匹配数据类型
dept_id是一个varchar2型的字段,在这个字段上有索引,但是下面的语句会执行全表扫描。
select * from dept where dept_id = 900198;
这是因为 oracle 会自动把 where 子句转换成 to_number(dept_id)=900198,相当于使用函数,这样就限制了索引的使用。正确写法如下:
select * from dept where dept_id = \'900198\';
8.基于cost的成本分析,访问的表过小,使用全表扫描的消耗小于使用索引。