【Oracle 11g】为何加了索引反而查询变慢

发布时间：2020-12-12 18:50:50 所属栏目：百科来源：网络整理

导读：这里我们探讨数据在磁盘上的物理组织对索引的开销造成的影响。一般来讲，主键值彼此接近的行的物理位置也会靠在一起。（表会很自然地按主键顺序聚簇）本文讨论的是最长用的B*树索引。下图是典型的B*树索引布局实验一、探究磁盘上的物理组织对索引的影响

这里我们探讨数据在磁盘上的物理组织 对索引的开销造成的影响。

一般来讲，主键值彼此接近的行的物理位置也会靠在一起。（表会很自然地按主键顺序聚簇）

本文讨论的是最长用的B*树索引。下图是典型的B*树索引布局

实验一、探究磁盘上的物理组织对索引的影响

创建一张表

SQL> create table colocated(x int,y varchar2(80));

表已创建。

有插入数据，注意，x是有顺序的。

SQL> begin
  2  for i in 1..100000
  3  loop
  4     insert into colocated(x,y)
  5     values(i,rpad(dbms_random.random,75,'*'));
  6  end loop;
  7  end;
  8  /

然后对表创建主键，主键选择x列

SQL> alter table colocated
  2  add constraint colocated_pk
  3  primary key(x);

表已更改。

统计表的统计信息.（关于如下的函数，可以参考Oracle官方文档）

SQL> begin dbms_stats.gather_table_stats(user,'COLOCATED');
  2  end;
  3  /

PL/SQL 过程已成功完成。

在创建一张表，数据同表colocated。

SQL> create table disorganized
  2  as
  3  select x,y
  4  from colocated
  5  order by y;

表已创建。

创建主键

SQL> alter table disorganized
  2  add constraint disorganized_pk
  3  primary key(x);

表已更改。

对表colocated进行统计信息收集

SQL> begin dbms_stats.gather_table_stats(user,'DISORGANIZED');
  2  END;
  3  /

PL/SQL 过程已成功完成。

第一步，看看有序的物理组织对使用索引进行查询的影响

下面来看看这两个存有相同数据的表的查询性能，打印结果在这里不再展示，只展示查询语句和执行计划以及统计结果。

SQL> set autotrace on;
SQL> select * from colocated where x between 20000 and 40000;

执行计划 ----------------------------------------------------------
Plan hash value: 1550765370

-------------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------------

|   0 | SELECT STATEMENT            |              | 20002 |  1582K|   282   (0)| 00:00:04 |


|   1 |  TABLE ACCESS BY INDEX ROWID| COLOCATED    | 20002 |  1582K|   282   (0)| 00:00:04 |


|*  2 |   INDEX RANGE SCAN          | COLOCATED_PK | 20002 | | 43 (0)| 00:00:01 | 
-------------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------

 2 - access("X">=20000 AND "X"<=40000)


统计信息 ----------------------------------------------------------
 0 recursive calls
 0 db block gets
 2900 consistent gets
 0 physical reads
 0 redo size
 1893673 bytes sent via SQL*Net to client
 15078 bytes received via SQL*Net from client
 1335 SQL*Net roundtrips to/from client
 0 sorts (memory)
 0 sorts (disk)
 20001 rows processed

从上可以看到，
“INDEX RANGE SCAN”花费时间为00:00:01
“TABLE ACCESS BY INDEX ROWID”花费时间00:00:04
“SELECT STATEMENT”花费时间00:00:04

第二步，看看无序的物理组织对使用索引进行的查询产生的影响

来看看对照组

SQL> select/*+ index ( disorganized disorganized_pk) */ * from disorganized
 2 where x between 20000 and 40000;

执行计划 ----------------------------------------------------------
Plan hash value: 2594580634

-------------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------------

|   0 | SELECT STATEMENT            |                 | 20002 |  1582K| 20039(1)| 00:04:01 |


|   1 |  TABLE ACCESS BY INDEX ROWID| DISORGANIZED    | 20002 |  1582K| 20039(1)| 00:04:01 |


|*  2 |   INDEX RANGE SCAN          | DISORGANIZED_PK | 20002 | | 43(0)| 00:00:01 | 
-------------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------

 2 - access("X">=20000 AND "X"<=40000)


统计信息 ----------------------------------------------------------
 0 recursive calls
 0 db block gets
 21359 consistent gets
 0 physical reads
 0 redo size
 1893673 bytes sent via SQL*Net to client
 15078 bytes received via SQL*Net from client
 1335 SQL*Net roundtrips to/from client
 0 sorts (memory)
 0 sorts (disk)
 20001 rows processed

从上可以看到，
“INDEX RANGE SCAN”花费时间为00:00:01
“TABLE ACCESS BY INDEX ROWID”花费时间00:04:01
“SELECT STATEMENT”花费时间00:04:01

可以看到，上述两句SQL都走了索引，表中存储的数据都相同，查询的结果集也相同，但是查询时间差别好大。

先看看我的数据库中block的大小

SQL> show parameter db_block_size

NAME                                 TYPE        VALUE
------------------------------------ ----------- ------------------------------
db_block_size                        integer     8192

可以看到block大小为8k。
下面看看表中每行占用空间大小

SQL> select vsize(x),vsize(y) from colocated where rownum=1;

  VSIZE(X)   VSIZE(Y)
---------- ----------
         2         75

可以看到，随机的某一行占用总计77个字节。（number类型占用空间很少是因为其按照有效数字，正负号，小数位来存储的。所以有效数字越多，占用空间越大）
所以，可以看到，每个块（block）中可以存储多行数据。所以，如果数组是随机存储的，那么如果通过索引访问，则很多块会被重复读取，导致访问变慢。

实验二、全表扫描比使用索引更快的例子

再来个测试

SQL> select * from disorganized where x between 20000 and 40000

执行计划 ----------------------------------------------------------
Plan hash value: 2727546897

-------------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------------

|   0 | SELECT STATEMENT  |              | 20002 |  1582K|   326   (1)| 00:00:04| 

|*  1 |  TABLE ACCESS FULL| DISORGANIZED | 20002 |  1582K|   326   (1)| 00:00:04 |

-------------------------------------------------------------------------------- Predicate Information (identified by operation id): ---------------------------------------------------

 1 - filter("X"<=40000 AND "X">=20000)


统计信息 ----------------------------------------------------------
 218 recursive calls
 0 db block gets
 2550 consistent gets
 1195 physical reads
 0 redo size
 1813725 bytes sent via SQL*Net to client
 15079 bytes received via SQL*Net from client
 1335 SQL*Net roundtrips to/from client
 4 sorts (memory)
 0 sorts (disk)
 20001 rows processed

这个测试说明在某些情况下，全表扫描快于使用索引查询。

本文参考《Oracle_Database_9i10g11g编程艺术深入数据库体系结构》第2版，Thomas Kyte著，苏金国王小振等译，382~405页。

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!