Sql Server之旅——第四站你必须知道的非聚集索引扫描

发布时间：2020-12-12 09:00:56 所属栏目：MsSql教程来源：网络整理

导读：非聚集索引，这个是大家都非常熟悉的一个东西，有时候我们由于业务原因，sql写的非常复杂，需要join很多张表，然后就泪流满面了。。。这时候就有DBA或者资深的开发给你看这个猥琐的sql，通过执行计划一分析。。。或许就看出了不该有的表扫描。。。万恶之源

　　非聚集索引，这个是大家都非常熟悉的一个东西，有时候我们由于业务原因，sql写的非常复杂，需要join很多张表，然后就泪流满面了。。。这时候就

有DBA或者资深的开发给你看这个猥琐的sql，通过执行计划一分析。。。或许就看出了不该有的表扫描。。。万恶之源。。。然后给你在关键的字段加上非

聚集索引后。。。才发现提速比阿斯顿马丁还要快。。。那么一个问题来了，为什么非聚集索引能提速这么快。。。怎么做到的？？？是不是非常的好奇？？？

这篇我们来解开神秘面纱。

? ? ? 先让我们一睹非聚集索引的真容，看看到底在执行计划看来是个什么玩意。。。我这里有个product表，里面灌了8w多数据，然后在Name列上建立

一个非聚集索引，就像下图一样：

从上图中看到了两个好玩的东西，一个就是我想看到的“索引查找[nonclustered]”，这个大家很熟悉，也是这篇要说的，然后我们还看到了一个“RID查找”，

乍一看这是什么鸡巴玩意。。。非聚集索引跟它扯上什么关系了？？？

　　通过前面几篇，我想大家都知道了数据页中的记录是如何寻找的？秘密就是通过slot槽位中的偏移量决定的，那问题来了，如果上升到数据页层面，我

只需要（pageID：slotID）就可以找到记录了，对不对？那如果我上升了文件层面，那是不是只需要知道（fileID:pageID:slotID)就可以找到数据页中的?

记录了？其实这里的RID就是站在文件的高度通过(fileID:pageID:slotID)找到表记录的。。。既RID=RowID=(fileID:pageID:slotID)，如果你非要眼见

为实的话，在sq中l还真提供了这么个函数（sys.fn_PhysLocFormatter(%%physloc%%)），我们看下图：

看了上面的图，是不是很兴奋，一目了然，比如productID=18088这条记录，然来是在1号文件，34941号数据页，0号槽位上，productID=18089

是在1号槽位上，好了，当你知道RID是个什么东西的时候，我想你已经离彻底理解非聚集索引不远啦。。。

　　有一点我们肯定知道，就是非聚集索引是可以加速查找的，要是跟表扫描那样的龟速，那也就失去了索引的目的，既然能加速，是因为它和聚集索

引一样，在底层都玩起了B树，首先我们插入一些样例数据。

Person(ID ,NAME ( idx_Person_Name dbo.Person (((),

上面的sql，我故意在Name列设置为900个char，这也是索引的上限值，这样的话，我DBCC就可以导出很多数据页和索引页了。

可以看到，当我dbcc ind 的时候，发现Person表中已经有4个数据页，5个索引页，其中151号数据页是表跟踪页，174号为索引跟踪页，这也就

说明当我建立索引后，引擎给我们分配了专门的索引页来存放我们建立的Name索引，那下一步就是我们来看看这些索引中都存放着什么，这也是我

非常关心的，接下来我导出173号索引页。

PAGE(Ctrip,,,)

Slot ,Offset ,Length Record Type INDEX_RECORD Record Attributes NULL_BITMAP Record Size Memory : 2020 : : : : : : : : : 00000000000000A0: 00000000000000B0: 00000000000000C0: 00000000000000D0: 00000000000000E0: 00000000000000F0: : : : : : : : : : : 00000000000001A0: 00000000000001B0: 00000000000001C0: 00000000000001D0: 00000000000001E0: 00000000000001F0: : : : : : : : : : : 00000000000002A0: 00000000000002B0: 00000000000002C0: 00000000000002D0: 00000000000002E0: 00000000000002F0: : : : : : : : : : 020000 ? ........... Row () ( () ( () ( () ( () ( () ( () ( () ()

从上面至少可以发现三个有趣的现象：

<1>:173号索引页中slot0和slot1槽位指向记录的内容已经有序了，比如：aaaaa，bbbbb。。。。这样。。。。原来非聚集索引也是有序呀。。。

<2>:6161616161就是16进制的aaaaa。

　　 ?这几个数字非常重要，因为是16进制表示，所以2位16进制表示一个字节，所以可以这么解释，前面4个字节表示

　　 ?pageID，中间2个字节表示fileID，后面2个字节表示slot，看到这里你是不是想起了RID。。。因为RID就是这三样的组合。。。原来非聚集索

　　?引的记录存放的就是“key+RowID”呀。。。。

<3>:通过最后的槽位列表，可以得知173号索引页上存放着8条索引记录。

　　好了，看完了叶子节点，我们再看分支节点，也就是IndexLevel=1的那条索引数据页，也就是78号。ok，dbcc看看吧。

当看到这个列表的时候，不知道你脑子里面是不是有一幅图出来了，就像上一篇看到聚集索引一样，因为它的结构和聚集索引非常像，只不过

非聚集索引这里多了一个RID而已。。。最后我也把图贡献一下。

总结一下：在走非聚集索引的时候，比如你的条件是where name='jjjjj' 时，它的逻辑是这样的，根据78号索引数据页的key的范围，然后通过

　　　　 ?rowid走到了

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

Sql Server之旅——第四站 你必须知道的非聚集索引扫描

Sql Server之旅——第四站你必须知道的非聚集索引扫描