当前位置 : 主页 > 数据库 > mssql >

SQLSERVER的非聚集索引结构深度理解

来源:互联网 收集:自由互联 发布时间:2021-04-05
我们知道SQLSERVER的数据行的存储有两种数据结构:A: 堆 B :B树(binary 二叉树) 数据按照这种两种的其中一种来排序和存储,学过数据结构的朋友应该知道二叉树,为什麽用二叉树,

我们知道SQLSERVER的数据行的存储有两种数据结构:A: 堆   B :B树(binary 二叉树)

数据按照这种两种的其中一种来排序和存储,学过数据结构的朋友应该知道二叉树,为什麽用二叉树,因为方便用二分查找法来快速

找到数据。如果是堆,那么数据是不按照任何顺序排序的,也没有任何结构,数据页面也不是首尾相连的,不像B树,数据页面

使用双向链表首尾相连。堆表只依靠表里的IAM页(索引分配映射页)将堆的页面联系在一起,IAM里记录了页面编号,页面位置

除非表里有聚集索引,如果没有的话那么表里的数据的存储就是堆结构

那么非聚集索引呢?非聚集索引也是堆结构?其实SQLSERVER有几种页面类型(数据都使用一页一页来存储,就像Windows的内存也是使用页面来组织的)

其中有一种是索引页 ,一种是数据页

我感觉很多书都说不清,就像我一样,在文章的开头也是这样说的:数据行的存储有两种数据结构:A: 堆   B :B树(二叉树)

我觉得应该是数据页面的存储有两种数据结构:1、堆  2、B树

先说一下:索引页,不管是聚集索引还是非聚集索引,这些索引数据都存放在索引页,而索引页都是按照B树的结构里存储的

而堆页:也就是实际的数据行,如果表里没有聚集索引,那么实际的数据就放在堆页,如果聚集索引,那么数据就放在索引页

而B树里的节点 ,其实又叫页面,又叫节点  在B树里会有一页:root page(亦即是根节点),非聚集索引和聚集索引都是一样的

所以:数据行的存储有两种数据结构:A: 堆   B :B树(二叉树)

上面这句话应该明白了吧?

在说一下,在堆里的数据页面完全是随机存放的,而数据页面之间唯一的逻辑连接是记录在IAM页里的,所以IAM页也就扮演了root page的角色


那么聚集索引呢?聚集索引也是堆结构?

非聚集索引放在索引页,B树结构,数据依旧放在堆页,那么如果数据页放在堆里,不像聚集索引放在B树的叶子节点里

(亦即是放在索引页里),那么非聚集索引和实际的数据如何发生联系呢?

答案是:在非聚集索引的叶子节点(叶子页面)会有行定位器,而行定位器的作用请看下面红色字

非聚集索引与聚集索引具有相同的B树结构,他们之间的显著差别在于以下两点:

(1)基础表的数据行不按非聚集键的顺序排序和存储

(2)非聚集索引的叶层是由索引页而不是由数据页组成

(3)建立非聚集索引的表可以是一个B树,也可以是一个堆

(4)如果表是堆(意味着该表没有聚集索引),行定位器指向行的指针。该指针是由文件标识符ID:页码:页上的行数生成。整个

指针称为行ID(RID)

(5)如果表有聚集索引或索引视图上有聚集索引,则行定位器会指向聚集索引键。SQL通过使用存储在非聚集索引的叶子内的

指针(指向聚集索引键)搜索聚集索引来检索实际数据

非聚集索引不会改变或改善实际数据页的存储模式。他的B树结构只针对自己的索引页面。

不过,非聚集索引跟聚集索引的作用还是一样的,相当于检字表

最后总结一下吧,这麽短的随笔总结啥子呢?

当然是总结表的结构,因为曾经有人在论坛里问过一张表的结构

A 有聚集索引的表或者有聚集索引也有非聚集索引   (B树)

B 没有任何索引(堆)

C 没有聚集索引,有非聚集索引(B树+堆)

论坛里有人简称A为聚集表  ,B和C为堆表

记得以前在大学里数据结构老师讲过的一些数据结构:大根堆  ,小根堆 ,双向链表,二叉树

可惜现在全部还给老师了

 附上图片

堆表的结构

非聚集索引的结构

 聚集索引的结构

网友评论