17.pgsql中的数据库物理存储结构-分页文件（1）

1.表和索引所使用的页面格式的概述

项指的是存储在一个页面里的独立数据值。在一个表里，一个项是一个行；在一个索引里，一个项是一条索引记录。

每个表和索引都以固定尺寸(通常是 8K ，但也可以在编译时选择其它尺寸)的页面数组存储。在表里，所有页面逻辑上都相同，所以一个特定的项(行)可以存储在任何页面里。

在索引里，第一个页面通常保留为元页面，保存着控制信息，并且依索引访问方法的不同，在索引里可能有不同类型的页面。

2.一个页面的整体布局（5部分）

17.pgsql中的数据库物理存储结构-分页文件（1）

注意：高版本如10、11、12PageHederData是占24个字节。

3.页面5个部分的说明

3.1页头数据-PageHeaderData（20byte）

17.pgsql中的数据库物理存储结构-分页文件（1）

下面8.2版本的pageHeader结构图：

17.pgsql中的数据库物理存储结构-分页文件（1）

下面9以上版本pageHeader结构图：

17.pgsql中的数据库物理存储结构-分页文件（1）

8.2：

字段	类型	长度	描述
pd_lsn	XLogRecPtr	8 字节	LSN: 最后修改这个页面的 xlog 记录最后一个字节后面第一个字节
pd_tli	TimeLineID	4 字节	最后修改的 TLI
pd_lower	LocationIndex	2 字节	到自由空间开头的偏移量
pd_upper	LocationIndex	2 字节	到自由空间结尾的偏移量
pd_special	LocationIndex	2 字节	到特殊空间开头的偏移量
pd_pagesize_version	uint16	2 字节	页面大小和布局版本号信息

9以上：

Field	Type	Length	Description
pd_lsn	PageXLogRecPtr	8 bytes	记录最后一次对页修改的xlog记录
pd_checksum	uint16	2 bytes	页面的校验和，用于判断当前页是否完整
pd_flags	uint16	2 bytes	指示当前页的状态
pd_lower	LocationIndex	2 bytes	本页空闲位置的起始指针
pd_upper	LocationIndex	2 bytes	本业空闲位置的结束指针
pd_special	LocationIndex	2 bytes	页预留的位置
pd_pagesize_version	uint16	2 bytes	页面大小和版本信息
pd_prune_xid	TransactionId	4 bytes	最后一次删除或更新的xid

3.2项指针数据、项标识符-ItemPointerData、ItemIdData（4byte）

17.pgsql中的数据库物理存储结构-分页文件（1）

说明：

1）在页头后面是项标识符(ItemIdData)，每个需要四个字节。一个项标识符包含一个到项开头的字节偏移量，它自己以字节计的长度，以及一套属性位，这些属性位影响它的解释。新的项标识符根据需要从未分配空间的开头分配。项标识符的数目可以通过查看 pd_lower 来判断，在分配新标识符的时候会递增。因为一个项标识符在其释放前绝对不会移动，所以它的索引可以用于长时间地引用一个项，即使该项本身因为压缩自由空间在页面内部进行了移动也如此。实际上，PostgreSQL 创建的每个指向项的指针(ItemPointer ，也叫做 CTID)都由一个页号和一个项标识符的索引组成。

3.3未分配的空间-FreeSpace

17.pgsql中的数据库物理存储结构-分页文件（1）

说明：

1）即该页剩余未分配空间；

2）新项指针从这个区域的开头开始分配；

3）新项从结尾开始分配。

3.4实际项-Items

17.pgsql中的数据库物理存储结构-分页文件（1）

项本身存储在从未分配空间末尾开始从后向前分配的空间里。它们的实际结构因表包含的内容不同而不同。表和序列都使用一种叫做 HeapTupleHeaderData 的结构（8.2）：

字段	类型	长度	描述
t_xmin	TransactionId	4 字节	插入 XID 戳记
t_cmin	CommandId	4 字节	插入 CID 戳记
t_xmax	TransactionId	4 字节	删除 XID 戳记
t_cmax	CommandId	4 字节	删除 CID 戳记(与 t_xvac 重叠)
t_xvac	TransactionId	4 字节	用于移动行版本操作的 VACUUM 的 XID
t_ctid	ItemPointerData	6 字节	这个或者新行的当前 TID
t_natts	int16	2 字节	字段数目
t_infomask	uint16	2 字节	各种标志位
t_hoff	uint8	1 字节	到用户数据的偏移量

9以上结构：

Field	Type	Length	Description
t_xmin	TransactionId	4 bytes	insert XID stamp
t_xmax	TransactionId	4 bytes	delete XID stamp
t_cid	CommandId	4 bytes	insert and/or delete CID stamp (overlays with t_xvac)
t_xvac	TransactionId	4 bytes	XID for VACUUM operation moving a row version
t_ctid	ItemPointerData	6 bytes	current TID of this or newer row version
t_infomask2	uint16	2 bytes	number of attributes, plus various flag bits
t_infomask	uint16	2 bytes	various flag bits
t_hoff	uint8	1 byte	offset to user data

说明：

1）所有表行都用同样方法构造。它们有一个定长的头(在大多数机器上占据 27 个字节)，后面跟着一个可选的 null 位图，一个可选的对象 ID 字段，以及用户数据。头在表52-4里详细描述。实际用户数据(行的字段)从 t_hoff 标识的偏移量开始，它必须是该平台的 MAXALIGN 距离的倍数。null 位图只有在 t_infomask 里面的 HEAP_HASNULL 位设置了的时候才出现。如果它出现了，那么它紧跟在定长头后面，占据足够容纳每个数据字段对应一个位的字节数(也就是说，总共 t_natts 位)。在这个位列里面，为 1 的位表示非空，而为 0 的位表示空。如果没有出现这个位图，那么所有数据字段都假设为非空的。对象 ID 只有在设置了 t_infomask 里面的 HEAP_HASOID 位的时候才出现。如果出现，它正好出现在 t_hoff 范围之前。如果需要补齐 t_hoff ，使之成为 MAXALIGN 的倍数，那么这些填充将出现在 null 位图和对象 ID 之间。这样也保证了对象 ID 得到恰当的对齐。

3.5特殊空间-Special space

17.pgsql中的数据库物理存储结构-分页文件（1）

说明：

1）最后一段是"特殊段"，它可以包含任何访问方法想存放的东西。比如，b-tree 索引存储指向页面的左右同宗的链接，以及其它一些和索引结构相关的数据。普通表并不使用这个段(通过设置 pd_special 等于页面大小来表示)。