SQL数据库物理存储结构_页段区组织方式

11次阅读

sql数据库物理存储以页(8KB)为最小单位,8页组成区(64KB),区集合构成段(逻辑容器),段通过文件组映射到数据文件;日志文件则采用VLF连续流结构。

SQL数据库物理存储结构_页段区组织方式

SQL数据库的物理存储结构以“页”为基本单位,通过“区”和“段”逐层组织,形成高效、可管理的磁盘空间布局。理解这种层级关系,对性能调优、空间分析和故障排查都很关键。

页(Page):最小I/O与管理单元

页是SQL Server等主流关系型数据库中最小的磁盘分配和读写单位,通常大小为8KB(SQL Server默认),其他系统如postgresql使用8KB页,oracle默认数据块为8KB(可配置)。一页内包含页头(含页号、校验、时间戳等元信息)、实际数据行(或索引条目)以及行偏移数组(Slot Array),用于快速定位记录位置。

  • 数据页存储表行(表或聚集索引叶节点),索引页存储B+树非叶/叶节点
  • 一页不能跨区存放;同一张表的不同页可以分散在不同文件或文件组中
  • 页内空闲空间由PFS(Page Free Space)页面跟踪,用于快速判断是否可插入新行

区(Extent):连续8页的分配单位

区由8个物理上连续的页(8 × 8KB = 64KB)组成,是空间分配的基本单位。SQL Server中区分为混合区(Mixed Extent)和统一区(Uniform Extent):

  • 新建小对象(如刚创建的小表或索引)最初使用混合区,多个对象可共享一个混合区(最多8个)
  • 当对象增长到8页以上,后续分配自动切换为统一区——整区只归属该对象
  • SGAM(Shared Global Allocation map)页跟踪哪些区是混合区且仍有空页;GAM(Global Allocation Map)页标记统一区是否已分配

段(Segment):逻辑对象的空间容器

段不是物理存储实体,而是逻辑概念,代表数据库对象(如表、索引、LOB列、行溢出数据)所占用的所有区的集合。每个段对应一类数据存储需求:

  • 数据段:存储常规行数据(堆表或聚集索引数据)
  • 索引段:存储非聚集索引结构
  • LOB段:专门存放TEXT/NTEXT/IMAGE/VARCHAR(MAX)/VARBINARY(MAX)等大对象内容
  • 行溢出段(Row-overflow segment):当单行超过8060字节时,可变长度列被移出主数据页,存入此处

段不直接映射到文件或区,而是通过系统表(如sys.sysallocunits)维护其所属的分配单元(Allocation Unit),每个分配单元关联一组区链表。

文件与文件组:物理载体与策略控制层

页、区、段最终落于数据库文件(.mdf/.ndf/.ldf)之上。文件按类型分为数据文件(Data File)和日志文件(Log File),其中日志文件不按页/区组织,而是连续日志流(VLFs);数据文件则严格遵循页→区→段结构。

  • 文件组(Filegroup)是对一个或多个数据文件的逻辑分组,支持将不同段(如索引段、LOB段)放置在不同文件组,实现I/O分离或备份策略定制
  • PRIMARY文件组默认承载系统表和未显式指定文件组的对象;用户可创建USERDATA、INDEXES等自定义文件组并分配对象
  • 分区表会将不同分区映射到不同文件组,本质是让各分区的段分布在不同物理位置
text=ZqhQzanResources