SQL 页分裂是如何发生的?

10次阅读

页分裂是数据库为维持B+树有序性与平衡性,在目标页满且插入点不在末尾时触发的自动拆分机制;需分配新页、迁移约一半数据、更新父节点并写入日志,导致写放大、锁争用、碎片升高和索引层级膨胀。

SQL 页分裂是如何发生的?

页分裂是数据库在插入或更新数据时,因目标数据页空间不足而触发的自动拆分机制,核心目的是维持B+树索引的有序性与平衡性。

页分裂发生的前提条件

InnoDB默认页大小为16KB(sql Server常用8KB),页内数据按主键顺序排列。当执行插入或变长字段更新操作时,数据库会先定位到目标页,再检查剩余空间是否足够容纳新记录。只有在目标页已满(或剩余空间小于新记录所需空间)且插入位置不在页末尾时,才会触发页分裂。

  • 页满但插入点在末尾(如自增ID追加):通常不迁移数据,只分配新页——这是低开销的“插入点分裂”
  • 页满且插入点在中间(如随机ID、倒序时间戳):必须拆分原页,迁移部分数据到新页
  • 更新导致行变大(如TEXT字段增长):原页放不下,也可能引发内部分裂

页分裂的具体执行过程

以最常见的叶子节点分裂为例:

  • 系统定位到应插入的叶子页(例如存储ID 1500–1600的页),发现已无足够空闲空间
  • 分配一个全新空白页(如Page2),将原页(Page1)中约一半数据(通常是后半键值范围,如1550–1600)迁移到新页
  • 根据新记录键值决定插入位置:若插入ID=1550,则放入新页;若插入ID=1525,则留在原页
  • 更新父节点(非叶子页),添加指向新页的指针;若父节点也满,则递归向上分裂,极端情况会新增根节点、提升树高
  • 重写页头/页尾元数据,并同步写入redo Log,确保崩溃可恢复

为什么必须迁移“约一半”数据?

这不是随意选择,而是B+树结构的要求:

  • 保证所有叶子节点处于同一层级,维持O(log n)查询效率
  • 避免新页立即再次填满,两个页都保留合理空闲空间,延缓下一次分裂
  • 保持键值顺序连续:原页保留前半段(如1500–1549),新页承接后半段(1550–1600),逻辑链表可正确串联

页分裂带来的实际影响

它不只是“多建一个页”,而是一系列资源消耗操作:

  • 写放大:一次插入可能引发多次物理写入(原页读、新页写、父节点更新、日志写入)
  • 锁与闩争用:分裂期间需获取页面级排他锁(X lock)和latch,阻塞并发读写
  • 碎片升高:分裂后页平均填充率下降,磁盘I/O效率降低,avg_page_space_used_in_percent明显低于90%
  • 索引层级膨胀:频繁上层分裂可能导致B+树变高,增加每次查询的路径长度
text=ZqhQzanResources