SQL 分区表 RANGE 分区的边界值设计与 prune 生效检查

1次阅读

range分区查询未走prune的根本原因是开闭区间不匹配及分区键与查询谓词表达式无法等价推导,需确保values less than边界定义准确、查询条件同步使用相同函数、结尾必须含maxvalue且分区键索引需配合业务查询字段。

SQL 分区表 RANGE 分区的边界值设计与 prune 生效检查

为什么 RANGE 分区查询没走 prune,明明条件看起来能命中?

根本原因往往是边界值定义和查询条件之间的「开闭区间不匹配」。RANGE 分区的每个分区只包含 VALUES LESS THAN 指定值**之前**的所有行,且该值本身属于下一个分区(或未定义分区时被拒绝)。比如 PARTITION p1 VALUES LESS THAN (100),那么 id = 100 不在 p1,而在 p2(如果存在)或报错(如果没定义后续分区)。

实操建议:

  • SHOW CREATE table 确认每个分区的 VALUES LESS THAN 实际值,注意是否用了表达式(如 TO_DAYS('2024-01-01')),这会导致你肉眼判断的“日期”和实际存储的数值不一致
  • 执行 EXPLAIN PARTITIONS select ...,重点看 partitions 列——只显示被扫描的分区名,如果出现 NULL 或多个无关分区,说明 prune 失败
  • 对时间字段做 RANGE 分区时,避免直接用 date 类型列 + 字符串字面量比较,例如 WHERE dt 可能因隐式转换绕过 prune;改用 <code>dt = '2023-10-01' 这类明确范围更稳妥

VALUES LESS THAN 用函数(如 TO_DAYS)时,怎么保证查询条件能对齐?

函数包裹会让分区键实际按计算结果切分,但你的 WHERE 条件如果没同步套用相同函数,优化器就无法推导出分区裁剪逻辑。本质是「分区键表达式」和「查询谓词表达式」必须结构可等价推导。

实操建议:

  • 若分区定义为 PARTITION BY RANGE (TO_DAYS(created_at)),则查询必须写成 WHERE TO_DAYS(created_at) ,不能只写 <code>created_at
  • mysql 5.7+ 对部分函数(如 YEAR()TO_DAYS())支持 prune,但 DATE(created_at)LEFT(created_at, 7) 等不可下推函数会直接禁用 prune
  • SELECT @@sql_mode 确保没开启 STRICT_TRANS_TABLES 以外的干扰模式,某些模式下函数返回 NULL 会导致整个分区判定失效

插入数据提示 Data too large for partition,但值看起来在范围内?

这是最典型的边界理解错误:RANGE 分区要求**所有可能的数据都必须落在某个分区中**。如果你定义了 P0 VALUES LESS THAN (10), P1 VALUES LESS THAN (20),那值 20 及以上就无处可去——即使你只打算插到 19,只要没定义兜底分区(如 P2 VALUES LESS THAN MAXVALUE),INSERT 就会失败。

实操建议:

  • 生产环境 RANGE 分区**必须以 MAXVALUE 结尾**,否则任何超出最后一个 LESS THAN 值的 INSERT 都会报错 Error 1526 (HY000): Table has no partition for value …
  • 不要依赖应用层校验来规避越界,MySQL 不会在 INSERT 前帮你算“下一个分区该在哪”,它只机械比对 LESS THAN
  • 新增分区时,用 ALTER TABLE ... REORGANIZE PARTITION 拆分现有分区比 ADD PARTITION 更安全,避免中间出现空档

EXPLAIN 显示只扫一个分区,但执行还是慢?

prune 生效只代表「分区数量减少」,不代表「单个分区内扫描变快」。如果目标分区本身数据量巨大,又缺乏合适索引,照样全表扫描。

实操建议:

  • 确认 EXPLAINtypekey 列:即使 partitions: p2,若 type: ALLkey: NULL,说明分区内部没走索引
  • RANGE 分区键(如 idcreated_at)**不能替代查询常用字段的索引**。例如按 created_at 分区,但常查 status = 'done',就得在每个分区内建 (status)(status, created_at) 索引
  • 分区数不是越多越好:MySQL 5.7 单表超 8000 个分区会显著拖慢 OPEN TABLES 开销,尤其配合 innodb_file_per_table=ON 时,文件句柄和内存占用飙升

边界值不是数学题里的“概念”,而是 MySQL 执行计划里一条条硬编码的比较指令;prune 是否生效,取决于你写的 SQL 谓词能否被优化器静态推导出与分区定义的数值关系——差一个函数、差一个等号、差一个 MAXVALUE,结果就是全表扫还是毫秒响应。

text=ZqhQzanResources