PostgreSQL 执行计划中 Seq Scan vs Index Scan 的成本计算

8次阅读

Seq Scan 成本 = startup_cost + (pages × seq_page_cost) + (rows × cpu_tuple_cost)，基于统计信息和配置参数估算，不访问真实数据。

postgresql 估算 Seq Scan 成本时，核心是「读多少页 + 处理多少行」。它不查真实数据，只依赖统计信息（pg_class.relpages 和 pg_class.reltuples）和配置参数。

基础公式近似为：startup_cost + (pages × seq_page_cost) + (rows × cpu_tuple_cost)。其中：

看起来走索引更快，但优化器算得更细——Index Scan 成本 = 索引页访问成本 + 回表（heap fetch）成本。尤其当条件选择率不高、或索引列区分度低时，它很容易输。

关键点：

索引扫描页数由 index_pages × selectivity 估算，但 B-tree 深度也参与计算（深度越大，越倾向放弃）
回表成本占大头：每匹配一个索引项，就要去主表读一页（或几页）取完整行，这部分用 random_page_cost（默认 4.0）计价，远高于 seq_page_cost
如果查询需要返回大量行（比如 WHERE status IN ('a','b','c') 匹配 30% 行），优化器常判断「不如全扫一遍」，直接选 Seq Scan

不是建了索引就自动变快，得让成本模型「信服」索引更优。常见有效操作：

成本数字本身是相对值，单位无意义，但差 2 倍以上通常代表路径差异显著。真正要盯的是：

Rows Removed by Filter: 如果这个值巨大（比如扫描 100 万行，只留 10 行），说明谓词不适合走索引，或者索引没覆盖过滤条件
实际耗时与成本严重偏离时（如 Index Scan 成本低但执行慢），大概率是缓存未预热（首次运行）、或 work_mem 不足导致排序/聚合落盘，和成本模型无关

发表于：数据库

2026-01-28

复制链接

Laravel 中实现控制器层的 DRY 原则：通用基类 + 策略化请求处理

HTML 中 meta charset=”UTF-8″ 必须放在第一个位置的原因