SQL PostgreSQL 的 parallel_setup_cost / parallel_tuple_cost 的并行查询阈值调优

2次阅读

postgresql并行查询未启用的主因是parallel_setup_cost默认值1000.0过高，导致规划器放弃并行；需调低至50.0～200.0，并配合parallel_tuple_cost下调及满足硬性条件（如max_parallel_workers_per_gather>0、无for update等）才能生效。

parallel_setup_cost 太高导致并行根本没启用

postgresql 并行查询不是“写了 select 就自动并行”，它得先算一笔账：启动并行的开销（parallel_setup_cost）是否值得。默认值是 1000.0，对中小查询来说太高了—— planner 一看“光 setup 就要 1000”，干脆单线程跑完拉倒。

常见错误现象：EXPLAIN 显示计划里完全没有 Gather 或 Gather Merge 节点，哪怕表有几千万行、CPU 闲着、max_parallel_workers_per_gather 也设了 4。

调低到 50.0～200.0 是更现实的起点（SSD + 多核机器可往低走）
别全局改：只在慢查询前加 SET LOCAL parallel_setup_cost = 50.0; 测试效果
注意：这个值单位是“规划器成本单位”，和 seq_page_cost 同量纲，不是毫秒

parallel_tuple_cost 影响并行扫描的“性价比”判断

parallel_tuple_cost 控制的是：从并行 worker 拿回一条元组的代价。默认 0.1，比单进程的 cpu_tuple_cost（默认 0.01）高 10 倍——planner 默认认为跨进程传数据很贵。

使用场景：当你的表宽很窄（比如只有 2–3 个 int 字段），或用 SSD+NVMe，网络/共享内存延迟极低时，这个默认值就太保守了。

可尝试降到 0.02～0.05，尤其配合 parallel_setup_cost 下调后效果更明显
别设成 0.0：会导致 planner 过度激进，小结果集也硬上并行，反而因调度开销变慢
该参数对索引扫描无效——它只影响顺序扫描（Seq Scan）和位图堆扫描（Bitmap Heap Scan）的并行决策

为什么调了参数还是不并行？检查这几个硬性条件

即使 parallel_setup_cost 和 parallel_tuple_cost 都调得很激进，并行也可能被拦在门外。这不是参数问题，而是 PostgreSQL 的硬约束。

max_parallel_workers_per_gather 必须 > 0（默认是 2，但有些云厂商 RDS 默认关成 0）
查询不能含不支持并行的节点：比如 FOR UPDATE、窗口函数带 RANGE、某些 CTE、或自定义聚合函数未标记 PARALLEL SAFE
目标表必须是普通表（不是视图、物化视图、分区表的父表）；且 relpages 统计值不能为 0（VACUUM 或 ANALYZE 没跑过会卡住）
如果用了 LIMIT，planner 可能预判“取前 10 行没必要并行”，此时加 OFFSET 0 有时能绕过误判（但非常规手段）

生产环境调参的真实节奏

这两个 cost 参数不是“设一次就稳了”的开关。实际负载中，同一条 SQL 在不同数据量、不同并发压力下，最优值可能差一倍。

优先在 EXPLAIN (ANALYZE, BUFFERS) 确认并行已生效的前提下微调，而不是凭空压低
不要在 postgresql.conf 全局修改：用 ALTER database ... SET 或连接级 SET 更可控
最易被忽略的一点：parallel_setup_cost 和 parallel_tuple_cost 的作用是“让 planner 更愿意选并行”，但最终是否提速，取决于实际 I/O 吞吐、worker 间数据倾斜、以及你的查询是否真能被拆分——比如一个 GROUP BY 聚合字段基数极低，所有 worker 全往同一个 hash bucket 里塞数据，那并行反而更慢

发表于：web3.0

近两天内

复制链接

怎么查看自己电脑里的以太坊以太坊电脑储存后查看方法

挂单交易能避免滑点吗？滑点过大时怎么办？

Golang Web应用如何防范SQL注入_GORM参数化查询实践

币圈管“撸毛”叫“交互”和“反撸”是什么意思

Laravel Blade 多个 @yield 的正确使用与替代方案

SQL PostgreSQL 的 parallel_setup_cost / parallel_tuple_cost 的并行查询阈值调优

parallel_setup_cost 太高导致并行根本没启用

parallel_tuple_cost 影响并行扫描的“性价比”判断

为什么调了参数还是不并行？检查这几个硬性条件

生产环境调参的真实节奏

css 盒模型为什么元素宽度会变大_通过调整 box sizing 计算方式解决

composer怎么使用国内镜像_composer国内环境优化教程

如何在 GoConvey 中精确限定仅运行当前目录的 main 包测试

Linux cgroups v2 在 systemd 与容器运行时的统一迁移路径

Sublime恢复默认设置_Sublime重置配置文件指南【重置】

实现拖拽文件上传区域的实时格式校验与悬停错误提示

C# 文件上传到FastDFS C#如何与FastDFS分布式文件系统交互

REST API返回的XML数据如何映射到前端模型？

HTML5History返回白屏_HTML5路由守卫与popstate事件处理教程【技巧】

为什么资金集中在龙头项目_如何识别龙头币