SQL pg_stat_activity 的 wait_event_type 与阻塞诊断模板

3次阅读

wait_event_type显示的是进程当前等待类型（如client、io），并非阻塞源；定位阻塞需结合pg_blocking_pids()或pg_locks中granted=false等字段分析。

查 `wait_event_type` 时为什么总看到 `Client` 或 `IO` 却没发现锁？

因为 wait_event_type 描述的是「当前正在等什么」，不是「谁在阻塞你」。它只反映 postgresql 后端进程的即时等待状态，和锁链无关——比如 Client 表示在等客户端发下一条命令，IO 可能只是刷 WAL 或读数据页，这些都不是阻塞源。

真正要定位阻塞，得结合 pg_blocking_pids(pid) 或自连 pg_stat_activity 查 blocking_pid 字段（14+ 版本）；老版本只能靠 pg_locks 关联 granted = false 和 transactionid 倒推。

wait_event_type 是“症状”，不是“病因”；别把它当锁表依据
常见误判：Lock 类型确实可疑，但 Lock + wait_event = 'relation' 才大概率是 DDL 阻塞，而 Lock + 'transactionid' 多是长事务未提交
如果 wait_event_type 是 Client，先看 state = 'idle in transaction' —— 这才是隐藏杀手，它不等资源，但会一直占着锁

用 `pg_stat_activity` 搭配 `pg_locks` 写阻塞诊断 SQL 时字段怎么对齐？

核心是把 pg_stat_activity.pid 和 pg_locks.pid 关联，但要注意：10+ 版本 pg_locks.pid 是持有锁或等待锁的 backend pid，而 pg_stat_activity 的 pid 是唯一标识，可直接 join；9.6 及更早需用 pg_locks.virtualxid 或 transactionid 间接关联，逻辑更绕。

一个稳妥的诊断模板（PostgreSQL 12+）：

select blocked.pid AS blocked_pid,        blocked.query AS blocked_query,        blocking.pid AS blocking_pid,        blocking.query AS blocking_query,        blocked.wait_event_type,        blocked.wait_event FROM pg_stat_activity blocked JOIN pg_stat_activity blocking ON blocking.pid = ANY(pg_blocking_pids(blocked.pid)) WHERE blocked.state = 'active' AND blocked.wait_event IS NOT NULL;

必须加 blocked.state = 'active'，否则会拉出一堆 idle 进程干扰判断
pg_blocking_pids() 返回数组，要用 = ANY(...)，不能用 =
如果查不到 blocking 进程，可能是它已退出但事务未结束（如 crash 后未清理），此时要去 pg_locks 查 granted = false 的行，并找对应 virtualxid 的最早持有者

`wait_event_type = 'Lock'` 但 `wait_event` 是空值，怎么回事？

这是 PostgreSQL 14 引入的行为：当等待类型为 Lock，但具体锁对象尚未确定（比如正处在锁升级、或锁管理器内部路径中），wait_event 就留空。它不代表没锁，反而说明锁竞争发生在更底层，比如 tuple 级锁升级为 page 锁时的中间态。

遇到空 wait_event 且 wait_event_type = 'Lock'，优先检查是否有大量 UPDATE/delete 在同一张小表上高频执行——容易触发锁升级争用
对比 pg_locks.locktype：如果对应行的 locktype = 'tuple' 且 mode = 'RowExclusiveLock'，但 granted = false，基本可断定是热点行锁冲突
这种空值不会出现在 pg_stat_activity 的旧版本（13 及以前），所以升级后突然看到空值，别慌，是行为变更，不是数据损坏

为什么在 RDS 或 Aurora 上查不到真实的 `blocking_pid`？

云厂商常屏蔽或重写 pg_stat_activity 中的敏感字段。例如 AWS RDS 默认关闭 rds.force_ssl 以外的某些权限，且 blocking_pid 列在多数 RDS 版本里始终为 NULL；Aurora 更进一步，用自研锁管理器，pg_blocking_pids() 返回空数组是常态。

替代方案：用 SELECT * FROM pg_locks WHERE NOT granted ORDER BY pid;，再人工比对 database、relation、transactionid 字段，找「有锁没被授」的源头
RDS 上可以开启 log_lock_waits = on，配合 deadlock_timeout 抓日志，虽然滞后但信息更全
别依赖 pg_stat_activity 的单次快照——云环境锁可能秒级释放，建议用 pg_stat_activity + pg_locks 联合视图每 5 秒采样一次，存到临时表再分析

真实阻塞链往往跨多个事务、涉及隐式锁升级和云平台抽象层，光盯 wait_event_type 容易漏掉中间环节。尤其当 wait_event 为空、或 blocking_pid 不可见时，得切到 pg_locks 底层字段一层层剥。

发表于：php框架

五天前

# ai # database # delete # NULL # postgresql # select # sql # 堆 # 对象

复制链接

Laravel中怎么处理Json数据_Laravel 模型字段Json转换【技巧】

laravel怎么为模型属性添加readonly特性_laravel模型属性readonly特性设置方法

javascript错误如何捕获_try…catch语句如何使用【教程】

如何在端口80运行 Beego 应用并使用 Apache 作为反向代理

Python 密钥轮换的自动触发流程

SQL pg_stat_activity 的 wait_event_type 与阻塞诊断模板

查 `wait_event_type` 时为什么总看到 `Client` 或 `IO` 却没发现锁？

用 `pg_stat_activity` 搭配 `pg_locks` 写阻塞诊断 SQL 时字段怎么对齐？

`wait_event_type = 'Lock'` 但 `wait_event` 是空值，怎么回事？

为什么在 RDS 或 Aurora 上查不到真实的 `blocking_pid`？

PHP创建文件版本兼容性问题_PHP5与PHP7的区别【解答】

如何使用 CSS :has() 伪类实现跨结构的复选框状态联动样式控制

C++中make_shared有什么好处_C++智能指针内存分配优化原理【底层】

Golang初级实战：开发一个简单的命令行音乐文件分类器

Sublime怎么配置JSON格式化_Sublime JSON美化教程【调试】

XML文件如何加密特定节点只加密XML中的敏感信息

Linux systemd-homed 的用户主目录加密与可移植性优势

mysql如何用mysql实现后台数据统计功能_mysql统计系统设计

C++如何实现环形缓冲区？（无锁队列基础结构）

Web.config重定向规则配置 IIS服务器URL重写XML写法

SQL pg_stat_activity 的 wait_event_type 与阻塞诊断模板

查 wait_event_type 时为什么总看到 Client 或 IO 却没发现锁？

用 pg_stat_activity 搭配 pg_locks 写阻塞诊断 SQL 时字段怎么对齐？

wait_event_type = 'Lock' 但 wait_event 是空值，怎么回事？

为什么在 RDS 或 Aurora 上查不到真实的 blocking_pid？

查 `wait_event_type` 时为什么总看到 `Client` 或 `IO` 却没发现锁？

用 `pg_stat_activity` 搭配 `pg_locks` 写阻塞诊断 SQL 时字段怎么对齐？

`wait_event_type = 'Lock'` 但 `wait_event` 是空值，怎么回事？

为什么在 RDS 或 Aurora 上查不到真实的 `blocking_pid`？