Linux pidstat 分析进程资源占用

7次阅读

Linux pidstat 分析进程资源占用

pidstat 是 sysstat 工具包中的一个轻量级实时监控命令,专用于按进程(PID)维度统计 CPU、内存、I/O、上下文切换等资源使用情况。相比 top 或 htop,它更适配脚本化分析和细粒度排查——尤其当你需要定位“哪个线程在吃 CPU”“哪个进程在频繁刷盘”或“谁触发了大量软中断”时。

CPU 使用分析:识别高负载进程与线程

默认运行 pidstat 会每秒输出一次所有活跃进程的 CPU 占用(%CPU),并自动合并同一进程的多线程数据。加 -t 可展开线程级视图,显示线程 ID(TID)和父进程 ID(PID):

  • pidstat -t 1 5:每秒采样一次,共 5 次,带线程明细
  • 重点关注 %usr(用户态 CPU)、%sys(内核态 CPU)和 %guest(虚拟机开销)。若 %sys 显著偏高,可能涉及频繁系统调用或锁竞争
  • 对 Java 进程,常看到多个 java 线程 TID 并列高 %usr;此时可结合 jstack <pid></pid> 查看对应线程

I/O 行为追踪:发现隐性磁盘压力源

-d 参数启用 I/O 统计,输出每秒读写字节数(kB_rd/s、kB_wr/s)、IO 等待时间(%iowait)及每秒 I/O 操作数(tps):

  • pidstat -d -p <pid> 2</pid>:仅监控指定进程,每 2 秒刷新一次,适合聚焦分析
  • 注意 MB_wr/s 高但 tps 低 → 大块顺序写;反之 tps 高而 kB_wr/s 低 → 小块随机写,更易引发 I/O 瓶颈
  • 若某进程 %iowait 持续 >20%,且磁盘 util 接近 100%(可用 iostat 验证),说明它正被 I/O 阻塞,而非主动消耗 CPU

内存与上下文切换:排查抖动与争用

-r 查看内存页错误(minflt:次要缺页,通常从 page cache 加载;majflt:主要缺页,需磁盘 IO)、驻留内存(RSS);用 -w 监控进程级上下文切换(cswch/s:自愿切换,如 sleep;nvcswch/s:非自愿切换,因时间片耗尽或资源争抢):

  • pidstat -r -w -p <pid> 1</pid>:同步观察内存缺页与切换行为
  • 持续高 majflt/s 通常指向内存不足或进程工作集远超物理内存 → 触发 swap 或 OOM killer
  • 非自愿切换(nvcswch/s)突增,配合高 %sys,往往意味着锁竞争(如 futex 等待)或 CPU 资源严重不足

实用技巧与避坑提醒

pidstat 默认只显示“活跃”进程(有资源消耗才出现),静默进程不会列出。想捕获启动瞬间的行为,可用 -l 显示完整命令行,或搭配 pgrep 动态过滤:

  • pidstat -u -p "$(pgrep -f 'python.*data_process.py')" 1:精准监控特定 Python 脚本
  • 历史数据需用 sadf 解析 sysstat 的二进制日志(/var/log/sa/saXX),pidstat 本身不落盘
  • 容器环境中,宿主机 pidstat 看到的是容器内 PID(命名空间隔离后),需确认是否需进入容器 Namespace 才能匹配应用日志中的 PID
text=ZqhQzanResources