Linux 系统性能监控工具使用教程

1次阅读

top 默认 %cpu 是采样周期内平均值且多核可超100%，易误判；应按1显示各核负载、用pidstat分项采样、以available而非free评估内存压力。

Linux 系统性能监控工具使用教程

top 命令看 CPU 占用不准？别信默认的 %CPU 列

linux 的 top 默认显示的 %CPU 是进程在整个采样周期内的平均占用率，不是瞬时值；多核系统下还可能超过 100%，容易误判“某个进程吃满 CPU”。

实操建议：

按 Shift + P 确保按 CPU 排序，再按 1 显示所有 CPU 核心的负载（否则只显示总和）
关注 ni（nice 值）、pr（优先级）和 vsz/rss，比单纯看 %CPU 更能定位是计算密集还是内存压力大
如果发现某个进程 %CPU 长期在 200–300，大概率跑在 4 核机器上且占满 2–3 个核，不是单核 200%

用 pidstat 替代 top 查细粒度 CPU/IO 指标

top 是交互式快照，pidstat 才是做性能归因的主力——它能按秒采样、分进程打点、分离 CPU 用户态/内核态、区分磁盘 I/O 类型。

常见错误：直接跑 pidstat 不带参数，结果只输出标题没数据。

实操建议：

查每秒 CPU 使用：pidstat -u 1（-u 是用户态 CPU，默认也含内核态）
查磁盘 IO 等待：pidstat -d 1，重点看 %iowait 和 rkB/s/wkB/s
加 -t 可看到线程级数据，对 Java 应用排查 GC 线程卡顿很关键

free 输出里的 available 字段到底怎么算出来的

free 命令里 available 列不是 “剩余可用内存”，而是内核估算的、可立即分配给新进程而不触发 OOM 或严重 swap 的内存上限。它比 free 列高得多，但也不等于真实空闲。

为什么重要？因为很多监控脚本还在用 free / total 算“内存使用率”，结果在容器或缓存型服务（如 redis、elasticsearch）上严重失真。

实操建议：

不要用 free 列除以 total 来告警；优先看 available 是否持续低于阈值（比如
available 会受 /proc/sys/vm/vfs_cache_pressure 影响：值越大，内核越激进回收 dentry/inode 缓存，available 就显得越高
查真实压力，配合 cat /proc/meminfo | grep -E "^(MemAvailable|SReclaimable|PageTables)"

vmstat 1 输出中 si/so 高 ≠ 一定在 swap

vmstat 1 里 si（swap in）和 so（swap out）为 0，不代表没发生 swap；它们只统计页换入/换出的 KB 数，而 Linux 从 4.19+ 开始默认启用 swap-backed transparent huge pages，大页 swap 不走这套计数器。

更隐蔽的问题是：si/so 高往往伴随 bi/bo（块设备读写）同步飙升，说明磁盘 IO 已成瓶颈，swap 只是表象。

实操建议：

先确认是否真用了 swap：swapon --show 和 cat /proc/swaps
查 swap 活跃度：grep -i "swap" /proc/vmstat（看 pgpgin/pgpgout）
如果 so 持续 > 0 且 bi 很低，可能是 SSD 延迟低掩盖了 swap 开销；这时更要盯 pgmajfault（次缺页中断）是否上升

真正难的不是记命令，是理解每个字段背后内核做了什么动作。比如 available 是估算值，%CPU 是均值，si/so 是采样路径之一——脱离上下文直接读数字，十有八九会导错排查方向。

发表于：运维

近一天内

复制链接

如何使用 PHPMailer 正确发送 HTML 表单数据并实现前后端交互反馈

PHP获取域名含参数怎么去掉参数_PHP域名去参数保留主域【方法】

内核升级后出现 “dracut: FATAL: Don‘t know how to handle ’root='” 的模块缺失

php远程访问文件怎么打开_phpcurl实现远程文件读取操作【技巧】

HTML怎么设置表单字段联动_HTML dependent select实现教程【逻辑】

Linux 系统性能监控工具使用教程

top 命令看 CPU 占用不准？别信默认的 %CPU 列

用 pidstat 替代 top 查细粒度 CPU/IO 指标

free 输出里的 available 字段到底怎么算出来的

vmstat 1 输出中 si/so 高 ≠ 一定在 swap

Laravel怎么获取路由参数_Laravel在控制器接收ID变量方法【基础】

如何在 Go 中递归遍历任意嵌套的 JSON 数据（无结构体定义）

C++中std::reduce怎么实现并行累加_C++17数值计算优化方法【并行】

Hibernate配置文件cfg.xml详解 Hibernate XML配置连接数据库

c# solid原则是什么

Python 协程并发数控制的实现方法

如何正确处理 JavaScript 动态生成链接中的多词 URL 参数

composer如何强制使用特定PHP版本？（平台配置详解）

SQL tmp_table_size 的临时表内存阈值与磁盘切换监控

如何在 JavaScript 动态生成链接时正确处理含空格的多词 URL 参数