Linux 磁盘 IO 性能瓶颈分析方法

7次阅读

%util接近100%却无卡顿，因它仅统计队列非空时间，不反映延迟；SSD/NVMe并发强，高%util可能仅表示高吞吐、深队列；应重点关注await、avgqu-sz及iostat -x扩展指标。

%util 表示设备忙于处理 I/O 请求的时间百分比，但它的计算方式是“任意时刻只要队列里有请求就记为忙”，并不反映实际响应延迟。SSD 或 NVMe 设备并发能力强，%util 高可能只是队列深、吞吐大，而非瓶颈。

真正关键的是 await（平均 I/O 等待时间）和 svctm（服务时间），但注意：在现代内核（2.6.34+）中 svctm 已被弃用，恒为 0，不可信。

完全正常。I/O 密集型进程大部分时间在等待磁盘响应，处于 D（uninterruptible sleep）状态，不计入 top 的 CPU 使用率，但会被 iotop 捕获。

要确认是不是真由它引起瓶颈，得看它触发的是随机 I/O 还是顺序 I/O：

fio 默认配置模拟的是理想化负载，和真实业务差异极大。常见脱节点包括：

没设 --filename 指向实际业务数据盘，而是测了系统盘或 tmpfs
用 -ioengine=sync 测延迟，但生产 mysql/postgresql 默认走 libaio + direct I/O，必须加 --ioengine=libaio --direct=1
块大小设成 -bs=4k 却没配 --rw=randread，实际业务混合了读写、不同 offset、带 metadata 操作
漏掉文件系统缓存影响：测试前忘执行 echo 3 > /proc/sys/vm/drop_caches，导致反复读同一块数据全走 page cache

更贴近生产的方法是用 blktrace 录制真实 IO 模式，再用 blkparse + fio --read_iolog 回放。

直接读 /proc/diskstats 可避开工具开销，适合嵌入监控脚本。每行 14 列，关键字段按位置是：

注意：这些是累加值，需两次采样做差分。别直接用第 13 列做告警阈值——它只反映某一纳秒快照，抖动极大。

发表于：运维

2026-01-29

复制链接

如何在动态生成表单时，通过表单外部按钮（如导航栏按钮）触发提交？

composer中如何配置项目的Bug追踪链接_composer.json中support字段【指南】