Linux fio 的随机读写测试与 IOPS / 延迟曲线绘制脚本

1次阅读

fio随机读写测试需加–direct=1绕过page cache、–iodepth控制队列深度、–bs=4k测iops，配–time_based–runtime=60和–size=10g防缓存干扰；输出曲线须用–write_iops_log与–write_lat_log生成时序日志，再清洗绘图。

直接用 fio 跑随机读写，十次有八次测出来的是缓存数据或队列堆积结果，不是磁盘真实能力。关键在绕过 page cache、控制队列深度、固定 IO size 和模式。

必须加 --direct=1，否则 linux 会把大部分 IO 拦在 page cache 里，randread 可能全走内存
用 --iodepth=32 模拟高并发场景，但别盲目堆高——NVMe 盘可设到 64，SATA SSD 超过 16 就容易掩盖延迟差异
--bs=4k 是测 IOPS 的黄金值；想看吞吐就换 --bs=128k 或 --bs=1m，但两者不能混在同一轮测试比
加 --time_based --runtime=60，避免因文件大小不足提前退出；同时配 --size=10g（至少 2 倍于 RAM）防 swap 干扰

fio 默认输出是人眼友好型汇总，没法直接喂给 gnuplot 或 pandas。得靠 --output-format=json + 后处理，但注意默认 JSON 不含逐秒明细。

加 --write_iops_log=iops --write_lat_log=lat --log_avg_msec=1000，生成两个日志：每秒平均 IOPS 和每秒平均延迟（单位微秒）
生成的 iops.log 是纯文本，三列：时间戳、IOPS、带宽（KB/s）；lat.log 第三列是延迟（微秒），别误当成毫秒
如果要亚秒级分辨率（比如看 burst 行为），把 --log_avg_msec=1000 改成 100，但日志体积暴涨，SSD 测 60 秒可能出 600 行
别用 --minimal 输出——它压根不记录时间序列，只给最终均值

直接用 lat.log 画图，经常发现 X 轴是乱序时间戳、Y 轴数值跳变巨大，其实是 log 文件里有空行或头尾非数据行。

两个 --numjobs=4 的 job 并发跑，总 IOPS 不是单个 job 的 2 倍——尤其在 SATA 盘或低队列深度下，控制器争抢会让实际吞吐塌缩。

真正难的不是跑出数字，而是让每次测试的变量可控——同一块盘，换一个 --ioengine（比如 libaio vs sync），延迟分布可能完全两样，但很多人根本没意识到自己在测引擎而非磁盘。

发表于：后端开发

四天前

复制链接

Linux 软件包冲突的定位与解决

如何在 React 中正确地在兄弟组件间传递状态数据