/ proc/sys/vm/dirty_ratio 和 dirty_background_ratio 写脏页过多的调优经验

7次阅读

linux内核通过dirty_background_ratio和dirty_ratio控制脏页管理：前者触发后台异步刷盘，后者导致同步阻塞写操作；二者须满足background
Linux 内核通过 dirty_ratio 和 dirty_background_ratio 控制内存中“脏页”（即已修改但尚未写入磁盘的页）的积累上限，直接影响 I/O 压力、响应延迟和系统稳定性。当应用频繁写文件（如数据库、日志服务、大数据任务），若这两个参数设置不合理，容易触发突发性刷盘、进程阻塞（write() 被卡住）、甚至系统抖动。
理解两个参数的实际行为
dirty_background_ratio：内存中脏页占比达到该百分比（相对于可用内存，非总内存）时，内核后台线程（bdflush 或 writeback）开始异步刷脏页到磁盘。它不阻塞写操作，只启动“悄悄清理”。
dirty_ratio：脏页占比达到该值时，所有新写操作（如 write()）会被同步阻塞，直到脏页降至 dirty_ratio 以下。这是最后防线，直接影响应用吞吐和延迟。
二者关系必须满足：dirty_background_ratio ，否则后台刷盘永远不会启动，全靠前台阻塞扛压。
常见过载场景与典型误配
默认值（如 dirty_background_ratio=10, dirty_ratio=20）在大内存机器（如 128G+）上易导致“积压过多才动手”，后台刷速跟不上写速，最终撞上 dirty_ratio 引发大面积 write 阻塞；
将 dirty_ratio 设得过高（如 40），虽减少阻塞频次，但单次刷盘数据量巨大，可能打爆磁盘 IOPS，造成秒级 I/O stall；
在 SSD 或 NVMe 上仍沿用机械盘时代的保守值（如 background=5），浪费高吞吐能力，限制写入并发；
未结合 dirty_expire_centisecs（脏页老化时限，默认3000=30秒）和 dirty_writeback_centisecs（后台刷盘周期，默认500=5秒）协同调整，导致老化页堆积或唤醒太稀疏。
面向负载的调优建议
调优不是设固定值，而是匹配你的存储能力和写入特征：
高吞吐写入型（如 kafka broker、mysql InnoDB buffer pool 大写）：适当降低 dirty_background_ratio（如 5~8），加快后台介入；dirty_ratio 控制在 10~15 之间，避免单次刷盘雪崩；同时缩短 dirty_writeback_centisecs（如 100~200）让后台更勤快；
低延迟敏感型（如实时交易网关、时序数据库 ingest）：优先保响应，可设 dirty_background_ratio=3~5，dirty_ratio=8~10，辅以 vm.dirty_expire_centisecs=1000（10秒老化），让脏页不过夜；
混合负载或不确定写模式：推荐保守起步——dirty_background_ratio=10，dirty_ratio=15，再根据 /proc/vmstat 中的 pgpgout、pswpout 及 iostat -x 1 的 %util、await 实时观察：若 await 持续 >5ms 且 pgpgout 突增，说明刷盘已成瓶颈，需下调两 ratio；
永远避免 dirty_ratio ≥ 30，除非你确认磁盘持续吞吐能稳稳吃下对应脏页量（例如：128G内存 × 30% = 38.4G 脏页，需在几秒内刷完，对普通 SATA SSD 几乎不可行）。
验证与持续监控方法
不要只改完就收工。每次调整后至少观察 1~2 个业务高峰周期：
查当前值：sysctl vm.dirty_background_ratio vm.dirty_ratio；
看脏页实时状态：grep -i dirty /proc/meminfo（关注 Dirty:、Writeback:）；
跟踪刷盘行为：cat /proc/vmstat | grep -E "pgpgout|pgpgin|pswpout"，配合时间戳看单位时间增量；
关键指标告警建议：当 Dirty 长期 > dirty_background_ratio × 可用内存 × 0.8，或 Writeback 持续 > 500MB，即提示后台已忙不过来，需干预。

发表于：运维

2026-01-21

# ai # background # go # ios # kafka # linux # mysql # 堆 # 大数据 # 并发 # 异步 # 数据库 # 线程

复制链接

如何在 Python 中高效遍历矢量要素并逐个裁剪栅格影像

mysql安装时选择存储引擎InnoDB与MyISAM的区别

SQL 中字符串比较是否区分大小写？

Linux常见新手命令错误及解决方法

c++中如何实现自定义容器的迭代器_c++迭代器模式代码实现【详解】

/ proc/sys/vm/dirty_ratio 和 dirty_background_ratio 写脏页过多的调优经验

理解两个参数的实际行为

常见过载场景与典型误配

面向负载的调优建议

验证与持续监控方法

Python文件压缩与解压_性能比较解析【教程】

html空格符号怎么打_网页制作加空格用什么符号实现【技巧】

动态生成表格行：基于用户条形码输入实时查询并追加新行

HTML5如何设置边框溢出隐藏_HTML5设置边框溢出隐藏途径【溢出】

css定位与表单布局_利用定位调整表单控件位置

Laravel 中使用 ZipStream 从 S3 批量打包并下载多张图片

JavaScript 动态导入：一行代码解构多个导出函数

MySQL show processlist 中 Sleep 与 Query 的比例分析

如何在浏览器中正确启用摄像头实现人脸检测实时渲染

Composer安装提示权限不足_解决Composer sudo运行报错问题【提示】