no space left on device 但 df 显示剩余的 inode 耗尽排查脚本

1次阅读

inode耗尽时df -h显示空间充足但报“No space left on device”,而df -i显示IUse%达100%;需用find -xdev -type d配合wc -l定位高inode目录,重点排查/var/log/journal、/var/lib/docker/overlay2等;应配置journald限制、logrotate及监控df -i。

no space left on device 但 df 显示剩余的 inode 耗尽排查脚本

如何快速判断是磁盘空间还是 inode 耗尽

直接看 df -hdf -i 的输出差异:如果 df -h 显示使用率不高(比如 30%),但系统报 No space left on device,而 df -i 显示某挂载点 IUse% 达到 100%,基本可锁定为 inode 耗尽。注意:df -h 不反映 inode 状态,必须显式加 -i 参数。

定位高 inode 占用目录的 shell 一行命令

在疑似挂载点(如 /var)下快速找出 inode 消耗大户:

find /var -xdev -type d | while read dir; do echo "$(find "$dir" -maxdepth 1 -type f | wc -l) $dir"; done | sort -nr | head -20

说明:
-xdev 防止跨文件系统(比如不进入 /proc/sys
-maxdepth 1 保证只统计当前目录下的文件数,避免递归拖慢速度
– 实际中常见罪魁是 /var/log/journal/var/lib/docker/overlay2/var/spool/postfix/maildrop 等目录下积大量小文件
– 如果提示 Argument list too long,改用 find "$dir" -maxdepth 1 -type f -print0 | wc -l --files0-from=-

排查 Docker 或 systemd-journal 导致的 inode 泄漏

这两个服务极易产生海量小文件,且默认配置不清理:

  • systemd-journald:检查 /var/log/journal/*/ 下是否存有多年日志,运行 journalctl --disk-usage 查总量;临时清理用 journalctl --vacuum-size=500M--vacuum-time=2weeks
  • Docker:若用 overlay2 存储驱动,/var/lib/docker/overlay2 中每个层、每个容器都可能生成大量元数据文件;执行 docker system prune -a --volumes 前先确认业务影响
  • 注意:rm -rf 直接删 /var/log/journal 可能导致 journalctl 报错,应优先用 journalctl 自带命令清理

预防 inode 耗尽的配置建议

光靠事后清理不够,得从源头控量:

  • 对日志目录启用 logrotate 并配 maxsizerotate,避免单个日志文件分裂成数百个小文件
  • /etc/systemd/journald.conf 中设置 SystemMaxUse=500MRuntimeMaxUse=200M,重启 systemd-journald
  • 监控脚本里别只 check df -h,必须加 df -i 并告警 IUse% > 90 的挂载点
  • 创建新文件系统时,若明确知道会存大量小文件(如缓存目录),mkfs 时用 -i 4096(每 4KB 分配一个 inode)而非默认的 8KB,但需权衡 inode 表体积

inode 耗尽比磁盘满更难察觉,因为常规磁盘监控工具默认忽略它;只要没在 df 后加 -i,问题就一直藏在盲区里。

text=ZqhQzanResources