Linux inode 使用优化与监控

1次阅读

inode耗尽时touch报“no space left on device”是因文件系统inode用完而非磁盘空间不足；用df -i查看use%定位热点，重点关注/var、/tmp等小文件密集区，超92%需预警清理。

Linux inode 使用优化与监控

inode 耗尽时 `touch` 报错 `No space left on device` 怎么快速定位

磁盘明明还有大量空间，touch 却报 “No space left on device”，八成是 inode 耗尽了。linux 文件系统为每个文件/目录分配一个 inode，不看数据大小，只看数量上限。

实操建议：

用 df -i 查看各挂载点的 inode 使用率，重点关注 Use% 列 —— 超过 95% 就得立刻处理
df -i /home 比 df -i 全局扫描更快，尤其当系统有多个挂载点时
别只盯着 /，/var（日志、容器层）、/tmp（临时文件暴增）才是 inode 热点区
某些 XFS 文件系统默认 inode 数量固定，创建时没预留足够余量，后期无法动态扩容

小文件密集场景下如何预防 inode 不足

邮件队列、日志轮转、监控采集、容器 overlayfs 层都会生成海量小文件，这是 inode 消耗主力。

实操建议：

应用层做归档：比如把 /var/log/nginx/*.log 按天压缩后删除原始文本，减少单个目录下文件数
用 find /path -type f -mtime +7 -delete 定期清理旧小文件，避免 rm -rf 误伤或卡住
新建 ext4 文件系统时加 -i 4096（每 4KB 数据配 1 个 inode），比默认的 16KB 更抗小文件 —— 但会略微增加元数据开销
对 /var/spool/postfix 这类已知高 inode 压力目录，可单独挂载并调大 mkfs.ext4 -N 指定 inode 总数

`ls -li` 和 `stat` 查 inode 号时为什么结果不一致

同一个文件在不同命令里显示的 inode 号不同？不是 bug，是硬链接、挂载点或 bind mount 导致的视图差异。

实操建议：

ls -li 显示的是当前路径下该文件名指向的 inode 号，如果存在硬链接，多个路径可能指向同一 inode
stat /path/file 显示的是该路径解析后的实际 inode，更权威；但若路径跨 bind mount 或 overlayfs，stat 仍可能返回上层视图的 inode
真正要确认是否同一文件，用 stat -c "%d:%i" /path/a /path/b 对比 dev:inode 对 —— 设备号（%d）必须相同才有可比性
容器内看到的 inode 号通常和宿主机不一致，因为 overlayfs 在 upperdir 中重新映射了 inode，此时不能直接用 inode 号做跨环境追踪

监控脚本里怎么安全判断 inode 预警阈值

写自动化监控时，不能只看 df -i 的 Use%，它在某些场景下会失真。

实操建议：

避开 df -i | awk '//$/ {print $5}' | sed 's/%$//' 这种脆弱解析 —— 字段顺序受 locale 影响，df -i --output=source,pcent,target 更稳
ext4 下，Reserved block count 也占用 inode 配额（虽不计入 df -i 的 Used），但 root 用户仍可写入，所以预警阈值建议设为 92% 而非 95%
对 NFS 挂载点，df -i 可能返回 ? 或超时，需加超时控制：timeout 5 df -i /mnt/nfs 2>/dev/NULL
监控项应同时采集 Inodes（总数）、IUsed（已用）、IFree（空闲），三者相加不等于总数说明有异常（如 XFS 的 finobt 启用时统计逻辑不同）

inode 不是“看不见的空间”，但它比磁盘空间更难感知 —— 没有明显增长趋势，却会在某个 creat() 系统调用时突然失败。最危险的是那些每天新增几千个临时文件、但从不清理的服务，它们不会报警，只会悄悄让新进程启动失败。

发表于：运维

近一天内

# bug # count # delete # li # linux # nginx # node # NULL # print # var # 自动化

复制链接

c++中如何判断一个数是否为水仙花数_c++循环与取余算法实现【详解】

Go 中静态绑定与动态绑定的实践对比：为何映射表优于反射自动发现

如何通过语义化结构与函数复用消除重复 CSS 代码

使用OpenCV实现多尺度多角度模板匹配以统计图像中目标物体数量

Django抽象模型中如何安全实例化关联的具体模型

Linux inode 使用优化与监控

inode 耗尽时 `touch` 报错 `No space left on device` 怎么快速定位

小文件密集场景下如何预防 inode 不足

`ls -li` 和 `stat` 查 inode 号时为什么结果不一致

监控脚本里怎么安全判断 inode 预警阈值

Angular 按钮事件不触发？详解表单提交与数组变更检测失效问题

mysql主从复制中服务器的版本兼容性问题与解决

composer常用命令有哪些_composer开发常用指令汇总【速查】

Python 如何设计可扩展的系统？

币安Binance注册登录官网直达币安安卓版v8.9.2最新安装包下载

如何在 Thonny IDE 中正确使用 pyserial 模块实现串口通信

SQL Vitess VTGate 的 query timeout 与 scatter query 限流实践

Linux GlusterFS 分布式存储优化

Laravel怎么实现第三方登录 _ Laravel Socialite扩展包配置方法【指南】

Linux 系统卡顿原因排查方法

Linux inode 使用优化与监控

inode 耗尽时 touch 报错 No space left on device 怎么快速定位

小文件密集场景下如何预防 inode 不足

ls -li 和 stat 查 inode 号时为什么结果不一致

监控脚本里怎么安全判断 inode 预警阈值

inode 耗尽时 `touch` 报错 `No space left on device` 怎么快速定位

`ls -li` 和 `stat` 查 inode 号时为什么结果不一致