Linux 磁盘空间频繁告警的治理思路

1次阅读

磁盘显示有空间却报“磁盘已满”，实因三类隐性占用：已删除但进程仍打开的文件、inode 耗尽、docker 日志或镜像持续写入；需用 df -h、df -i、lsof +L1、du 等组合定位真凶，再分场景精准清理。

Linux 磁盘空间频繁告警的治理思路

为什么 df 显示还有空间，却总报“磁盘已满”？

这不是误报，而是 linux 存储机制在“说实话”：空间可能被三类东西悄悄吃掉——已删除但进程仍打开的文件、大量小文件耗尽 inode、Docker 镜像层或容器日志持续写入却不清理。比如 lsof +L1 一查，常发现 java 或 nginx 进程还占着 /var/log/app.log (deleted) 的句柄，删了也白删；又或者 df -i 显示 inode 使用率 99%，但 df -h 才用 60%，这时新建任何文件都会失败。

别急着删，先用这组命令锁定真凶路径

盲目 rm -rf 可能干掉正在写日志的服务或数据库临时文件。优先执行：

df -h 看哪个挂载点爆了（重点关注 /、/var、/home）
du -sh /* 2>/dev/NULL | sort -hr | head -10 快速定位根下前 10 大目录
进可疑目录后，比如 /var，再跑 du -sh * | sort -hr | head -5
对运行中服务，必须补上 sudo lsof +L1 | grep deleted，确认有没有“幽灵文件”

特别注意：find / -type f -size +100M -exec ls -lh {} ; 2>/dev/null 能揪出隐藏大文件，但别直接加 -delete——很多 core.* 或 dump 文件需先确认归属进程再处理。

清理要分场景，不能一刀切

系统日志、应用日志、Docker 缓存、临时文件，每类清理逻辑完全不同：

journalctl --disk-usage 查 systemd 日志占用；用 journalctl --vacuum-size=200M 收缩，别碰 /var/log/journal 目录本身
Nginx/mysql/tomcat 日志，检查是否启用 logrotate；没配就补 /etc/logrotate.d/nginx，务必加 copytruncate 防服务中断
Docker 主机必跑 docker system prune -f，但得提前确认无重要停止容器；/var/lib/docker/tmp 也要定期清
/tmp 可清，但先 lsof +D /tmp 看有没有进程正用着里面文件

一个典型坑是：apt clean 或 yum clean all 只清包缓存，不碰 /var/cache/apt/archives/partial/ 下的下载中断残留，得手动 rm -rf /var/cache/apt/archives/partial/*。

告警变“稀客”，关键在关住水龙头

反复清理只是擦水渍，真正要盯的是增长源。比如某台机器 /var/log 每周涨 2.3GB，就得查是不是某个脚本每小时 dump 一次全量日志；又比如 Docker 容器日志没限流，--log-opt max-size=10m --log-opt max-file=3 这种配置必须写进 docker run 或 compose.yml。阈值也不能死卡 90%，zabbix/prometheus 建议设阶梯告警：85% 邮件、92% 企微、95% 自动触发归档脚本——而脚本里该压缩的压缩，该通知的通知，不该删的绝不删。

发表于：开发工具

近两天内

复制链接

composer的post-install-cmd和post-update-cmd有什么区别_解析post-install-cmd与post-update-cmd的差异

为什么VSCode的迷你地图能帮助你快速滚动长代码文件【教程】

提升Python开发体验的10个VS Code插件

如何在Composer脚本中安全地使用sudo执行需要权限的命令？

php格式文件用editplus打开好吗_editplus打开php技巧【技巧】

Linux 磁盘空间频繁告警的治理思路

为什么 df 显示还有空间，却总报“磁盘已满”？

别急着删，先用这组命令锁定真凶路径

清理要分场景，不能一刀切

告警变“稀客”，关键在关住水龙头

宝塔PHP8.4怎样批量部署_快速创建多个PHP8.4站点操作【方法】

css::marker伪元素如何修改列表项符号_定制有趣的列表项样式

以太坊发行价是多少钱_ETH的起源和最初价格介绍

HTML 中使用 CSS Grid 布局优雅排列 8 个独立表格

css常见布局实战_实现一个卡片式UI布局

Golang中值类型传递的效率问题_Golang值类型性能与优化方法

深入理解MySQL数据库基本概念：存储引擎、事务与ACID特性

PHP如何判断文件是否损坏_PHP文件完整性判断【校验】

C# 备忘录模式实现方法 C#如何实现对象状态的撤销和恢复

PHP定时刷新图片用于监控画面_结合sleep与循环读取目录实现详解【方法】