Linux rsync 高效备份实践

2次阅读

rsync增量同步变慢主因是–delete触发全量扫描，尤其小文件多时io暴增；应改用–delete-delay、避免nfs/cifs上使用，并用–dry-run预估行为。

Linux rsync 高效备份实践

根本原因常是 --delete 或 --delete-after 触发全量扫描，尤其在大量小文件场景下，rsync 会先遍历目标端确认哪些要删，IO 和 stat 调用暴增。不是算法问题，是操作语义代价被低估。

加 --delete-delay 把删除动作延后到传输完成再批量执行，减少中途中断导致的不一致
避免在 NFS 或 CIFS 挂载点上用 --delete，远程文件系统 stat 性能差，容易卡在“building file list”阶段
用 rsync --dry-run --stats 先看预估行为：重点关注 number of files 和 Number of created directories 是否异常高

默认只比对修改时间 + 大小，但 NFS、容器卷或某些备份存储会丢失 mtime 精度，导致反复传输。必须显式启用内容校验，但别无脑加 --checksum。

每次 rsync 都新建 SSH 连接，密钥解析、TCP 握手、加密协商叠加起来，小文件多时耗时可能超过传输本身。OpenSSH 的 ControlMaster 是解法，但配置错会导致锁死或权限错误。

在 ~/.ssh/config 里配：

Host backup-server     HostName 192.168.1.100     User backupuser     ControlMaster auto     ControlPath ~/.ssh/cm-%r@%h:%p     ControlPersist 300

rsync 本身不支持断点续传大文件（除非用 --partial），但常见误操作是直接重跑命令，结果触发大量重复校验甚至误删。

必加 --partial：传输中断时保留已下载部分，下次自动基于相同路径继续
慎用 --append：只适用于纯追加场景（如日志），对随机写入的数据库文件会损坏数据
真正可靠的续传依赖外部机制：用 find /src -newer /tmp/last_backup.marker -print0 | rsync --files-from=- ...，靠时间戳标记边界，避开 rsync 自身状态管理

最麻烦的从来不是命令写不对，而是没想清楚“这次备份到底要保证什么”——是强一致性？还是最终一致性？是单次快照，还是持续流式？选错前提，参数调得再细也救不回来。

发表于：后端开发

近一天内

复制链接

如何在 Sentry 中正确设置并显示用户邮箱信息

css 样式文件更新但页面不变_通过缓存清理和版本控制解决