Python 如何判断一个文件是否正在被其他进程写入

10次阅读

python无法直接可靠判断文件是否正被写入,需用间接方法:windows可试独占打开,跨平台推荐portalocker加锁,辅以大小/时间戳变化检测和进程工具分析。

Python 如何判断一个文件是否正在被其他进程写入

Python 无法直接、可靠地判断一个文件“是否正在被其他进程写入”,因为操作系统不提供标准的跨平台接口来查询文件的“写入中”状态。但可以通过一些间接、启发式的方法进行合理推测,适用于常见场景(如日志轮转、数据导入等)。关键在于理解原理、权衡可靠性与实用性。

检查文件是否被独占打开(windows

Windows 系统下,若另一进程以 排斥模式(exclusive access 打开文件(例如用 CREATE_ALWAYS + FILE_SHARE_NONE),则 Python 尝试以写方式打开该文件会失败。这可作为线索之一:

  • os.open(path, os.O_WRONLY | os.O_EXCL) 尝试独占打开(需配合异常捕获)
  • 更常用的是尝试以普通写模式打开并立即关闭:open(path, 'r+b');若抛出 PermissionErroraccessDenied,很可能正被其他进程以不可共享方式占用
  • 注意:仅对 Windows 有效;linux/macOS 默认允许并发读写,不会因此报错

观察文件大小与修改时间是否动态变化

适用于持续追加写入的场景(如日志文件)。通过短时间间隔内多次采样,判断文件是否处于活跃写入状态:

  • 记录文件大小(os.path.getsize())和最后修改时间(os.path.getmtime()
  • 1–2 秒后再次读取,若两者任一发生变化,说明文件很可能正在被写入
  • 为避免误判,建议连续 2–3 次检测到变化再确认;也要排除定时刷新(如某些程序每秒 flush 一次)

尝试获取文件锁(跨平台推荐方案)

虽然不能探测“别人是否锁了”,但可以尝试加锁并根据结果推断:

立即学习Python免费学习笔记(深入)”;

  • 使用 portalocker 库(封装flockLockFileEx)执行非阻塞排他锁:portalocker.lock(f, portalocker.LOCK_EX | portalocker.LOCK_NB)
  • 若加锁成功,说明当前无其他进程持有该锁(但不等于没在写——对方可能根本没加锁)
  • 若加锁失败(抛出 IOError / BlockingIOError),说明已有进程持有了同类型锁(前提是对方也用了兼容锁机制)
  • ⚠️ 重要前提:所有相关进程必须约定使用同一套锁协议,否则无效

结合进程信息辅助判断(Linux/macos

通过系统命令查看哪些进程打开了目标文件(需权限,且有延迟):

  • 执行 lsof +D /path/to/dirlsof /path/to/file,解析输出中是否有 WD(write-delete)、REG + w 标记的行
  • 或用 ss/fuser(如 fuser -v filename
  • 缺点:依赖外部命令、可能无权限、结果非实时、无法在容器等受限环境使用

没有银弹。最实用的做法是:按业务场景选择 1–2 种方法组合使用,例如先检查 mtime 变化,再尝试加锁;同时在设计阶段推动协作方统一加锁规范。不复杂但容易忽略。

text=ZqhQzanResources