Golang如何获取文件信息_Golang文件元数据获取方法

5次阅读

os.Stat()是最常用且推荐的获取文件元数据方式,返回FileInfo接口包含大小、权限、修改时间等字段,不打开文件、性能好;需检查错误、区分符号链接、注意windows创建时间、理解Size/Mode位含义、处理time.Time精度差异、防范阻塞与权限异常。

Golang如何获取文件信息_Golang文件元数据获取方法

os.Stat() 是最常用且推荐的获取文件元数据方式

直接调用 os.Stat() 即可获取完整文件信息,它返回 os.FileInfo 接口,包含大小、权限、修改时间等核心字段。注意它不打开文件,只读取目录项,性能好、开销小。

常见错误是误用 os.Lstat()(用于符号链接本身)或忘记检查错误:

  • os.Stat() 在路径不存在或无权限时返回非 nil 错误,必须检查 err != nil
  • 若路径是符号链接,os.Stat() 返回目标文件信息;需要链接自身信息才用 os.Lstat()
  • windows 下文件创建时间(FileInfo.Sys().(*syscall.Win32FileAttributeData).CreationTime)需类型断言和平台判断,标准 FileInfo 不暴露该字段

FileInfo.Size() 和 FileInfo.Mode() 要理解它们的单位和位含义

FileInfo.Size() 返回字节数,不是块数或人类可读格式;FileInfo.Mode() 返回 os.FileMode,本质是 uint32,需用位操作判断类型和权限。

典型误用是直接打印 mode 数值或混淆 IsDir()IsRegular()

立即学习go语言免费学习笔记(深入)”;

  • 判断是否为目录:用 fi.Mode().IsDir(),而非 fi.Mode()&os.ModeDir != 0(虽等价但可读性差)
  • 判断是否可执行(unix):需 fi.Mode()&0111 != 0,因为 os.ModePerm 是 0777,执行位在用户/组/其他三组里都可能独立存在
  • 获取原始权限数值(如 0644):用 int(fi.Mode().Perm())Perm() 会屏蔽掉目录、符号链接等特殊位

time.Time 字段要注意时区和精度差异

FileInfo.ModTime()FileInfo.Sys().(*syscall.Stat_t).Atim 等返回的 time.Time 默认按本地时区解析,但底层系统调用通常只提供秒或纳秒级时间戳,精度因 OS 而异。

实际开发中容易忽略这点导致比较出错:

  • linux ext4 默认记录到纳秒,但某些文件系统(如 FAT32)只支持 2 秒精度;macOS HFS+ 为 1 秒
  • 跨平台比较修改时间建议用 t1.After(t2.Add(-1 * time.Second)) && t1.Before(t2.Add(1 * time.Second)) 容忍误差
  • 写测试时不要依赖 ModTime().Equal(),应使用 ModTime().Truncate(time.Second).Equal(other.Truncate(time.Second))

大文件或网络文件系统上 Stat() 可能阻塞或失败

os.Stat() 是同步系统调用,在 NFS、SMB 或挂载异常的设备上可能卡住几秒甚至超时,且无法设置超时。

生产环境需防御性处理:

  • 对不可信路径(如用户上传的文件名)加 context 控制:os.Stat() 本身不支持 context,需用 exec.Command("stat", "-c", "%s", path) 配合 cmd.Start() + cmd.Wait() 实现超时,但代价是 fork 开销和平台差异
  • 若只需判断存在性,用 os.IsNotExist(err)err == nil 更安全;若只需大小且已打开文件,优先用 file.Stat() 复用句柄信息
  • 频繁 Stat 同一路径时考虑缓存(注意失效策略),避免重复系统调用

真正麻烦的是符号链接循环或权限被突然收回——这些不会抛出明确错误码,而是表现为 syscall.ELOOPsyscall.EACCES,得单独捕获处理。

text=ZqhQzanResources