Golang archive标准库怎么压缩文件_Golang压缩解压实战

2次阅读

文件内容为空是因为仅创建fileheader而未调用io.copy写入数据;必须显式读取源文件并写入,且需设置method、调用zw.close(),解压时须用filepath.clean校验路径防遍历漏洞。

Golang archive标准库怎么压缩文件_Golang压缩解压实战

archive/zip 创建压缩包时为什么文件内容为空?

直接用 zip.FileHeader 构造文件头但没写入数据,是空文件的最常见原因。goarchive/zip 不自动读取磁盘文件,必须显式调用 io.Copy 或手动写入。

  • 错误做法:zw.CreateHeader(&zip.FileHeader{Name: "a.txt"}) 后不写内容
  • 正确流程:先 zw.CreateHeader(),再从源文件 os.Openio.Copy(Writer, Reader)
  • 注意 FileHeader.Method 默认为 0(未压缩),设为 zip.Deflate 才真正压缩
  • 别漏掉 zw.Close(),否则末尾目录区写不全,解压会报“invalid zip header”

如何递归压缩整个目录(含子目录)?

archive/zip 本身不提供遍历能力,得靠 filepath.WalkDir(Go 1.16+)或 filepath.Walk 配合手动处理路径。

  • 遍历时用 entry.IsDir() 跳过目录本身(ZIP 中目录靠文件名结尾的 / 标识)
  • 文件路径需转为 ZIP 内部路径:用 strings.TrimPrefix(path, rootDir) 去掉前缀,再把 替换为 /
  • 对每个文件创建 zip.FileHeader 时,记得设置 ModTimeMethod,否则部分解压工具可能报时间异常或不解压
  • 示例关键片段:
    header, _ := zip.FileHeaderFromFileInfo(name, fi) header.Name = zipPath // 如 "sub/a.txt" header.Method = zip.Deflate w, _ := zw.CreateHeader(header) io.Copy(w, f)

解压时怎么避免路径遍历漏洞(如 ../../etc/passwd)?

直接用 zr.Open() 得到的 zip.FileName 是用户可控的,不做校验会导致任意文件写入。

  • 必须对每个 f.Name 调用 filepath.Clean(f.Name),再检查是否以目标解压目录开头
  • 禁止出现 ../ 开头、空名称,例如:
    cleaned := filepath.Clean(f.Name) if strings.HasPrefix(cleaned, "..") || strings.HasPrefix(cleaned, "/") || cleaned == "" {     return fmt.Errorf("unsafe file path: %s", f.Name) }
  • 写入前确保目标路径在解压根目录内:dst := filepath.Join(destDir, cleaned),再用 os.Stat(dst) 检查父目录是否仍是 destDir
  • windows 下还要额外处理 :$DATA 等 NTFS 流后缀(虽罕见,但安全场景不能忽略)

gzip 和 zip 混淆导致解压失败?

新手常把 compress/gziparchive/zip 当成同一类——前者只压缩单个流(类似 .gz),后者是容器格式(可含多文件+目录结构)。

立即学习go语言免费学习笔记(深入)”;

  • compress/gzip 压缩的文件,不能用 archive/zip 打开;反之亦然
  • 错误现象:zip: not a valid zip filegzip: invalid header
  • 确认文件类型:linux 下用 file xxx.zip,看输出是否含 “Zip archive data”
  • 如果只是想压缩单个文件且追求简单,用 compress/gzip 更轻量;需要多文件/目录结构,必须用 archive/zip

路径处理和校验逻辑最容易被跳过,尤其是解压时的 filepath.Clean 和前缀检查——线上环境一旦出问题,就是任意文件写入漏洞。压缩时的 MethodClose 也常被忽略,导致生成的 ZIP 在某些老旧解压器里打不开。

text=ZqhQzanResources