如何用Golang实现多线程下载器_Golang并发编程与性能优化项目

1次阅读

go 的 net/http 不支持断点续传或多段并发下载，需手动实现：先 HEAD 获取 Content-Length，再按并发数均分 Range；用 WriteAt 预分配文件空间后并发写入；通过带缓冲 channel 控制 goroutine 数量。

Go 的 net/http 本身不支持断点续传或多段并发下载，必须自己拆分 Range、管理连接、合并文件——这不是加几个 go 关键字就能跑起来的事。

直接按字节均分容易出错：服务端可能不支持 Range（返回 200 而非 206），或实际文件大小在请求过程中变化。必须先发一次 HEAD 获取 Content-Length，再根据目标并发数（如 4）计算每段起始偏移：

用 http.Head() 拿到 Content-Length，若返回非 200 或无该 header，降级为单线程下载
每段长度 = totalSize / goroutineCount，最后一段包含余数；避免某段为 0 字节
每个 http.Request 必须显式设置 Header.Set("Range", "bytes=0-1048575")，且检查响应状态码是否为 206 Partial Content

多个 goroutine 并发写同一个 *os.File 会导致数据错乱——WriteAt 才是安全的，但前提是文件已预分配空间（否则写入时扩展文件会引发竞态）：

先用 os.Truncate() 或 os.WriteAt() 配合 bytes.Repeat([]byte{0}, totalSize) 初始化空文件
每个 goroutine 拿到自己的 start 偏移后，用 file.WriteAt(buf, int64(start)) 写入，不依赖当前文件偏移
切忌用 file.Seek() + file.Write()，Seek 是共享状态，无法保证原子性

盲目启动 100 个 goroutine 不仅不会提速，反而触发服务端限流或本地 fd 耗尽。要用带缓冲的 channel 控制活跃 worker 数量：

很多教程漏掉这些，结果在生产环境跑半天才发现问题：

HTTP/2 连接复用会让多个 Range 请求串行化，强制用 &http.Transport{ForceAttemptHTTP2: false} 切回 HTTP/1.1
某些 CDN（如 Cloudflare）对高频 Range 请求返回 429，得加随机 delay（如 time.Sleep(time.Millisecond * time.Duration(rand.Intn(100)))）
下载大文件时，response.Body 必须用 io.LimitReader 包裹，防止恶意服务端返回远超 Content-Range 声明的字节导致内存爆满

发表于：后端开发

近两天内

复制链接

c++如何计算正弦余弦值_c++ math库常用函数【入门】

如何正确将 ES6 类转换为传统函数构造器以保持原型链与方法可用性