Go 内存泄漏常见8种类型及检测方法

2次阅读

goroutine泄漏指本该退出的goroutine持续运行，导致其持有变量无法被GC回收；表现为NumGoroutine()持续上涨，pprof显示大量goroutine阻塞在channel、锁或IO等操作上。

Go 内存泄漏常见8种类型及检测方法

goroutine 不退出，它持有的所有变量（包括闭包捕获、channel 缓冲区、参数对象）就一直无法被 GC 回收。这不是“内存分配多”，而是“本该死的没死”。

常见现象：runtime.NumGoroutine() 持续上涨；pprof 的 /debug/pprof/goroutine?debug=2 显示大量阻塞在 或 select{} 的 goroutine。

把 map[string]interface{} 或 sync.Map 当成万能缓存，不设大小限制、不加过期、不淘汰，就是典型的“自我积累型泄漏”。

典型场景：HTTP 服务中用全局 map 存用户 session、API 响应结果、结构体反射字段（如 copier 的 deepFieldsMap）。

错误写法：var cache = make(map[string]string) + cache[key] = value 无任何清理逻辑
修复方向：改用带 TTL 的 LRU（如 github.com/hashicorp/golang-lru），或用 time.AfterFunc 配合 sync.Map 定时清理
关键检查点：pprof top -cum 看是否大量内存来自 runtime.makeslice 或 runtime.mapassign，再结合源码定位 map 插入点
注意：sync.Map 本身不解决容量失控问题，只是并发安全——泄漏根源在业务逻辑，不在同步机制

Go 不会自动帮你关文件、DB 连接、HTTP client transport、time.Timer，只要句柄还开着，底层资源（fd、内存缓冲区、goroutine）就一直占着。

错误示例：file, _ := os.Open("log.txt") 后没 defer file.Close()；timer := time.NewTimer(d) 用完没 timer.Stop()。

标准姿势：所有实现 io.Closer 接口的对象，都应配 defer xxx.Close()
数据库连接要特别小心：用 db.SetMaxOpenConns() + db.SetConnMaxLifetime() 防连接池膨胀；查询后记得 rows.Close()
HTTP client 泄漏高发：自定义 http.Transport 时，若没设 MaxIdleConns 和 IdleConnTimeout，空闲连接会越积越多
pprof 中识别：看 /debug/pprof/heap 是否有大量 net.Conn、os.File、time.timer 实例

pprof 不是“打开就能看到泄漏”，它是显微镜——你得知道看哪、怎么调参、怎么排除噪音。

实操建议：

先启动服务并引入：import _ "net/http/pprof" + go http.ListenAndServe("localhost:6060", nil)
采集两次快照（间隔数分钟）：go tool pprof http://localhost:6060/debug/pprof/heap，用 -inuse_space（当前占用）和 -alloc_space（累计分配）分别分析
关键命令：top -cum 看调用链顶端；list funcName 定位具体行号；web 生成调用图（需安装 graphviz）
避坑提醒：默认看的是 -inuse_space，但某些泄漏（如 goroutine 持有大 slice）在 -alloc_space 下更明显；别忽略 /debug/pprof/goroutine?debug=2 的文本堆栈
生产环境慎用：可配合 GODEBUG=gctrace=1 观察 heap_live 是否持续上涨，再决定是否开 pprof

真正难的不是发现泄漏，是区分“合理增长”和“异常滞留”——比如一个缓存命中率从 99% 降到 80%，可能不是泄漏，而是业务流量突变导致预热不足；而 runtime.mallocgc 调用次数每秒稳定上升，且 Alloc 每分钟涨 50MB 不回落，那基本可以动手查了。

发表于：web前端

近三天内

复制链接

PHP用注解标记调用服务元数据_PHP注解标记调用元数据法【标记】

VSCode中的Hex Editor：直接编辑二进制文件