如何使用Golang benchmark测量循环性能_分析高频操作效率

16次阅读

Benchmark函数名须以Benchmark开头、参数为*testing.B;需预热构造数据、避免循环内重复分配;用-bench=. -benchmem关注ns/op和B/op,多函数对比时每次只改一个变量。

如何使用Golang benchmark测量循环性能_分析高频操作效率

go test -bench 测量循环性能,关键不是跑一次,而是让 Go 的基准测试框架自动执行足够多次、取稳定均值,并排除编译器优化干扰。

写一个合法的 Benchmark 函数

函数名必须以 Benchmark 开头,参数类型固定为 *testing.B。别在函数里直接写 for i := 0; i —— 那样测的是你写的数字,不是 Go 调度的真实开销。

正确做法是利用 b.N,它由测试框架动态设定,确保总耗时在合理范围内(通常 1 秒左右):

func BenchmarkForLoop(b *testing.B) {     for i := 0; i < b.N; i++ {         // 这里放你要测的循环体,比如:         sum := 0         for j := 0; j < 100; j++ {             sum += j         }     } }

避免编译器“偷懒”:防止死代码消除

如果循环结果没被使用,Go 编译器可能直接删掉整段逻辑,导致测出“0 ns/op”。必须让结果逃逸或显式使用:

立即学习go语言免费学习笔记(深入)”;

  • 把计算结果赋给全局变量(简单但有效)
  • blackhole 方式:调用 runtime.KeepAlive 或将结果传给空函数
  • 更常用的是:把结果赋给 b.ReportMetric 不支持的变量,再在循环外用 blackhole(sum)

示例(防优化):

var result int func BenchmarkSafeLoop(b *testing.B) {     for i := 0; i < b.N; i++ {         sum := 0         for j := 0; j < 100; j++ {             sum += j         }         result = sum // 强制保留计算     }     // 最后加一行确保 result 不被优化掉(可选)     _ = result }

对比不同循环写法的真实开销

比如想比 for i := 0; i 和 for i := n-1; i >= 0; i--,或 range vs 索引遍历切片,可以写多个 Benchmark 函数:

  • 函数名要有区分,如 BenchmarkRangeSliceBenchmarkIndexSlice
  • 每次只改一个变量(比如只换遍历方式,数据构造逻辑保持一致)
  • go test -bench=. -benchmem 同时看时间与内存分配

输出中重点关注 ns/op(每次操作纳秒数)和 B/op(每次分配字节数),小几十 ns 的差异在高频循环中会放大成明显延迟。

控制变量:预热 + 复用数据结构

如果循环依赖某个大 slice 或 map,别在每次 b.N 迭代里重新 make —— 那会把内存分配时间混进结果里。

推荐结构:

func BenchmarkMapLoop(b *testing.B) {     // 预先构造好数据(不在循环内)     m := make(map[int]int, 1000)     for i := 0; i < 1000; i++ {         m[i] = i * 2     } 
b.ResetTimer() // 重置计时器,跳过准备阶段 for i := 0; i < b.N; i++ {     sum := 0     for _, v := range m {         sum += v     }     _ = sum }

}

b.ResetTimer() 很重要:它把初始化开销剔除,只测核心循环。

text=ZqhQzanResources