基准测试结果收集在testing.BenchmarkResult 类型的值中:
type BenchmarkResult struct {
N int // The number of iterations.
T time.Duration // The total time taken.
Bytes int64 // Bytes processed in one iteration.
MemAllocs uint64 // The total number of memory allocations; added in Go 1.1
MemBytes uint64 // The total number of bytes allocated; added in Go 1.1
}
BencharkResult.AllocedBytesPerOp() 和BenchmarkResult.AllocsPerOp() 返回每个操作分配的内存和分配的值。他们记录了返回值是:
AllocedBytesPerOp 返回 r.MemBytes / r.N。
AllocsPerOp 返回 r.MemAllocs / r.N。
所以结果是整数除法。这意味着如果一个基准函数在不同的调用中执行不同数量的分配,结果可能不是整数,但小数部分被丢弃(这就是整数除法的工作原理)。
因此,如果一个函数平均执行少于 1 次分配,您将看到 0 allocs/op,但如果其平均每次调用至少 1 个字节,则分配的内存可能大于 0。
我们来看一个例子:
var (
counter int
falseCond bool // Always false at runtime
)
func AvgHalfAllocs() {
counter++
if counter%2 == 0 {
return
}
buf := make([]byte, 128)
if falseCond {
fmt.Println(buf)
}
}
func AvgOneAndHalfAllocs() {
for i := 0; i < 3; i++ {
AvgHalfAllocs()
}
}
这里AvgHalfAllocs() 平均每次调用分配一半,它通过从一半调用返回而不分配任何东西来做到这一点,并在另一半调用中只进行 1 次分配。
AvgOneAndHalfAllocs() 平均每次调用执行 1.5 次分配,因为它调用了 AvgHalfAllocs() 3 次。
falseCond 变量和fmt.Println() 调用的目的只是为了让编译器不会优化我们的分配,但永远不会调用fmt.Println(),因此它不会干扰分配.
像这样对上述 2 个函数进行基准测试:
func BenchmarkAvgHalfAllocs(b *testing.B) {
for i := 0; i < b.N; i++ {
AvgHalfAllocs()
}
}
func BenchmarkAvgOneAndHalfAllocs(b *testing.B) {
for i := 0; i < b.N; i++ {
AvgOneAndHalfAllocs()
}
}
结果是:
BenchmarkAvgHalfAllocs-4 50000000 29.2 ns/op 64 B/op 0 allocs/op
BenchmarkAvgOneAndHalfAllocs-4 20000000 92.0 ns/op 192 B/op 1 allocs/op
如您所见,在 AvgHalfAllocs() 的情况下,每次调用的 0.5 个分配被截断为 0,在 AvgOneAndHalfAllocs() 的情况下,1.5 被截断为 1。
AvgHalfAllocs() 的平均分配内存为 0.5 * 128 字节 = 64 字节。
AvgOneAndHalfAllocs() 的平均分配内存为 1.5 * 128 字节 = 192 字节。