Go 内存管理与 GC：从逃逸分析到三色标记

Go 的自动内存管理并不是“程序员完全不用关心内存”。更准确地说，Go runtime 接管了对象生命周期判断和堆内存回收，程序员仍然需要理解对象何时逃逸、哪些分配会给 GC 制造压力，以及写屏障为什么会影响吞吐。

手动内存管理的问题

C/C++ 这类语言把内存释放责任交给程序员，灵活性很高，但错误也很隐蔽。最典型的问题有两个：

悬空指针：内存已经释放，但还有指针指向原来的地址。
内存泄漏：对象已经不再需要，但程序没有释放它。

例如：

int main() {
    char *p = (char *)malloc(100);
    strcpy(p, "hello");
    free(p);
    if (p != NULL) {
        strcpy(p, "world");
    }
}

free(p) 释放的是 p 指向的内存，不会自动把 p 置空。因此 p != NULL 不能证明这块内存仍然可用。这个例子说明：手动内存管理的问题不只是“忘记释放”，还包括释放时机和所有权边界很难在局部代码中判断。

Go 的内存分配路径

Go 程序中的对象通常先由编译器决定放在栈上还是堆上。能被证明只在当前函数内使用的对象优先放在栈上；生命周期可能超过当前栈帧，或者大小/类型在编译期难以确定的对象会逃逸到堆上。

可以用下面命令观察逃逸分析：

go build -gcflags='-m=2' ./...

常见逃逸场景包括：

返回局部变量指针。
把具体类型装进 interface{} 后跨函数传递。
闭包捕获外部变量，且闭包生命周期不明确。
切片、map、channel 等引用类型扩容或被长期持有。
对象太大，编译器不愿意放在栈上。

逃逸本身不是 bug。问题在于高频路径上的堆分配会增加 GC 扫描和回收压力。

Go 堆分配的粗略结构

Go runtime 的堆分配器采用分层缓存思路。简单理解：

每个 P 持有本地的 mcache，小对象优先从本地缓存分配，避免频繁加全局锁。
mcache 不够时向 mcentral 申请 span。
mcentral 不够时再向 mheap 申请更大的内存块。
小对象按 size class 分配，大对象会直接走更靠近 mheap 的路径。

这种设计的目的很直接：绝大多数小对象分配都应该足够快，尽量不要因为内存分配让 goroutine 频繁竞争全局结构。

为什么 Go 使用并发标记清除

引用计数的优点是回收及时，缺点是每次引用变化都要维护计数，并且天然处理不了循环引用。复制算法适合年轻代对象回收，但 Go 长期没有采用传统分代 GC。Go 当前主线思路是并发三色标记清除，并用写屏障维持并发标记期间的正确性。

三色标记把对象分成三类：

白色：尚未确认可达。标记结束后仍为白色的对象可以回收。
灰色：对象本身已确认可达，但它引用的对象还没扫描完。
黑色：对象已确认可达，并且它引用的对象也已经处理过。

标记过程从根对象开始。根对象包括全局变量、各 goroutine 栈、寄存器中可见的指针等。GC 从根对象出发，把可达对象染灰，再逐步扫描灰色对象，把它引用的对象继续染灰，最后灰色对象变黑。当灰色队列为空时，仍然白色的对象就是不可达对象。

写屏障解决什么问题

并发 GC 的麻烦在于：GC 线程在标记对象时，用户 goroutine 仍在修改指针关系。如果没有额外约束，可能出现黑色对象指向白色对象，而 GC 又永远不会再扫描这个黑色对象，最终把仍然可达的白色对象误回收。

写屏障就是在指针写入时插入的一段 runtime 逻辑，用来维护三色不变式。它会让并发标记期间的指针变更被 GC 看见，避免“用户代码刚建立引用，GC 却以为对象不可达”的情况。

写屏障不是免费的。它会增加指针写入的成本，所以 Go GC 会在一个很短的 STW 阶段打开写屏障，并在标记结束后关闭它。

一次 GC 周期

可以把 Go 的一次 GC 周期粗略拆成以下阶段：

Mark setup：短暂停顿，开启写屏障，准备标记任务。
Concurrent mark：并发扫描根对象和堆对象，大部分工作与用户 goroutine 同时进行。
Mark assist：当程序分配太快时，分配者需要帮助 GC 做一部分标记工作，避免堆增长失控。
Mark termination：短暂停顿，确认标记完成，关闭写屏障。
Sweep：清扫未标记对象，把空闲 span 归还给分配器。

Go GC 的优化目标不是“完全没有停顿”，而是把 STW 控制在较短范围内，并通过并发标记换取较稳定的延迟表现。

GC 触发条件与 GOGC

Go 主要通过堆增长比例触发 GC。GOGC 控制下一次 GC 的目标堆大小，默认值是 100，含义可以近似理解为：当新分配对象让堆大小相对上次存活堆翻倍时，触发下一轮 GC。

如果 GOGC 调小，GC 更频繁，内存占用更低，但 CPU 消耗更高；如果 GOGC 调大，GC 更少，吞吐可能更好，但峰值内存更高。线上服务需要结合延迟、吞吐和内存预算来调。

Go 1.19 之后还可以用 GOMEMLIMIT 给 runtime 一个软内存上限。相比只调 GOGC，GOMEMLIMIT 更适合容器环境，因为容器里真正危险的是触碰 cgroup limit 后被 OOM kill。

怎么降低 GC 压力

优化 GC 不应该从“关闭 GC”开始，而应该先定位分配来源：

go test -bench=. -benchmem ./...
go tool pprof -alloc_space http://host/debug/pprof/heap
go tool pprof -inuse_space http://host/debug/pprof/heap

常见有效手段包括：

减少临时对象：热点路径上避免无意义的字符串拼接、切片扩容和装箱。
预分配容量：对已知规模的 slice/map 使用 make([]T, 0, n) 或 make(map[K]V, n)。
控制指针数量：指针越多，GC 扫描成本越高。能用值类型表达的数据，不必都拆成指针对象。
复用缓冲区：例如 bytes.Buffer、sync.Pool，但要避免把 sync.Pool 当作普通缓存。
避免大对象频繁分配：大对象分配和回收更容易影响堆增长曲线。

小结

Go 的自动内存管理由编译器逃逸分析、runtime 分配器和并发 GC 共同完成。逃逸分析决定对象更可能在栈上还是堆上；分配器负责让常见小对象分配足够快；GC 负责在低停顿目标下回收不可达对象。理解这些机制之后，再看线上内存问题就不只是看 heap inuse，而是能追问：对象为什么逃逸、是谁在分配、GC 为什么被迫频繁运行，以及调 GOGC/GOMEMLIMIT 是否真的解决了根因。

Go语言

#内存管理 #Go runtime

Go 内存管理与 GC：从逃逸分析到三色标记

https://xiao-nanbei.github.io/2021/12/16/Go-Memory-Management-and-GC/

作者

Xuan Tan

发布于

2021年12月16日

许可协议

Go Goroutine 与 GMP 调度器上一篇

浮点数精度丢失：IEEE 754、舍入误差与工程实践下一篇