【问题标题】:How to implement Memory Pooling in Golang如何在 Golang 中实现内存池
【发布时间】:2016-11-25 03:22:21
【问题描述】:

我在 Go 中实现了一个 HTTP 服务器。

对于每个请求,我需要为特定结构创建数百个对象,我有大约 10 个这样的结构。因此,在按照 Go 实现完成请求后,它将被垃圾收集。

因此对于每个请求,都会分配和释放这么多内存。

相反,我想实现内存池以提高分配端和 GC 端的性能

在请求开始时,我将从池中取出并在请求处理后将它们放回

从池实现端

  1. 如何分配和释放特定类型结构的内存?
  2. 如何跟踪此内存已分配而其他未分配的信息?

在内存分配和释放的情况下,还有其他提高性能的建议吗?

【问题讨论】:

标签: memory-management go


【解决方案1】:

事先说明:

许多人建议使用sync.Pool,这是一种快速、良好的临时对象实现。但请注意,sync.Pool 不保证保留池中的对象。引用其文档:

存储在池中的任何项目可能会随时自动删除,恕不另行通知。如果在发生这种情况时 Pool 持有唯一的引用,则该项目可能会被释放。

因此,如果您不希望 Pool 中的对象被垃圾收集(这取决于您的情况可能会导致更多分配),下面介绍的解决方案会更好,因为通道缓冲区中的值不是垃圾集。如果你的对象真的那么大,那么内存池是合理的,池通道的开销将被摊销。

此外,sync.Pool 不允许您限制池对象的数量,而下面提出的解决方案自然可以。


最简单的内存池“实现”是缓冲通道。

假设您想要一个包含一些大对象的内存池。创建一个缓冲通道,保存指向此类昂贵对象的值的指针,并在需要时从池(通道)中接收一个。使用完毕后,将其放回池中(在频道上发送)。为避免意外丢失对象(例如在发生紧急情况时),请在放回对象时使用 defer 语句。

让我们使用它作为我们的大对象的类型:

type BigObject struct {
    Id        int
    Something string
}

创建一个池是:

pool := make(chan *BigObject, 10)

池的大小就是通道缓冲区的大小。

用昂贵对象的指针填充池(这是可选的,请参阅末尾的注释):

for i := 0; i < cap(pool); i++ {
    bo := &BigObject{Id: i}
    pool <- bo
}

许多 goroutine 使用池:

wg := sync.WaitGroup{}
for i := 0; i < 100; i++ {
    wg.Add(1)
    go func() {
        defer wg.Done()
        bo := <-pool
        defer func() { pool <- bo }()
        fmt.Println("Using", bo.Id)
        fmt.Println("Releasing", bo.Id)
    }()
}

wg.Wait()

Go Playground 上试试。

请注意,如果所有“池化”对象都在使用中,则此实现会阻塞。如果你不想这样,你可以使用select 来强制创建新对象(如果所有对象都在使用中):

var bo *BigObject
select {
case bo = <-pool: // Try to get one from the pool
default: // All in use, create a new, temporary:
    bo = &BigObject{Id:-1}
}

在这种情况下,您无需将其放回池中。或者,如果池中有空间,您可以选择尝试将所有内容放回池中,而不会阻塞,再次使用select

select {
case pool <- bo: // Try to put back into the pool
default: // Pool is full, will be garbage collected
}

注意事项:

事先填充池是可选的。如果您使用select 尝试从池中获取/放回值,则池最初可能是空的。

您必须确保不会在请求之间泄露信息,例如确保您不在共享对象中使用已设置且属于其他请求的字段和值。

【讨论】:

  • 注意这个方法比sync.Pool慢很多。
  • @OneOfOne 是,但sync.Pool 不保证保留合并值。请参阅编辑后的答案。
  • Golang 中的 GC 运行频率如何?它取决于哪些因素?
  • @Raghu GC 是一个巨大的话题。您可以查看runtime 的包文档,其中详细说明了控制 GC 的环境变量。另请阅读博文:Go GC: Prioritizing low latency and simplicity
  • 另外,sync.Pool 不提供任何形式的绑定,比如我只想汇集 5 个资源并在不同的 goroutine 中使用它们。在所有实例中调用 .Get() 意味着它将继续创建同一对象的新实例。
【解决方案2】:

这是@JimB 提到的sync.Pool 实现。注意使用defer 将对象返回到池中。

package main

import "sync"

type Something struct {
    Name string
}

var pool = sync.Pool{
    New: func() interface{} {
        return &Something{}
    },
}

func main() {
    s := pool.Get().(*Something)
    defer pool.Put(s)
    s.Name = "hello"
    // use the object
}

【讨论】:

  • 这不会限制对象实例的创建。
猜你喜欢
  • 2014-05-09
  • 1970-01-01
  • 2011-10-27
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多