【问题标题】:concurrent memory allocation using `make`?使用`make`进行并发内存分配?
【发布时间】:2014-09-16 15:26:40
【问题描述】:

我将读取一个大的 csv 文件并返回一个结构数组。因此,我决定将大文件拆分为多个小文件,每个文件有 100 万行,并使用 go 例程并行处理它们。

在每个工人内部,我创建了一个数组来插入文件行:

for i := 0; i < 10 ; i++ {
    go func(index int) {
        lines := make([]MyStruct, 1000000)
    }(i)
}

似乎 go 例程在这条线上相互等待。因此,如果数组的内存分配需要 1 秒,那么执行此操作的 10 个并发例程将需要 10 秒,而不是 1 秒!

你能帮我理解为什么吗?如果是这样,我想我会在启动 go 例程之前分配内存并将数组的指针传递给它们中的每一个,加上它们在读取行和设置值时需要开始的元素的索引。

【问题讨论】:

  • 你在设置 GOMAXPROCS 环境变量吗?如果没有,默认情况下 Go 将只使用一个 CPU 内核。
  • @siritinga 没有改进。我设置GOMAXPROCS后,每次运行的性能都不一样。也许这表明工人正在研究不同的核心。但它仍然比分配一次内存要慢很多。
  • 对于它的价值,只是在你去的时候附加到一个大的旧切片可能比你想象的要好:测试for another question,一百万个附加到[]string需要77ms。

标签: memory-management go goroutine


【解决方案1】:

您需要设置runtime.GOMAXPROCS(runtime.NumCPU())GOMAXPROCS 环境变量,才能真正使用多核。

参考:http://golang.org/pkg/runtime/#GOMAXPROCS

引用@siritinga:

当然,你需要对线条做一些事情。

现在,它们被分配,然后被垃圾收集器丢失。

另一种方法是预先分配切片,然后将其部分传递给 goroutine,例如:

N := 1000000
lines := make([]MyStruct, N * 10)
for i := 0; i < 10 ; i++ {
    idx := i * N
    go func(lines []MyStruct) {
        //do stuff with lines
    }(lines[idx:idx+N])
}

【讨论】:

  • 当然,你需要对线条做一些事情。现在,它们被分配,然后被垃圾收集器丢失。
  • @siritinga 我很确定他只是为示例剪掉了代码。
  • 好吧,这是 StackOverflow,你永远不知道... ;)
  • @OneOfOne 试过runtime.GOMAXPROCS(runtime.NumCPU()),现在更慢了!我有一个 4 核 CPU。
  • @ssi:向我们展示更多代码。您基本上是在测试内存分配器,可能还有 GC。如果 MyStruct 很大,这可能与您的机器将 0 写入内存以一次分配一百万个 MyStruct 一样快。
猜你喜欢
  • 2012-03-08
  • 2020-11-12
  • 1970-01-01
  • 2016-11-24
  • 2016-04-10
  • 1970-01-01
  • 2021-05-18
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多