【问题标题】:Golang for-select blows up CPUGolang for-select 炸毁 CPU
【发布时间】:2019-08-29 20:56:07
【问题描述】:

我有一个 grpc 基准测试代码,它使用一个函数使用 for-select 子句将数百个 goroutine 通道合并到一个通道。代码是这样的

     func (b *B) merge(
          ctx context.Context,
          nodes ...<-chan *pb.Node,
        ) chan *pb.Node {
    allNodes := make(chan *pb.Node)
    var wg sync.WaitGroup
    wg.Add(len(nodes))
    for _, n := range nodes {
        go func(n <-chan *pb.Node) {
            defer wg.Done()
            for {
                select {
                case <-ctx.Done():
                    return
                case val, ok := <-n:
                    if ok {
                        allNodes <- val
                    }
                }
            }
        }(n)
    }
    go func() {
        wg.Wait()
        close(allNodes)
    }()
    return allNodes
}

当我在 ubuntu 16.04 中通过 top 命令监控代码时,我看到 2 核服务器疯狂旋转,超过 196% 的 cpu 使用率。

然后我使用 pprof 包分析我的代码,它说我的 98% 的 cpu 都在旋转这个函数,并且顶部函数生成这样的结果

    flat  flat%   sum%        cum   cum%
   1640ms  5.78%  5.78%    27700ms 97.60%  B (*B).merge.func1
    5560ms 19.59% 25.37%    22130ms 77.98%  runtime.selectgo
     770ms  2.71% 28.08%    11190ms 39.43%  runtime.sellock
    2700ms  9.51% 37.60%    10430ms 36.75%  runtime.lock
    7710ms 27.17% 64.76%     7710ms 27.17%  runtime.procyield
     460ms  1.62% 66.38%     3850ms 13.57%  context.(*cancelCtx).Done
    1210ms  4.26% 70.65%     3350ms 11.80%  runtime.selunlock
    2700ms  9.51% 80.16%     2900ms 10.22%  sync.(*Mutex).Lock
    2110ms  7.43% 87.60%     2140ms  7.54%  runtime.unlock
     360ms  1.27% 88.87%      860ms  3.03%  runtime.typedmemclr

任何人都可以就如何编写正确的代码来合并大量通道给我一些建议,似乎这个 for-select 块只会让 cpu 变得疯狂,而在它后面使用 procyield 这不是一个很有前途的机制?

有没有办法控制进程的cpu使用?

【问题讨论】:

    标签: linux multithreading go ubuntu-16.04 goroutine


    【解决方案1】:

    在取消上下文之前,nodes 参数中传递的通道似乎很可能正在关闭。这会将您的 for 循环变成一个紧密循环,这将消耗所有可用的 CPU。由于通道一旦关闭就无法重新打开,您可以在 ok 为 false 时安全地从 goroutine 返回,这应该可以解决该问题:

        go func(n <-chan *pb.Node) {
            defer wg.Done()
            for {
                select {
                case <-ctx.Done():
                    return
                case val, ok := <-n:
                    if !ok {
                        return
                    }
                    allNodes <- val
                }
            }
        }(n)
    

    【讨论】:

    • 是的,这是一个服务器故障问题。
    • @Souad 我不确定你的意思。这是一道 Go 编程题。
    【解决方案2】:

    关闭的 chan 不会阻塞 - 请参阅 https://dave.cheney.net/2013/04/30/curious-channels

    关闭后将 chan 设置为 nil。

      case val, ok := <-n:
        if ok {
          allNodes <- val
        } else {
          n = nil
        }
    

    那么select会阻塞,只等待done消息。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-05-08
      • 1970-01-01
      • 2017-06-18
      • 2021-07-21
      • 1970-01-01
      • 1970-01-01
      • 2018-06-18
      • 2011-05-30
      相关资源
      最近更新 更多