【问题标题】:goroutine inside infinite for loop. Is it a good practice?无限for循环内的goroutine。这是一个好习惯吗?
【发布时间】:2021-02-13 09:09:24
【问题描述】:

所以我正在编写一段代码:

// Main
for {
    c := make(chan string)
    data := make(map[string]string)
    go doStuff(data,c)
    fmt.Println(<-c)

    time.Sleep(2*time.Second)
}

// doStuff
func doStuff(d map[string]string,ch chan string){
    defer close(ch)
    //Code to make changes to passed data
    ch <-"changes made"
}

它的作用是将一个映射和一个通道传递给一个 goroutine,在其中对映射进行一些更改,它会发送消息,在 main 中它会打印并等待另一个修改消息,然后继续在处理传递给 goroutine 的数据后,间隔 2 秒直到键盘中断或一些逻辑。

我觉得这不是有效的方法。 所以我的问题是在无限 for 循环中放置一个 goroutine 是否可以,或者有没有更有效的方法来做到这一点?

【问题讨论】:

  • 如果启动goroutine后必须马上等待goroutine的输出,那为什么还要启动goroutine呢?
  • 无限循环本身并没有错。当循环退出条件需要太多命令才能轻松放入for 条件时,我经常使用for { ... } 构造。不太合适的是在循环中创建一个只保存一个值的通道的想法。如果你的 goroutine 总是只返回一个值,那么这个返回值的存在就足以表明 goroutine 已经完成。尽可能重复使用通道,如果您想稍后发送更多数据,请不要关闭它们。显然,在您的情况下,goroutine 无论如何都是毫无意义的,仅用于教育目的
  • @DanielFarrell 谢谢,这回答了我的问题。你能写一个答案,以便我标记它是正确的吗?
  • 我很乐意。我还会添加更多支持信息,因为我会有更多空间

标签: go concurrency goroutine channels


【解决方案1】:

无限循环本身并没有错。当循环退出条件需要太多命令才能轻松放入 for 条件时,我经常使用 for { ... } 构造。

基于我的$GOPATH/src/github.com/ 目录,这显然是一个非常不完整的样本集,我看到了数百种我自己之外的此类用途。仅github.com/docker/docker 似乎就使用了 454 个这样的无限循环。

不太合适的想法是在循环中创建一个只传递一个值的通道。如果你的 goroutine 总是只返回一个值,那么这个返回值的存在就足以表明 goroutine 已经完成。尽可能重复使用通道,如果您想稍后发送更多数据,请不要关闭它们。

显然,在您的情况下,goroutine 无论如何都是毫无意义的,仅用于教育目的。但是,如果您愿意,请考虑一下:

package main

import (
  "log"
)

func doStuff(datachan <-chan map[string]string, reschan chan<- int) {
  for {
    data, ok := <-datachan
    if !ok {
      log.Print("Channel closed.")
      break
    }
    log.Printf("Data had %d length: %+v", len(data), data)
    reschan<-len(data)
  }
  return
}

const workers = 3

func main() {
  var datachan = make(chan map[string]string)
  var reschan = make(chan int)
  var inflight = 0
  var inputs = []map[string]string {
    map[string]string{ "hi": "world" },
    map[string]string{ "bye": "space", "including": "moon" },
    map[string]string{ "bye": "space", "including": "moon" },
    map[string]string{ },
    map[string]string{ },
  }
  // an inline funciton definition can change inflight within main()'s scope
  processResults := func (res int) {
    log.Printf("Main function got result %d", res)
    inflight--
  }
  // start some workers
  for i := 0; i < workers; i++{
    go doStuff(datachan, reschan)
  }
  for _, data := range inputs {
      //Select allows reading from reschan if datachan is not available for
      // writing, thus freeing up a worker to read from datachan next loop
      written := false
      for written  != true {
        select {
          case res := <-reschan:
            processResults(res)
          case datachan <- data:
            inflight++
            written = true
        }
      }
  }
  close(datachan)
  for inflight > 0 {
    processResults(<-reschan)
  }
}

输出:

2020/10/31 13:15:08 Data had 1 length: map[hi:world]
2020/10/31 13:15:08 Main function got result 1
2020/10/31 13:15:08 Data had 0 length: map[]
2020/10/31 13:15:08 Main function got result 0
2020/10/31 13:15:08 Data had 0 length: map[]
2020/10/31 13:15:08 Channel closed.
2020/10/31 13:15:08 Main function got result 0
2020/10/31 13:15:08 Data had 2 length: map[bye:space including:moon]
2020/10/31 13:15:08 Channel closed.
2020/10/31 13:15:08 Main function got result 2
2020/10/31 13:15:08 Data had 2 length: map[bye:space including:moon]
2020/10/31 13:15:08 Channel closed.
2020/10/31 13:15:08 Main function got result 2

在这里,我添加了一些结构来说明for {close(chan) 的一些更常见的用法。

我在 worker goroutines 中使用了一个潜在的无限循环,其中有 3 个(故意创建的比使用的多)。我数了数我给频道写了多少次,以确保我阅读了每一个回复。当主 goroutine 结束时,所有其他 goroutine 都会被毫不客气地杀死,所以我要确保让它们完成。计算结果是一种简单的方法。

我还演示了close(chan) 的正确用法。虽然在使用后关闭通道(例如您所做的)是不正确的,但通常没有必要这样做,因为在所有对它们的引用无论如何都消失后,打开的通道将被垃圾收集。 (https://stackoverflow.com/questions/8593645/is-it-ok-to-leave-a-channel-open#:~:text=It's%20OK%20to%20leave%20a,that%20no%20more%20data%20follows.)

close(chan) 通常用于告诉频道读者频道上没有更多可用数据了。

    data, ok := <-datachan

第二个值是一个布尔值,它将告诉我们是读取了data 还是通道实际上已关闭耗尽。所以这是确保我们已处理所有频道的接收器部分。

因为我使用select,这段代码可以处理任意长度的inputs,带有一组静态的worker。这些通道都没有缓冲 - 读者必须在阅读才能让作者写入。因此,在尝试向该阅读器发送另一个数据输入之前,我需要确保从工作人员那里收到任何结果。使用select 使这变得微不足道:无论哪个通道首先准备好,操作都会成功(如果两个通道都准备好,则随机选择一个选项 - 在这种情况下完美运行)。

for {close(chan)select,总而言之,在向 goroutine 工作布尔值发送未知数量的输入时,它们可以很好地协同工作。

最后的几点说明。在现实世界中,通常会使用https://gobyexample.com/waitgroups 而不是手动实现这一切。这个概念大体上是相同的,但它更少跟踪事物并导致更清晰的代码。我自己实现了它,所以概念很清楚。

最后,您会注意到,无法保证工作 goroutine 在程序结束之前看到关闭的通道。实际上,从技术上讲,可能不会从所有 goroutine 中记录“关闭通道”消息。但是使用inflight 计数器确保我得到了他们的结果,即使他们没有机会观察到通道的关闭。当应用程序将随着时间的推移继续运行多批工作人员时,关闭通道和退出工作人员更有意义 - 如果我们没有通知他们关闭,但后来创建了更多工作人员,这将导致内存泄漏,就像那些工作人员一样继续等待永远不会到来的输入。或者,对多批请求使用同一组工作人员并不罕见。

【讨论】:

  • 哇!该示例代码回答了我的问题。感谢您的详细回答。
猜你喜欢
  • 1970-01-01
  • 2018-11-17
  • 1970-01-01
  • 1970-01-01
  • 2010-09-11
  • 1970-01-01
  • 2013-04-09
  • 2011-07-17
  • 2022-12-13
相关资源
最近更新 更多