【问题标题】:How is output encoded for YOLOYOLO 的输出是如何编码的
【发布时间】:2019-06-09 17:38:00
【问题描述】:

如果网格中的多个框具有相同的对象,比如说汽车,那么对于所有具有汽车的框,bxbybh, bw 是一样的吗?这里 bx, by 是汽车的中心像素,bh, bw 是边界框的高度和宽度。

【问题讨论】:

    标签: conv-neural-network yolo


    【解决方案1】:

    我也有同样的困惑。让我给你一个直觉,它是如何处理这个问题的。

    在yolo中,我们有三个重要的参数IOUclass-confidence-scorebox-confidence-score,它们决定了哪个网格在所有方面都具有更高的概率,并修剪其他概率较低的网格。

    所以,即使有许多网格具有相同的边界框尺寸,但网格单元中对象的概率是变化的,这会改变框置信度分数对于网格,计算为pr(object).IOU。这样,yolo 就可以移除那些网格了。

    这里是link,对yolo的解释已经滞留。

    【讨论】:

      猜你喜欢
      • 2021-01-21
      • 2021-11-20
      • 2020-11-24
      • 2011-09-13
      • 1970-01-01
      • 2010-10-05
      • 2019-06-28
      • 2015-03-15
      • 2020-11-29
      相关资源
      最近更新 更多