YOLO 的输出是如何编码的

【问题标题】：How is output encoded for YOLOYOLO 的输出是如何编码的
【发布时间】：2019-06-09 17:38:00
【问题描述】：

如果网格中的多个框具有相同的对象，比如说汽车，那么对于所有具有汽车的框，bx、by、bh, bw 是一样的吗？这里 bx, by 是汽车的中心像素，bh, bw 是边界框的高度和宽度。

【问题讨论】：

【解决方案1】：

我也有同样的困惑。让我给你一个直觉，它是如何处理这个问题的。

在yolo中，我们有三个重要的参数IOU、class-confidence-score和box-confidence-score，它们决定了哪个网格在所有方面都具有更高的概率，并修剪其他概率较低的网格。

所以，即使有许多网格具有相同的边界框尺寸，但网格单元中对象的概率是变化的，这会改变框置信度分数对于网格，计算为pr(object).IOU。这样，yolo 就可以移除那些网格了。

这里是link，对yolo的解释已经滞留。

【讨论】：