对约洛感到困惑答案

【问题标题】：Confused about Yolo对约洛感到困惑
【发布时间】：2018-10-13 16:58:25
【问题描述】：

我对 Yolo 的工作方式有点困惑。在论文中，他们说：

"置信度预测代表了预测框和任何地面实况框。”

但是我们如何拥有基本事实框呢？假设我在未标记的图像上使用我的 Yolo 网络（已经训练过）。那我有什么信心呢？

对不起，如果问题很简单，但我真的不明白这部分...... 谢谢！

【问题讨论】：

简单很重要，喜欢这个问题。

标签： deep-learning object-recognition yolo

【解决方案1】：

YOLO 使用 IOU 来衡量训练的权重。当你搜索 IOU 是什么时，它是这样的。

所以在训练这个 IoU 分数时计算验证数据的预测。这意味着

(Prediction of object)*IoU score

希望对你有帮助。

【讨论】：

但这两个盒子是什么？一个是预测，另一个是基本事实。据我了解，即使在推理模式下，每次都会计算此值。因此，即使我在没有标签的图像上使用我的网络，它也给了我信心。但是第二个盒子是什么？如果我没有任何标签，那么基本事实是什么？

【解决方案2】：

但是我们如何拥有ground truth box呢？

您似乎对什么是训练数据以及 YOLO 的输出或预测是什么感到困惑。

训练数据是一个边界框以及类标签。这被称为“ground truth box”，b = [bx, by, bh, bw, class_name (or number)] 其中bx, by 是带注释的边界框的中点，bh, bw 是框的高度和宽度。

输出或预测是边界框b 以及图像i 的类c。正式地：y = [ pl, bx, by, bh, bw, cn ] 其中bx, by 是带注释的边界框的中点。 bh, bw 是盒子的高度和宽度，pc - 在“盒子”b 中有类 c 的概率。

假设我在未标记的图像上使用我的 Yolo 网络（已经训练）。那我的信心是什么？

当您说您有一个预先训练的模型（您指的是已经训练过的模型）时，您的网络已经“知道”某些对象类别的边界框，它会尝试估计对象在新图像中的位置，但同时执行所以你的网络可能会在其他地方预测边界框而不是它应该是的。那么，您如何计算“其他地方”的盒子有多少？借条救命！ IOU（Intersection Over Union）的作用是，它会为您提供重叠区域超过联合区域的分数。

IOU = Area of Overlap / Area of Union

虽然它很少是完美的或 1。它有点接近，IOU 的值越小，YOLO 参考 ground truth 预测边界框就越差。 IOU 分数为 1 表示边界框在参考地面实况时被准确或非常自信地预测。

【讨论】：

【解决方案3】：

我认为您所需要的只是一张能阐明基本事实的好图片。

正如您在左侧看到的，完美包围对象的矩形是基本事实（蓝色的）。

橙色矩形是预测的矩形。 IoU 是您可以从图像右侧直观地理解的内容。

希望这会有所帮助。

【讨论】：