但是我们如何拥有ground truth box呢?
您似乎对什么是训练数据以及 YOLO 的输出或预测是什么感到困惑。
训练数据是一个边界框以及类标签。这被称为“ground truth box”,b = [bx, by, bh, bw, class_name (or number)] 其中bx, by 是带注释的边界框的中点,bh, bw 是框的高度和宽度。
输出或预测是边界框b 以及图像i 的类c。
正式地:y = [ pl, bx, by, bh, bw, cn ] 其中bx, by 是带注释的边界框的中点。 bh, bw 是盒子的高度和宽度,pc - 在“盒子”b 中有类 c 的概率。
假设我在未标记的图像上使用我的 Yolo 网络(已经训练)。那我的信心是什么?
当您说您有一个预先训练的模型(您指的是已经训练过的模型)时,您的网络已经“知道”某些对象类别的边界框,它会尝试估计对象在新图像中的位置,但同时执行所以你的网络可能会在其他地方预测边界框而不是它应该是的。那么,您如何计算“其他地方”的盒子有多少?借条救命!
IOU(Intersection Over Union)的作用是,它会为您提供重叠区域超过联合区域的分数。
IOU = Area of Overlap / Area of Union
虽然它很少是完美的或 1。它有点接近,IOU 的值越小,YOLO 参考 ground truth 预测边界框就越差。
IOU 分数为 1 表示边界框在参考地面实况时被准确或非常自信地预测。