R-CNN 中的说明答案

【问题标题】：Clarification in R-CNNR-CNN 中的说明
【发布时间】：2020-07-24 10:50:08
【问题描述】：

我正在学习使用 R-CNN 进行对象检测...

我有图像和注释文件，它给出了对象的边界框

我了解 R-CNN 中的这些步骤，

使用选择性搜索获取建议区域

使所有区域大小相同

在 CNN 中输入这些图像

保存特征图并馈送到 SVM 进行分类

在训练中，我将所有对象（仅来自图像的对象而不是背景）输入到 CNN，然后在 SVM 中训练特征图进行分类。

在每个博客中，都在说 R-CNN，分为三个部分，第一选择性搜索第二个-CNN 3rd -BBox 回归

但是，我没有得到 BBox 回归的深入解释。

我了解 IOU（Intercept over Union）来检查 BBox 的准确性。

你能帮我了解一下这个 BBox Regression 是如何用于获取对象的坐标的吗？

【问题讨论】：

嗨！如果您可以让您的问题更集中于单个问题，请提供有关该单个问题的一些背景信息，提供代码和解释是什么问题以及您为解决问题所做的工作，您可能会更多地使用这个网站:)

【解决方案1】：

解释如下所述的 BBox 回归工作。

就像你提到的那样，它发生在多个阶段。

选择性搜索：
1. 生成初始子分割，我们生成许多候选或部分区域。
2. 使用贪心算法递归地将相似区域组合成更大的区域。
3. 使用生成的区域生成最终的候选区域建议。
CNN 和 BBox 回归：

回归器是一个具有卷积层和全连接层的 CNN，但在最后一个全连接层中，它不应用分类中通常使用的 sigmoid 或 softmax，因为这些值对应于概率。相反，这个 CNN 输出的是四个值 (?,?,ℎ,?)，其中 (?,?) 指定左角位置的值，(ℎ,?) 指定窗口的高度和宽度。为了训练这个 NN，当 NN 的输出与训练集中标记的 (?,?,ℎ,?) 非常不同时，损失函数将进行惩罚。

【讨论】：