【问题标题】:Clarification in R-CNNR-CNN 中的说明
【发布时间】:2020-07-24 10:50:08
【问题描述】:

我正在学习使用 R-CNN 进行对象检测...

我有图像和注释文件,它给出了对象的边界框

我了解 R-CNN 中的这些步骤,

使用选择性搜索获取建议区域

使所有区域大小相同

在 CNN 中输入这些图像

保存特征图并馈送到 SVM 进行分类


在训练中,我将所有对象(仅来自图像的对象而不是背景)输入到 CNN,然后在 SVM 中训练特征图进行分类。

在每个博客中,都在说 R-CNN,分为三个部分, 第一选择性搜索 第二个-CNN 3rd -BBox 回归

但是,我没有得到 BBox 回归的深入解释。

我了解 IOU(Intercept over Union)来检查 BBox 的准确性。

你能帮我了解一下这个 BBox Regression 是如何用于获取对象的坐标的吗?

【问题讨论】:

  • 嗨!如果您可以让您的问题更集中于单个问题,请提供有关该单个问题的一些背景信息,提供代码和解释是什么问题以及您为解决问题所做的工作,您可能会更多地使用这个网站:)

标签: python tensorflow keras conv-neural-network


【解决方案1】:

解释如下所述的 BBox 回归工作。

就像你提到的那样,它发生在多个阶段。

  1. 选择性搜索:

    1. 生成初始子分割,我们生成许多候选或部分区域。
    2. 使用贪心算法递归地将相似区域组合成更大的区域。
    3. 使用生成的区域生成最终的候选区域建议。
  2. CNN 和 BBox 回归:

    回归器是一个具有卷积层和全连接层的 CNN,但在最后一个全连接层中,它不应用分类中通常使用的 sigmoid 或 softmax,因为这些值对应于概率。相反,这个 CNN 输出的是四个值 (?,?,ℎ,?),其中 (?,?) 指定左角位置的值,(ℎ,?) 指定窗口的高度和宽度。为了训练这个 NN,当 NN 的输出与训练集中标记的 (?,?,ℎ,?) 非常不同时,损失函数将进行惩罚。

【讨论】:

  • @vishak raj - 如果您认为我已经回答了您的问题,请点赞!
猜你喜欢
  • 2021-03-26
  • 1970-01-01
  • 1970-01-01
  • 2016-08-02
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-09-27
  • 1970-01-01
相关资源
最近更新 更多