【问题标题】:What is the purpose of the scales factor in Faster Rcnn Box Coder?Faster Rcnn Box Coder 中比例因子的用途是什么?
【发布时间】:2020-01-21 10:18:44
【问题描述】:

我正在使用对象检测 API 并调整 SSD 任务的参数。我的问题是指https://github.com/tensorflow/models/blob/master/research/object_detection/box_coders/faster_rcnn_box_coder.py 的盒子编码器。 为什么将这些比例因子设置为 [10,10,5,5]?原论文没有解释。我怀疑它必须为位置误差的 4 个分量(tx、ty、tw、th)分配不同的权重,或者存在一些数值稳定性问题,但我想确认一下。谢谢

【问题讨论】:

    标签: tensorflow deep-learning conv-neural-network object-detection


    【解决方案1】:

    我在这里找到答案https://leimao.github.io/blog/Bounding-Box-Encoding-Decoding/,其中变量被用作某种带有方差的表示编码。这个问题也是本期的主题https://github.com/rykov8/ssd_keras/issues/53

    【讨论】:

      【解决方案2】:

      网络预测每个锚框的变化。也就是说,对于每个锚块,它会预测 x、y 位置和宽度、高度的偏移量。

      可以找到这些参数的简短描述,例如链接: https://medium.com/@smallfishbigsea/understand-ssd-and-implement-your-own-caa3232cd6ad https://lambdalabs.com/blog/how-to-implement-ssd-object-detection-in-tensorflow/

      【讨论】:

      • 谢谢,但我认为您的回答无效。 FRCNN的原始论文在这里arxiv.org/pdf/1506.01497.pdf,你可以看到这个比例值[10 10 5 5]没有任何痕迹。代码中的注释说“scale_factors:4 个正标量的列表,用于缩放 ty、tx、th 和 tw。对于 Faster RCNN,开源实现建议使用 [10.0, 10.0, 5.0, 5.0]。[...]缩放位置目标,如论文中用于联合训练"
      猜你喜欢
      • 1970-01-01
      • 2020-12-24
      • 1970-01-01
      • 2018-06-14
      • 1970-01-01
      • 1970-01-01
      • 2020-06-17
      • 2016-09-26
      • 1970-01-01
      相关资源
      最近更新 更多