【问题标题】:Fast R-Cnn and problems with spatialScale in BrainScript快速 R-Cnn 和 BrainScript 中的空间尺度问题
【发布时间】:2017-10-21 15:00:24
【问题描述】:

我有以下代码:

    model (features, rois) = {

        convOut  = convLayers (features)
        roiOut   = ROIPooling (convOut, rois, (9:9),spatialScale=64.0/196.0)
        z    = fcLayers (roiOut)


    }.z

原文取自:cntk\Examples\Image\Detection\FastRCNN\BrainScript

什么是 ROIPooling 中的 spatialScale,如何计算?

如果在 cntk.exe 的输出中发现了这个。

验证 --> z.convOut.z.rn3.r.r = RectifiedLinear (z.convOut.z.rn3.r.r._) : [49 x 49 x 64 x *] -> [49 x 49 x 64 x * ]

验证 --> rois = InputValue() : -> [4 x 1000 x *]

验证 --> z.roiOut = ROIPooling (z.convOut.z.rn3.r.r, rois) : [49 x 49 x 64 x *], [4 x 1000 x *] -> [9 x 9 x 64 x 1000 x *]

【问题讨论】:

    标签: cntk


    【解决方案1】:

    空间尺度是输入到ROI的空间分辨率与输入图像到网络的空间分辨率之比。 1/16.0 是原始 Fast and Faster R-CNN 实现中使用的值,该值取决于网络。

    差不多,空间比例是 ROI 的输入相对于原始图像的比例。

    谢谢,
    埃马德

    【讨论】:

    • 所以我的例子有 64x64 的 ROI 和 196x196 的输入图像。这将给出一个 spatialScale = 64/196 = 0,32
    • ROI 节点的输入分辨率是多少,而不是 ROI 大小。
    • 好的,如果我理解正确,您要求的是 roiOut 的输入分辨率。我已经添加了我认为是问题的解决方案。
    • 对于 roi 输入而不是输出,例如假设您的网络是 y = G(x)。并且您的 roi 层如下:k = roi(l) 在 G() 内部某处,那么您的空间应该是:l.height / x.height,xl 的纵横比需要相同.
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-06-06
    • 1970-01-01
    • 2016-01-20
    • 2021-09-16
    • 2011-05-07
    • 1970-01-01
    相关资源
    最近更新 更多