【问题标题】:Detecting object borders PRECISELY精确检测物体边界
【发布时间】:2021-03-17 06:16:02
【问题描述】:

我需要检测照片中的物体(硬币),也就是在它周围画一个矩形。 我尝试了 Mark-RCNN、Retina、Yolo、SSD - 结果相同。矩形并不完美。 如果您查看在线提供的示例,您会明白我的意思:look at the image 在本文提供的一张图片中,您可以看到建议的矩形“切割”了对象,将其一部分留在外面,而在其他一些地方,在对象和矩形之间留下了太多空间。

我的问题是:如果我的训练数据准确无误,我怎样才能得到一个精确的矩形?任何微调技巧,不同的方法,链接 - 任何东西都会受到赞赏。 谢谢。

【问题讨论】:

    标签: neural-network object-detection conv-neural-network yolo faster-rcnn


    【解决方案1】:

    一种可能的方法(不用说,但这只是一种方法,不知道这是否足以解决您的特定问题)

    在您的 NN 步骤之后,基本上转向经典技术作为后处理步骤。

    • 从网络中获取硬币的大致位置。
    • 过度裁剪边界框 - 只需将所有边界框的宽度和高度增加一个固定量,以便整个硬币可能始终位于 BB 内。显然,即使您不必裁剪,您也会遇到这样做的情况。但这可能没问题,具体取决于您的应用程序。我们的想法是始终让 BB 覆盖整个硬币,即使存在过度裁剪某些图像的风险。
    • 从边界框创建新的更小的图像。希望这将只包含单个硬币的图像。
    • 使用简单的颜色阈值创建可能包含硬币的像素的蒙版(或者也使用类似与硬币的 HOG 描述进行比较的方法)。由于图像已经在 NN 的帮助下进行了裁剪,因此这可能相对容易做到,并且不会有很多错误的预测。
    • 对蒙版图像进行霍夫圆检测。

    如果您以重叠的硬币和硬币杂乱的方式关闭同一图像,则此方法可能会失败。但是在霍夫圆检测的帮助下,它应该对一些杂波具有鲁棒性。您还可以在最后一步之后对圆圈进行一些过滤。

    【讨论】:

    • 所以基本上,您是在建议使用 HOG 结果作为掩码?它可能会工作,谢谢。硬币不重叠,但可以以“六边形”的方式杂乱无章......但是使用 HOG 我可能能够摆脱背景,对吗?那么一个更简单的圆形检测器可能足以区分单个硬币。我用 U-net 试过,但它提供了带孔的面具(硬币涂漆,但不完全)。也许 HOG 会做得更好。
    猜你喜欢
    • 2019-06-23
    • 2013-02-05
    • 1970-01-01
    • 2018-06-03
    • 2022-01-05
    • 2017-11-16
    • 2013-05-25
    • 1970-01-01
    相关资源
    最近更新 更多