精确检测物体边界答案

【问题标题】：Detecting object borders PRECISELY精确检测物体边界
【发布时间】：2021-03-17 06:16:02
【问题描述】：

我需要检测照片中的物体（硬币），也就是在它周围画一个矩形。我尝试了 Mark-RCNN、Retina、Yolo、SSD - 结果相同。矩形并不完美。如果您查看在线提供的示例，您会明白我的意思：look at the image 在本文提供的一张图片中，您可以看到建议的矩形“切割”了对象，将其一部分留在外面，而在其他一些地方，在对象和矩形之间留下了太多空间。

我的问题是：如果我的训练数据准确无误，我怎样才能得到一个精确的矩形？任何微调技巧，不同的方法，链接 - 任何东西都会受到赞赏。谢谢。

【问题讨论】：

标签： neural-network object-detection conv-neural-network yolo faster-rcnn

【解决方案1】：

一种可能的方法（不用说，但这只是一种方法，不知道这是否足以解决您的特定问题）

在您的 NN 步骤之后，基本上转向经典技术作为后处理步骤。

从网络中获取硬币的大致位置。
过度裁剪边界框 - 只需将所有边界框的宽度和高度增加一个固定量，以便整个硬币可能始终位于 BB 内。显然，即使您不必裁剪，您也会遇到这样做的情况。但这可能没问题，具体取决于您的应用程序。我们的想法是始终让 BB 覆盖整个硬币，即使存在过度裁剪某些图像的风险。
从边界框创建新的更小的图像。希望这将只包含单个硬币的图像。
使用简单的颜色阈值创建可能包含硬币的像素的蒙版（或者也使用类似与硬币的 HOG 描述进行比较的方法）。由于图像已经在 NN 的帮助下进行了裁剪，因此这可能相对容易做到，并且不会有很多错误的预测。
对蒙版图像进行霍夫圆检测。

如果您以重叠的硬币和硬币杂乱的方式关闭同一图像，则此方法可能会失败。但是在霍夫圆检测的帮助下，它应该对一些杂波具有鲁棒性。您还可以在最后一步之后对圆圈进行一些过滤。

【讨论】：

所以基本上，您是在建议使用 HOG 结果作为掩码？它可能会工作，谢谢。硬币不重叠，但可以以“六边形”的方式杂乱无章......但是使用 HOG 我可能能够摆脱背景，对吗？那么一个更简单的圆形检测器可能足以区分单个硬币。我用 U-net 试过，但它提供了带孔的面具（硬币涂漆，但不完全）。也许 HOG 会做得更好。