【发布时间】:2020-10-07 00:41:00
【问题描述】:
我使用 OD-API 来训练模型。关于处理背景图像和具有两次(或更多)不同标签名称的相同对象的图像的处理方式,以及使用faster_rcnn_resnet101 和SSD_mobilenet_v2 时,我有两个问题。
1- 当图像没有地面实况框(背景图像)时,即使我们没有 GT 框,我们是否会在使用 fRCNN(或 SSD 的默认框)的情况下为它们生成 Anchor 框?或者这种情况下的整个图像将是一个反例?
2- 当图像有两个(或更多)具有相同坐标但标签名称不同的 GT 框时,与锚框(或 SSD 的默认框)匹配时是否会出现问题?好像这里只有一个 GT 盒子会匹配?
我会很高兴得到任何帮助,我尝试阅读论文、教程和书籍,但找不到答案,或者我可能遗漏了一些东西。 关于问题2,Andrew Ng教授在这篇video关于YOLO中的Anchor Boxes的6:55说,这种情况,当我们在同一个网格单元中有多个对象时,这些情况不能很好地处理。所以也许这同样适用于我的案件,即使我不知道我的案件会发生什么。 另外我认为target_assigner.py和argmax_matcher.py这些文件有一些线索,但我也无法确定。
提前谢谢你
【问题讨论】:
标签: python tensorflow object-detection