【发布时间】:2021-02-23 16:57:08
【问题描述】:
对于我的下一个基于 TF2 的计算机视觉项目,我需要将图像分类为一组预定义的类。然而,不同类别的多个对象可以出现在一张这样的图像上。这听起来像是一个对象检测任务,所以我想我可以去做。
但是:我不需要知道每个对象在图像上的位置,我只需要知道图像上可见的对象类别即可。
现在我在考虑我应该走哪条路。我对解决方案的高精度/质量特别感兴趣。所以我更喜欢能带来更好结果的方法。因此,根据您的经验,即使我不需要知道检测到的对象在图像上的位置,我还是应该选择对象检测器,还是应该构建一个可以输出所有类别的图像分类器位于图像上?这甚至是一种选择,“正常”分类器可以输出多个类吗?
【问题讨论】:
-
这既不是多类也不是对象检测。这是多标签分类。如果要检测图像中的对象,则需要在其周围绘制边界框,这对您的问题完全没有必要。 Here is an example
-
是的,有可能。这就是字面意义上的多类多标签检测,你可以找到类似的问题here。
标签: tensorflow deep-learning object-detection image-classification