【发布时间】:2019-05-20 04:31:53
【问题描述】:
我想问一个关于基于 DNN 的对象检测算法(例如 Yolo、SSD 或 R-CNN)的一般性问题。
假设我想在小图像上检测手机,因此,移动设备本身非常小,而且,仅通过查看它们出现的像素几乎不可能检测到它们。例如,查看 300x300 的图像,手机显示在 7x5 的网格上,因此只有查看 7x5 的图片,没有人可以确定那里可以看到什么。
另一方面,如果我们在图片上看到地铁车厢,其中一个人手里拿着黑色的东西,我们(人类)几乎可以肯定这个黑色的 7x5 小网格代表移动设备.
我的理解是否正确,当前最先进的 DNN 算法无法像人类那样捕捉环境,而只能通过图像上的物理外观来检测物体?如果不是,您能否建议一种算法,该算法不一定只在黑色像素组上学习,但能够捕捉到一个人手里拿着一个可能是电话的黑色物体?
谢谢。
【问题讨论】:
标签: neural-network deep-learning computer-vision conv-neural-network object-detection