摘要:
利用边缘检测和区域的像素值增强边界框的准确率,根据IOU交并比(分别与真实框进行重叠区域占联合区域的比例),证明可以比YOLOv3的预测框精确。
问题:
1.为什么精确的边界框定位可以最小化硬件成本。
答:在无人驾驶和机器人系统中,除了目标检测软件定位目标的位置外,也需要大量的硬件传感器。因为当一个人的生命掌握在技术手中时,哪怕是一毫米的精度都很重要,比如无人驾驶。所以,若目标检测软件能够捕捉精确的目标位置,可以帮助减少硬件成本和降低普通消费者和行业的总体成本。
2.YOLOv3被应用于哪些领域,有什么优势和劣势。
答:unmanned aerial vehicles(UAV,无人机),行人检测,人脸识别,无人驾驶等。YOLO在目标检测方面的实时性很高,但是绘制边界框缺乏准确性。
3. 如何通过边缘检测调整YOLOv3的预测框从而画出更精准的边界框
答:第一张图是处理预测框的框图,第二张图用实例实现了边界框的调整。
具体过程和思路为:输入一张图片->获得YOLOv3的输出->提取感兴趣的区域,即预测框->预测框转化成灰度图像并进行去噪->canny边缘提取->由于边缘不太可能出现在预测框中间,故将预测框按四个边切分上下左右四个区域,每个区域计算阈值与人为设定的阈值进行比较,根据更精确的边界所在的区域物体所占比例更大的经验进行边界框的调整。(边界越来越靠近物体,灰度化后的区域会出现白色像素点越来越多的情况,即调整后的边界框会更接近物体。)
边界框调整的算法如下:n为区域的行数,m为区域的列数,x,y用来定位像素坐标。
4.此工作的效果如何,当前工作存在什么问题吗?
答:此工作使YOLOv3输出的边界框更加精准,有利于检测精度要求高的任务,比如自动驾驶。效果如上图的小绵羊所示。但图片中存在尖锐的物体,效果会受到影响。如下图的石头,蓝框代表YOLOv3的输出,红框代表调整后的边界框。