(以下内容记录于一年前)
因为Yolo系列的论文假设你已经读过前面的论文,所以你如果直接阅读v2和v3的论文,实际上是挺难懂的。前面的Yolov1与Yolov2都是为了Yolov3的记录做铺垫。
以下内容来自作者关于yolov3的论文及个人理解
Yolov3相比于Yolov2除了网络结构之外修改了一些小细节,包括以下:
Bounding Box Prediction:
可以看到关于bounding box的位置大小的相关计算相比于yolov2并没有变化,yolov3给每个bounding box添加了一个包含物体分数,objectness score。同时每个bound ing box会有自己的class scores。yolov1与yolov2是每个bounding box共用class scores。
Prediction Across Scales:
Yolov3 将原图像分为三个不同大小的grid
Feature Extractor:
Yolov3 使用的网络结构是darknet-53,相比于yolov1和yolov2使用的网络结构darknet-53无疑是巨大的。它有53个卷积层
个人网站: WaveDeng-Make Some Waves