计算机视觉之目标检测入门1

基础知识

1. 1*1卷积

增加非线性
1*1卷积相当于全连接层的计算，并引入非线性**函数，增加了模型的非线性，提高了网络模型表达更复杂特征的能力。
特征降维
通过卷积核的数量可以实现特征通道的缩放，可以有效减小模型参数和计算量。

2. 空洞卷积
空洞卷积又称扩张卷积，是在原有的卷积核基础引入扩张率（dilation rate），定义了卷积核处理数据之间的间距，增加了卷积核的感受野。
空洞卷积的特点：
在相同感受野下，空洞卷积可以得到更大的特征图，可以获得更加密集的数据。
在相同感受野下，空洞卷积更加有利于目标检测和分割任务中小目标的识别检测效果。

3. 转置卷积
转置卷积又称反卷积、分数步长卷积，为一种上采样的方式，可以将小图片变成大图片。

4. 全卷积神经网络
全卷积神经网络可以使得网络模型可以输入任意大小的图片
计算机视觉之目标检测入门1
全卷积神经网络相当于可以只做一次卷积就可以完成滑动窗口的功能，克服了滑动窗口在图片上滑动然后再进行识别所需计算量较大的缺陷。

目标检测

1. 传统目标检测方法

滑动窗口法+传统机器学习分类器
当需要检测的对象大小不同时，需要采用不同大小的窗口。

特点：
1）识别效果不好，准确率不高
2）计算量大，运行速度慢
3）可能出现多个正确识别的结果

2. 滑动窗口法+卷积神经网络
卷积神经网络可以提升识别的准确率。

评价目标检测结果的指标

1. 交并比IoU（intersection-over-union）
计算机视觉之目标检测入门1
2. mAP(mean average precision)平均准确率
多标签图像分类任务中的图片的标签不止一个，评价时不能以单标签图像分类的标准。

两种计算mAP的方法：

AP衡量的是模型在每个类别上的好坏，mAP衡量的是模型在所有类别上的好坏。

目标检测中使用的技术

1. 非极大值抑制（Non-max supression）

选出置信度对稿的候选框，如果当前最高分的候选框重叠面积IoU大于一定的阈值，就将其删除。
当存在多个预测目标时，先选置信度最大的候选框，根据IoU删除周围的候选框，在选取置信度第二大的候选框，去除其周围的候选框。