《吴恩达深度学习》04卷积神经网络（第1周卷积神经网络）

04. 卷积神经网络

计算机视觉问题
（1）图像分类
（2）目标检测
（3）风格迁移
大规模图片上的深度学习
（1）以往的图片往往大小是 $64\times 64 \times 3$ 的，即总特征数为12288。
（2）若图片大小增加到 $1000 \times 1000 \times 3$ ，则总特征数增加到3百万。

计算机视觉问题
（1）人脸检测距离
垂直边缘检测
$\left[\begin{matrix} 3 & 0 & 1 & 2 & 7 & 4 \\ 1 & 5 & 8 & 9 & 3 & 1 \\ 2 & 7 & 2 & 5 & 1 & 3 \\ 0 & 1 & 3 & 1 & 7 & 8 \\ 4 & 2 & 1 & 6 & 2 & 8 \\ 2 & 4 & 5 & 2 & 3 & 9 \end{matrix}\right] * \left[\begin{matrix} 1 & 0 & -1\\ 1 & 0 & -1\\ 1 & 0 & -1 \end{matrix}\right] = \left[\begin{matrix} -5 & -4 & 0 & 8 \\ -10 & -2 & 2 & 3 \\ 0 & -2 & -4 & -7 \\ -3 & -2 & -3 & -16 \end{matrix} \right]$
编程实现
（1）python：conv_forward
（2）tensorflow：tf.nn.conv2d
垂直边缘检测的直观解释

Padding
（1）若有一张图片大小为 $n \times n$ ，滤波器大小为 $f \times f$ ，则卷积结果大小为 $(n-f+1)\times (n-f+1)$ 。
（2）缺点：每次卷积图像会变小；边角的像素只在一次卷积中涉及到，中部的像素点被多次采用。
（3）解决方法：在原始图像外围填充一圈像素点。设填充像素点个数为 $p$ ，则原始图像变为 $(n+2p)\times(n+2p)$ ，因此卷积结果大小变为 $(n+2p-f+1)\times(n+2p-f+1)$
Valid卷积和Same卷积
（1）Valid卷积：不填充
（2）Same卷积：填充，使得卷积结果和原始图像大小相同
通常情况下， $f$ 是奇数。

步幅卷积
（1）之前的卷积过程，步幅为1。
（2）若输入为 $n \times n$ ，滤波器为 $f \times f$ ，填充大小为 $p$ ，步幅为 $s$ ，则输出结果为 $\lfloor\frac{n+2p-f}{s}+1\rfloor \times \lfloor\frac{n+2p-f}{s}+1\rfloor$
互相关和卷积
机器学习（深度学习）领域中的卷积，和数学领域的卷积有所区别，和数学领域中的互相关更一致。
数学领域中的卷积运算，首先要对滤波器进行水平和垂直翻转，然后再进行计算。

RGB图像卷积
（1）原始图像尺寸：高 $\times$ 宽 $\times$ 通道数
（2）卷积核尺寸：高 $\times$ 宽 $\times$ 通道数（与原始图像相同）
（3）输出结果：高 $\times$ 宽（二维）
多过滤器
用于检测不同目标，如垂直边缘、水平边缘等。此时输出结果不再是二维的，和过滤器数量有关。