一. 卷积层前向传播
·典型的卷积神经网络的卷积层
常有三层:卷积层(Conv)+池化层(POOL)+全连接层(FC)。
·卷积层
前向传播的一个操作:, 。
:过滤器(图中的卷积核,有两个)。
到的变化过程:
- 执行线性函数:每次对27()个数操作(相乘再卷积)得到一个数。
- 加偏差。
- **函数:Relu。
输入:。
输出:(选了原始图像的两个特征映射)。
卷积神经网络一个特征:避免过拟合。(原因:参数少。)
·卷积核
- 维度:二维卷积核针对二维输入,三维卷积核则针对三维输入(高,宽,通道数),一般卷积核的通道数与输入数据的通道数是一样的,所以维度上的变化在于卷积核的个数。
- 参数:三维卷积核 一般设置4个参数,(高,宽,输入通道数,卷积核个数),其中卷积核个数也就是输出时的第三维,即:输出通道数。
- 维度变化:输入三维数据(高, 宽, 通道数c),卷积核(尺寸x * y * c,步长)。其中卷积核尺寸和步长会改变输入的高和宽的维度;而卷积核的个数带来的是第三维的变化。输入数据的通道数,只会影响卷积核的通道数,而输出的第三维只与卷积核个数有关。
二. 卷积层符号
是卷积层,则:
三. 简单的卷积网络
假设有一张图片,想做图片分类或图片识别,把这张图片输入定义为x
然后辨别图片中有没有猫,用0或1表示,这是一个分类问题
用了一张比较小的图片,大小是,即
而 ,即 0层的通道数为3
假设第一层用一个的过滤器来提取特征
那么,因为过滤器时的矩阵,,
所以高度和宽度使用 valid 卷积
如果有,10个过滤器
则
神经网络下一层的**值为 ,即
而
假设设还有另外一个卷积层,这次采用的过滤器是的矩阵
神经网络下一层的 ,即
步幅为2,即
padding为0,即
且有20个过滤器
所以其输出结果会是一张新图像,这次的输出结果为
即**值 的维度
因此
构建最后一个卷积层,假设过滤器还是,步幅为2
即
使用了40个过滤器,padding为0,最后结果为
到此,这张的输入图像就处理完毕了
为图片提取了个特征,即1960个特征
这样简单的卷积神经网络的卷积层就完成了
然后对该卷积进行全连接处理
可以将其平滑或展开成1960个单元,输出一个向量
其填充内容是logistic回归单元还是softmax回归单元
完全取决于是想识图片上有没有猫,还是想识别K种不同对象中的一种
用 表示最终神经网络的预测输出
参考:
深度学习笔记(24) 卷积层
百度端到端说话人识别系统 Deep Speaker 详细介绍