1. 简介
1998年,Yann LeCun在论文《Gradient-based learning applied to document recognition》提出LeNet-5,它是第一个成功应用于手写数字识别问题的卷积神经网络,在MNIST数据集上可达到99.2%的正确率。

2. 网络结构

Layer 1:卷积层
- 输入:32×32(灰度图像28×28,周围用两个像素填充)
- 卷积核:5×5,深度6,步长1
- 输出:28×28×6
- 参数个数:5×5×1×6+6=156,其中加项的6个为偏置项参数
- 连接数:(5∗5+1)×6×(28∗28)=122,304
Layer 2:池化层
- 输入:28×28×6
- 池化核:平均池化,每个大小2×2,步长2
- 输出:14×14×6
Layer 3:卷积层
- 输入:14×14×6
- 卷积核:5×5,深度16,步长1
- 输出:10×10×16
- 参数个数:5×5×6×16+16=2416
- 连接数:(5∗5+1)×16×(28∗28)=41600
Layer 4:池化层
- 输入:10×10×16
- 池化核:平均池化,每个大小2×2,步长2
- 输出:5×5×16
Layer 5:全连接层
- 输入:400
- 输出:120
- 参数个数:400×120+120=48120
Layer 6:全连接层
- 输入:120
- 输出:84
- 参数个数:120×84+84=10164
Layer 7:全连接层
- 输入:84
- 输出:10
- 参数个数:84×10+84=850
网络中的权重个数:
-
Conv1:5×5×1×6+6=156
-
Conv2:5×5×6×16+16=2416
-
FC1:400×120+120=48120
-
FC2:120×84+84=10164
-
FC3:84×10+84=850
总计:61706
相关文章: