Visualizing and Understanding Convolutional Networks笔记
论文原文
https://arxiv.org/abs/1311.2901

Pytorch实现
https://github.com/huybery/VisualizingCNN

神经网络有效的原因:1、大规模数据集 2、GPU提高大量的算力 3、Dropout正则化方法

论文提出可视化方法,可视化中间层feature map的输出,训练过程中学习到的特征,使用反卷积的方式(Deconvolutionnal Network),将feature map映射为输入图像的空间,论文还对图像进行了局部遮挡 敏感性分析,观察图像哪些部分对神经网络分类至关重要。改进了AlexNet,提出了超过它性能的模型。

网络中可训练的参数:卷积核权重、全链连接层的权重
模型提出的方法:反卷积,是正向卷积的逆过程,
首先,将图像喂到网络中训练,得到网络参数,将指定某一层的某个feature map以外全部设置喂0,然后把这个feature map 反向输入像素空间中,然后进行
1 反池化(unpool)
2再**(rectify)
3转置卷积
直到恢复原始像素空间
Visualizing and Understanding Convolutional Networks笔记

特征可视化

底层网络识别底层边缘特征
Visualizing and Understanding Convolutional Networks笔记
高层特征
Visualizing and Understanding Convolutional Networks笔记

Visualizing and Understanding Convolutional Networks笔记

论文重构不是来自模型的样本:它们是来自引起的验证集的重构模式
给定功能图中的高**度。对于每个feature map,论文也给出了相应的图像patch。注意:
(i)每个地形图内部的强分组,(ii)更高层次的不变性更大,(iii)的放大
图像中有辨别能力的部分,如狗的眼睛和鼻子(第4层,第1排,第1栏)。以电子形式观看效果最佳。

局部遮挡敏感性

Visualizing and Understanding Convolutional Networks笔记
灰色挡板挡住一部分的时候,时网络判别正确的概率

第一列图像正确的标签为博美犬,当灰色挡板挡住狗脸的时候,网络判别的准确率瞬速降低。
第二列图像正确的标签为车轮,当灰色挡板挡住车轮的时候,网络判别的准确率瞬速降低。

第三列,识别阿富汗猎犬时,最大feature map提取到人脸特征的原因:分类器使用了多个feature map即提取了人脸特征,又提取了狗脸特征,最终分类结果为阿富汗猎犬,而ImageNet数据集中,并没有人这个类别的标签,所以网络判别概率为阿富汗猎犬。

相关文章:

  • 2018-07-23
  • 2021-04-21
  • 2021-08-11
  • 2022-12-23
  • 2021-05-08
  • 2021-07-23
  • 2021-09-09
猜你喜欢
  • 2021-10-11
  • 2021-07-14
相关资源
相似解决方案