传统的图像识别技术大多是通过像素点的相似度来决定这幅图像是什么。但是这种技术有一个弊端就是一旦图像加入一点噪音或者有平移,旋转或者缩放。那么计算机就会出现识别错误的结果。举例:
CNN讲解
比如说这幅图,传统标准的X图像电脑是可以识别的,但是一旦发生旋转,电脑就不是那么好识别了,就像下图一样,红色的地方都和原来不一样了。
CNN讲解
现在我们需要一种算法,能够识别图像的特征!比如说识别X的四个腿加一个中心,这样不管怎么旋转,缩放都可以识别
CNN就是这样的算法
卷积层:
首先第一步我们是需要在一张图里面提取出对应的特征,但是电脑不像我们人类,一看就知道这个特征在哪里,所以它需要一个过滤器把整个图片都过滤一遍,提取出对应的特征。
CNN讲解
就像上图,黄色区域是代表filter,扫描整个图片就能得到对应的特征。filter一般是一个矩阵,其中的数字都有0和1填充,不同的filter可以筛选出不同的特征。然后filter就是通过BP需要过滤的参数。
CNN讲解

最后的记过如上体一样,因为取值是求和平均,那么对应的pixel值越接近1,代表越接近特征。

池话层
池化层的主要作用是减少计算量。一般来说,图像都是由RGB三通道组成的,再加上我们的filter远小于图像的大小,而且filter的数量很多的话。那么经过卷积层计算的结果也是相当庞大的。这时候我们一般就需要进行池化,一般是用2*2的矩阵scan整个图像,其中每扫描一步就取filter中的最大值或者平均值,这样可以在保留最具代表性的特征情况下,减小了计算量。
CNN讲解

Normalization 层
该曾主要是用 activation function 加入非线性因素。(有待补充)

全连接层
全连接层的主要功能是用于解决被检测目标平移的问题。

相关文章:

  • 2021-12-26
  • 2021-11-23
  • 2022-01-08
  • 2021-08-24
  • 2021-11-08
  • 2021-09-14
  • 2021-10-21
  • 2021-11-27
猜你喜欢
  • 2022-12-23
  • 2021-11-12
  • 2022-03-07
  • 2021-05-29
  • 2021-05-23
  • 2021-06-08
  • 2021-09-25
相关资源
相似解决方案