Maize Leaf Disease Identification Based on Feature Enhancement and DMS-Robust Alexnet

论文地址:https://ieeexplore.ieee.org/document/9044386
提出了基于骨干Alexnet体系结构的DMS-Robust Alexnet用于玉米叶片图像识别和分类的方法,结合了膨胀卷积和多尺度卷积以提高特征提取的能力。识别准确率高达98.62%。
1、图像增强算法WT-DIR
首先,将玉米病害图像从RGB空间转换为HSV空间。其次,将值分量V转换为小波域。在小波域中,玉米病害图像的全局信息和轮廓信息主要分布在低频区域,而玉米病害图像的局部信息,细节信息和噪声主要分布在高频区域,通过应用改进的Retinex图像增强算法来增强低频系数,并使用Donoho阈值方法对高频系数进行去噪。最后,通过分段对数拉伸对S分量进行处理,以提取玉米病灶特征,从而进一步改善玉米病害图像的质量。
Maize Leaf Disease Identification Based on Feature Enhancement and DMS-Robust Alexnet

算法流程:
step1:选择符号小波(Sym)分解图像;
step2:小波变换分解的图像,容易发生光晕现象。本文采用具有边缘保留特性的导引滤波器对玉米病害图像进行运算,并以此为基础得到玉米图像的照度图像。根据Retinex原理,反射分量图像是从对数变换得出的。然后,通过伽马变换校正反射分量。如果Gamma转换的结果低于信号噪声比(SNR)阈值,则重复上述操作。
Maize Leaf Disease Identification Based on Feature Enhancement and DMS-Robust Alexnet
增强效果
Maize Leaf Disease Identification Based on Feature Enhancement and DMS-Robust Alexnet
2、基于Alexnet 骨干架构的新型DMS-Robust Alexnet
加深了网络的结构,具有5个卷积层,3个完全连接的层,使用Dropout抑制过度拟合,并使用PRelu作为**函数。
一个多尺度卷积模块和三个完全连接的层组成。
Maize Leaf Disease Identification Based on Feature Enhancement and DMS-Robust Alexnet
DMS-Robust Alexnet的体系结构
(1)第一层由输入层和BN层(批处理归一化层)组成。 BN层处理输入图像,可以提高模型的泛化能力,并加快网络的收敛速度。
(2)第二层由卷积模块1组成,其中Conv1由64个滤镜组成,内核大小为11×11像素。通过使用扩展卷积扩展Conv1,以提高玉米病害的特征提取能力。此外,采用了PReLu**功能来解决梯度消失的问题。池化层1的类型为最大池化层,其内核为3×3,跨度为2。池化后,将执行BN处理。
(3)第三层由卷积模块2组成,其中Conv2由192个使用PRelu运算的内核尺寸为5×5像素的滤波器组成。池层2是最大池层,内核是3×3,跨度是2。池化后,执行BN。
(4)第四层由卷积模块3组成,其中Conv3由384个滤镜组成,其滤镜尺寸为3×3像素,并借助PRelu操作进行辅助。池化层3的类型为最大池化层,其内核为3×3,跨度为2。池化后,执行BN。
(5)第五层由卷积模块4组成,其中Conv4由256个过滤器组成,内核大小为 3 × 3 像素。通过使用PRelu操作可以得到帮助。合并后,执行BN。
(6)第六层由多尺度卷积模块组成,其中第一层多层尺度卷积的滤波器数量(从上到下)分别为96和16,其内核大小为 1 × 1 。**功能为PRelu。多尺度卷积的第二层总和(从上到下)分别为64、128、128和128,其内核大小为1 × 1 , 3 × 3 , 5 × 5 , 1 × 1 , 分别。收集后,它由连接层处理。
(7)第七层由卷积模块5组成,其中Conv5由256个滤波器组成,内核大小为 3 × 3 像素。如上所述,使用PRelu操作,并且由BN层处理收集。
(8)第一个完全连接的层包含200个神经元,然后分别通过PReLU操作和Dropout操作进行处理。
(9)第二个完全连接的层包含100个神经元,然后通过PReLU操作和dropout操作对其进行处理。
(10)最后一个完全连接层包含七个神经元,代表玉米叶病类别的数量。然后将最后一个完全连接层的输出传输到输出层,以确定输入图像的分类。最后,使用softmax**函数,因此使输出值的总和等于1.0,并将单个输出限制为0-1之间的值。softmax函数是DMS-Robust Alexnet的适当实现,因为它考虑了所有输出的相对幅度。

膨胀卷积
第一层使用了膨胀卷积,扩大特征提取的范围;扩张卷积与普通卷积的相同点在于,卷积核的大小是一样的,在神经网络中即参数数量不变,区别在于扩张卷积具有更大的感受野。
cnn中的卷积
Maize Leaf Disease Identification Based on Feature Enhancement and DMS-Robust Alexnet
膨胀卷积
Maize Leaf Disease Identification Based on Feature Enhancement and DMS-Robust Alexnet

多尺度卷积
该网络第六层使用了多尺度卷积,主要思想是基于确定卷积视觉网络中最佳局部稀疏结构的近似值,并通过容易获得的密集分量进行覆盖。结构如下:
Maize Leaf Disease Identification Based on Feature Enhancement and DMS-Robust Alexnet多尺度卷积模块的体系结构
**函数在DMS-Robust Alexnet中使用了PRelu**功能而不是Sigmoid和Relu**功能,避免“梯度消失”现象。当输入信号小于0时,PRelu函数的值是具有较小斜率的函数,它将改变数据的分布并保留负轴的某些值。结果,负面信息将不会完全丢失。因此,避免了玉米疾病图像的信息丢失。
Maize Leaf Disease Identification Based on Feature Enhancement and DMS-Robust Alexnet
网络优化器
使用了AdaBound优化器,使用不同的优化器和**函数的对比如下:
Maize Leaf Disease Identification Based on Feature Enhancement and DMS-Robust Alexnet
AdaBound
参考论文:https://openreview.net/pdf?id=Bkg3g2R9FX
源码:https://github.com/Luolc/AdaBound

相关文章: