文摘

香菇棒易受霉菌感染在文化过程中,和手动识别受感染的棍子很重,过早的、不准确的。旨在解决这一问题,本文提出一种方法来识别感染香菇棒基于改进ResNeXt-50 (32×4 d)转移学习。首先,数据集的香菇疾病了。其次,基于ResNeXt-50 (32×4 d)模型和pretraining ImageNet的重量数据集,pretraining重量参数对识别精度的影响进行了研究。最后,六个微调策略完全连接层的设计修改完全连接层ResNeXt-50 (32×4 d)。实验结果表明,该方法的识别精度提出了可以达到94.27%,高于Vgg16, GoogLeNet, ResNet50,和MobileNet v2模型8.47%,6.49%,4.68%,和9.38%,分别,F1-score可以达到0.9422。本文提出的改进方法能减少计算压力和过度拟合问题的模型,提高模型的精度鉴定的香菇粘模的疾病,并提供一个有效的解决方案的选择的。

1。介绍

作为生产香菇的重要载体,香菇棒经常被霉菌感染疾病(1),这将导致巨大的经济损失。目前,患病的棒的选择仍处于经验管理的水平,这就需要一个检查员手动提取香菇棍棒和法官是否患病。这种传统的方法存在一些问题,如棒被检查人员和不合时宜的选择错过了病变的香菇棍棒,这很容易导致模具扩散。同时,自动识别研究香菇贴已经非常罕见的疾病,和缺乏特定的识别模型。因此,需要收集和处理香菇粘病图像在接种,precultivation,培养、冷藏、和其他步骤,研究香菇坚持疾病的识别技术,并实现准确的识别和判断香菇疾病。具有重要意义减少香菇坚持疾病的传播,提高香菇的产量和品质,驱动香菇产业的大规模发展,并提高经济效益。

深大开发以来的学习(2- - - - - -4),越来越多的研究人员深入学习引入作物疾病领域的图像检测(5- - - - - -10]。与传统的图像识别方法相比,这种新的无损检测技术避免了复杂的图像数据预处理过程由输入图像直接进入网络。深度学习使用自动特征提取的方法把低级的特征到高层抽象的视觉特性。它可以快速、无损识别作物疾病在可见光范围内不使用光谱成像技术。精度高,检测速度快,和更好的稳定性。

目前,深度学习研究在农业领域的疾病识别已成为一个热点深度学习的应用。风扇Xiangpeng et al。11优化卷积神经网络,训练,和测试的玉米病害图像复杂背景下,识别率达到97.10%。莫汉蒂S P et al。12)使用AlexNet和GoogLeNet分类和识别PlantVillage 54306植物病害图像数据集,和模型精度高达99.35%。森杨et al。13]VGG-16用作更快R-CNN模型的特征提取器通过深度的方法转移学习,使聚类方法建立一个综合词典颜色的混合特性和筛选,取得了90.83%的识别精度的马铃薯叶子。虽然深度学习取得了很好的结果作物疾病领域的识别、相关文献深度学习在香菇坚持疾病的识别在先前的研究尚未发现。

解决上述问题,本文提出一种方法基于ResNeXt-50 (32×4 d)传递学习法对香菇疾病鉴别。的主要贡献如下:(1)本文率先应用深度学习模式识别的香菇棒感染,占国内深度学习的差距的疾病识别香菇。(2)香菇棍疾病数据集,完全连接层ResNeXt-50 (32×4 d)模型是重新设计来提高识别精度。(3)香菇棒的疾病识别方法研究了这种疾病可以扩展到其他袋装食用菌的识别。

2。材料和方法

2.1。香菇疾病数据集

山东Qihe生物技术有限公司每年生产大约70万香菇棍棒,感染了疾病,如黄曲霉,Trichoderm viride,脉孢菌,造成直接经济损失900万元。Qihe生物智能工厂,香菇棒被霉菌感染的图像文化摆脱手工收集,他们被分成黄曲霉病棒、Trichoderm viride患病的棍棒,脉孢菌病棍棒,和正常的香菇棒根据模具的类型疾病(见图1)。

摘要942黄曲霉病棒的照片,893年的图像Trichoderm viride患病的棍棒,664脉孢菌病棒的图片,和1179年图片收集正常香菇的棍棒,总共3678张图片。因为香菇坚持疾病的图像数据量相对较低,本研究使用图像增强方法(14)等随机旋转和水平翻转增加样本的多样性,构建一个香菇疾病数据集。

2.2。ResNeXt-50 (32×4 d)网络

传统方法提高模式识别的准确性是深化或扩大网络。然而,随着越来越多的hyperparameters(如通道数目和过滤大小)、网络设计和计算开销的难度将会增加。ResNeXt-50 (32×4 d)网络(15)结合堆积ResNet网络的策略(16)和初始网络的分组卷积策略(17]。它使用一个残块具有相同拓扑并行堆栈,而不是原来的三层卷积ResNet残块。与ResNet网络相比,ResNeXt-50 (32×4 d)网络不仅可以提高精度不增加参数的复杂性也减少hyperparameters的数量达到一个更好的分类效果。

ResNeXt网络是由一系列的残块,和每个剩余块具有相同的拓扑结构18]。剩余块ResNeXt-50 (32×4 d)网络conv2 takenn为例(见图2),ResNeXt残块分为32组与256输入通道图像特征矩阵。对于每一个分组,首先,图像特征矩阵是减少4回旋的内核和256个频道1×1的大小。其次,它是由4卷积内核与4通道和卷积3×3的大小。然后,它使用256个频道4和1×1卷积核的大小增加输出的维度。最后,每组的输出图像的特征矩阵是补充道,然后,图像特征矩阵添加256个输入通道获得最终的输出图像矩阵。

ResNeXt剩余块实现了splitting-transforming-merging战略,表示为

在这里,T具有相同的拓扑结构,C代表每个ResNeXt剩余块组的数量C= 32。

ResNeXt-50 (32×4 d)网络结构如图3。Conv2、conv3 conv4, conv5由3、4、6和3残块,分别。残块的设计遵循两个规则:(1)如果一个特征图生成相同的大小,这些团体共享相同的hyperparameters(卷积核的大小和数量的渠道);(2)当特征地图的大小down-sampled两次,通道的数量特征映射需要翻了一倍。例如,当通道的数量剩余conv2是256块,分为32组,每组和渠道的数量是4;当通道的数量剩余conv3是512块,分为32组,每组通道的数量是8。以此类推,通道的数量逐渐双打。

剩余的特性计算神经网络后,完全连接层趋于平缓的特征向量为一维向量,然后使用这些特征向量作为输入来计算每个样本类别的概率值。

2.3。转移学习

图像识别技术的快速发展,对标记图像数据的需求正在增长。然而,标签图像数据是一项重复而繁琐的任务。目前,虽然有高精度的图像数据集和应用场景,它是耗时为每个场景,建立一种新的模式和没有足够的标记图像数据。近年来,随着大型数据集的建立等ImageNet [19),已经有越来越多的公开注释的图像数据。作为世界上最大的图像识别任务数据库,有超过1400万个标记图像ImageNet数据集,其中有大量的植物病害图像。基于这些植物病害图像数据,多个深层神经网络模型训练,和完整的训练参数和模型权重已经保存。

2014年,Yosinski [20.)和其他带头探索深层神经网络的传递性,达成三个主要结论如下:(1)前几层的神经网络学习图像的基本特征,和训练参数基于这些特性有很好的识别效果。(2)微调的结果的深层传输网络比最初的训练。(3)微调可以克服数据之间的差异。

在这项研究中,ResNeXt-50 (32×4 d)模型用于转移学习(21],pretraining重量是ImageNet训练数据集。由于ImageNet重量训练图像数据有很强的能力来表达底层特征在转移学好并且可以处理相同类型的图像识别任务,因此,基于转移学习,训练模型权重,模型调整,这不仅可以提高模型的鲁棒性和泛化也节省培训时间不从头训练网络(22- - - - - -24]。

3所示。结果与讨论

3.1。评估标准

为了评估模型识别的影响,本文使用的准确性和F1-score混淆矩阵(25)作为评价指标。F1-score的价值取决于计算精度和召回,以及Macro-F1的计算规则。计算公式如下。其中,TP代表阳性样本的数量将是积极的,FP代表负样本的数量将是积极的,TN代表负样本预测的数量是负数,和FN代表积极的预测样本的数量是负数。

3.2。Pretraining重量参数对精度的影响

减少计算压力和过度拟合问题的模型26,27),介绍了学习pretraining重量转移。pretraining重量保留大量的参数信息ImageNet数据集上训练。在本节中,pretraining重量参数对精度的影响进行了研究。

实验运行环境是Windows 10和Python 3.7。开源的深度学习框架PyTorch作为开发环境。使用一个Nvidia GTX1070Ti GPU加速训练在训练过程。为了提高模型的泛化能力,在图像识别过程中,收集到的香菇棒疾病数据集预处理:RandomResizedCrop函数是用来统一调整图片的大小规模ResNeXt-50所需的224×224 (32×4 d)模型;图像增强技术,如随机旋转和水平翻转是用于提高香菇棒病图像的多样性,扩大数据集。ToTensor函数用于将图像转换为张量模型和可接受的格式规范化[0.0,1.0]之间。Normalize函数是用来规范形象。标准化后的数据更符合数据集中的分布规律,从而提高模型的泛化能力。

香菇棍疾病数据集分为训练集和测试集的比例为9:1。然后,采用学习方法转移,load_state_dict函数用于加载pretraining重量resnext-50 (32×4 d) .pth resnext-50对应(32×4 d)模型和传输的网络参数收集香菇坚持疾病的数据集。研究学习pretraining重量转移参数对精度的影响,以下六组比较实验设计。(1)ResNeXt-50的准确性(32×4 d)网络只有72.89%不使用pretraining重量转移学习和使用香菇棍疾病数据集训练ResNeXt-50从头开始(32×4 d)网络。(2)学习用于pretrain权重传递,但没有一个重量参数层被冻结了。香菇棍疾病数据集被用来重新培训所有层的权重,和准确性为91.39%。(3)学习使用pretraining重量转移,所有参数pretraining重量卷积层和layer1被冻结了。香菇棍疾病数据集被用来重新培训layer2 layer3 layer4,完全连接层。精度为90.62%。(4)学习使用pretraining重量转移,所有参数pretraining重量卷积层,layer1, layer2被冻结了。香菇棍疾病数据集被用来重新培训layer3 layer4,完全连接层。精度为85.52%。(5)学习使用pretraining重量转移,所有参数pretraining重量卷积层,layer1, layer2, layer3被冻结了。香菇棍疾病数据集被用来训练layer4和完全连接层。精度为84.37%。(6)学习使用pretraining重量转移,所有参数pretraining重量卷积层,layer1, layer2, layer3, layer4被冻结了。完全连接层与香菇坚持疾病重新训练数据集,和准确性为76.55%。

对比实验(2)-(6)和实验(1)表明,香菇棍疾病数据集,pretraining重量参数对模型的改进有重要影响识别准确性。这是由于使用的大型图像数据集ImageNet转移学习pretraining重量。ImageNet提供了大量的图片,使模型学习更多的功能和更好的适应参数。因此,该模型获得更好的转移过程中初始化网络参数学习和减少过度拟合的可能性。这也表明,pretraining重量转移学习能力的获得有足够的训练数据在目标域比直接培训小样本数据。

在一个实验中(2)、转移学习pretraining模型使用,但是没有重量参数层被冻结,然后,所有层的权重是培训。这种转移学习方法取得了91.39%的最高精度。这表明在使用转让的前提下学习pretraining重量,培训整个模型与香菇棍疾病模型的数据集将迅速提高学习能力。因为培训过程从头到尾逐渐改进原始输入的底层特征,层间特性的表达能力更强,抽象的图像可以更好的集成特性。

在实验中(3)-(6),冻结层越多,模型的精度越低,过度拟合模型的比例越高。这种情况的原因是,冻层越多,越少的参数可以训练模型,较弱的计算和特征提取功能模型的图像香菇坚持疾病,较弱的共享功能层之间的相互影响能力,和原来的底部特征时也不会被再次一层一层地传播。这导致逐渐下降的特性顶层的转移能力。即模型只转移高级功能但不能实现逐步抽象,描述,和提取特征从底到高水平,所以模型的识别率会逐渐下降。

实验(2)的基础上,全面连接层进行微调的实验模型。

3.3。微调模型完全连接层的策略

提高模型的精度鉴定的香菇坚持疾病,六个微调策略完全连接层的设计修改完全连接层ResNeXt-50 (32×4 d)。

基于pretraining重量参数的影响实验,特征提取的hyperparameters层被修改以适应香菇棍疾病的训练数据集。hyperparameters使用网格搜索算法的设计(28选择参数的最佳组合。实验后,最好的hyperparameters ResNeXt-50 (32×4 d)在这个实验中如表所示1

在进入全面连接层,图像特征矩阵将通过全球池层函数,然后使用平压平的维度,和多维输出将成为一维。在这个时候,节点的数目是2048。提高模型的分类性能,通常的方法是增加模型的深度,增加模型参数的数量,或者增加训练样本数据集。然而,简单地增加这些值将导致模型成为overfit和将减少训练精度。微调模型,可以提高分类性能通过添加完全连接层和设置在完全连接层神经元节点的数量。神经元节点的数量和层的增加将使模型学习从香菇棍疾病数据集的更多信息。然而,这也会增加计算复杂度,甚至导致网络特征提取信息的退化和损失(29日]。在此基础上,7组比较实验设计,包括六个微调的方法完全连接层和ResNeXt-50 (32×4 d)原始完全连接层。(1)FC0: ResNeXt-50 (32×4 d)模型原始完全连接层。完全连接层进行了重新设计,包含1层。节点的数量分类数量4。(2)FC1(2048 - 4):完全连接层的ResNeXt-50 (32×4 d)模型进行了重新设计,包含3层。在1号和2号层节点的数目是2048和分类号4。(3)FC2(2048-1024-4):完全连接层的ResNeXt-50 (32×4 d)模型进行了重新设计,包含3层。节点的数量在1日,2日,和第三层是2048年,1024年,分别和分类号4。(4)一个FC3(2048-512-4):文件的完全连接层ResNeXt-50 (32×4 d)模型进行了重新设计,包含3层。节点的数量在1日,2日,和第三层是2048年,512年,分别和分类号4。(5)FC4(2048-256-4):完全连接层的ResNeXt-50 (32×4 d)模型进行了重新设计,包含3层。节点的数量在1日,2日,和第三层是2048年,256年,分别和分类号4。(6)FC5(2048-1024-512-4):完全连接层的ResNeXt-50 (32×4 d)模型进行了重新设计,包含4层。节点的数量在1日,2日,3日和4日层是2048年,1024年,512年,分别和分类号4。(7)FC6(2048-1024-256-4):完全连接层的ResNeXt-50 (32×4 d)模型进行了重新设计,包含4层。节点的数量在1日,2日,3日和4日层是2048年,1024年,256年,分别和分类号4。

节点的数量完全连接层的第一层是一维向量获得全球池和压扁后的尺寸平功能,虽然在最后一层节点的数目是输出类别的数量。中间一层节点的数目设置为一个指数2的倍数,和一个大值设置为提高计算效率。同时,BatchNorm1d函数是用来加速神经网络的收敛性和提高培训过程的稳定。特征映射转换成ReLU激活函数的非线性映射,这使得线性操作的不足,提高了分类模型的能力。六个完全连接层微调策略的比较结果如表所示2

从表中可以看出,模型的准确性提高了FC1微调方法,一个FC3,文件和FC5,这表明该模型微调研究是有效的。微调的方法,一个FC3效果最好的文件。香菇坚持疾病测试集的精度达到94.27%,高于2.88%的原始模型的完全连接层。预测结果如图的一部分4

当图像测试集的数量是367,获得的混淆矩阵ResNeXt-50 (32×4 d)基于一个FC3方法文件模型微调表所示3

3.4。比较和分析的算法

反映本文研究模型的有效性,VGG16, GoogLeNet, ResNet50, MobileNet v2深度学习模型选择自建香菇坚持疾病进行比较实验数据集。实验结果如表所示4。从表中可以看出,模型的准确性研究已达到94.27%,F1-score值达到了0.9422,这是最好的香菇的识别疾病。

4所示。结论

摘要ResNeXt-50基于深(32×4 d)模型转移学习设计和改进。它用于香菇坚持疾病的自动识别。首先,基于pretraining ResNeXt-50的重量(32×4 d)模型和ImageNet数据集,pretraining重量参数对识别精度的影响进行了研究,并证明pretraining重量参数有显著影响的改进模型的识别精度。同时,不冻结pretraining重量参数,利用香菇坚持疾病数据集重新培训所有层的权重ResNeXt-50 (32×4 d)可以更好地初始化网络参数,降低了模型的计算压力和过度拟合问题。第二,为了提高模型的准确性,完全连接层的ResNeXt-50 (32×4 d)模型进行了重新设计,包含3层,和节点的数量在1日,2日,和第三层是2048年,512年,分别和分类4号。

本文仍存在的缺陷数据集建设,和缺乏疾病香菇棒的图像在实际的文化环境。因此,在下一步中,计划将图像采集设备添加到香菇棍子刺破机器。当香菇棒刺破机器拿出香菇棒从书架上旋转,图像采集设备可以拍摄香菇棒图片360°,以便完成收集香菇棒疾病的图像在实际环境中。此外,作者将继续研究压缩算法(30.]香菇坚持疾病识别和优化网络结构限制的计算和存储资源的数量需要运行深层神经网络在移动或嵌入式设备。识别测试结果将分析从多个评价维度,如识别速度,准确性,F1-score AUC,中华民国。

数据可用性

在这项研究中提出的数据都可以在请求从相应的作者由于限制隐私。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由山东省重大科技创新项目(项目号2022 cxgc010609)和智能Qihe生物创新项目。