文摘

最新一代的卷积神经网络(cnn)取得了令人印象深刻的成果领域的图像分类。本文关心的一种新方法,植物病害识别模型的发展,叶片图像分类的基础上,通过使用深卷积网络。新颖的培训方式和使用的方法在实践中促进快速和简单的系统实现。开发模型能够识别13个不同类型的植物疾病健康叶片,与区分植物叶片和周围环境的能力。据我们所知,这植物病害识别方法被首次提出。所有必要的步骤来实现这种疾病识别模型完全描述整个论文中,从收集图片为了创建一个数据库,通过农业专家评估。咖啡,深学习框架由伯克利的视力和学习中心,用于执行深CNN培训。开发模型的实验结果达到精度在91%和98%之间,对于单独的类测试,平均96.3%。

1。介绍

植物病害有效保护的问题密切相关,可持续农业和气候变化的问题(1]。研究结果表明,气候变化能改变和病原体的发展阶段;它还可以修改主机阻力,导致宿主-病原体相互作用的生理变化(2,3]。情况进一步复杂化的事实,今天,疾病是全球转移比以往任何时候都更容易。新疾病可能发生在他们以前不明的地方,本质上,没有当地的专业知识应对他们(4- - - - - -6]。

没有经验的农药的使用会导致长期的发展阻力的病原体,严重降低了反击的能力。及时、准确的诊断植物病害是精准农业的支柱之一(7]。是至关重要的,以防止不必要的金融和其他资源的浪费,从而实现更健康的生产,通过解决长期病原体耐药性发展问题和减轻气候变化的负面影响。

在这个变化的环境,适当和及时的疾病识别包括早期预防从未像现在这样重要。有几种方法可以检测植物病理。一些疾病没有任何明显的症状,或效果变得明显的行动太迟了,在这种情况下,一个复杂的分析是必要的。然而,大多数疾病产生某种表现在可见光谱,所以肉眼检查一个训练有素的专业实践中采用的主要技术是植物病害检测。为了实现准确的植物病害诊断植物病理学家应具备良好的观察能力,这样一个可以识别的特征症状(8]。症状的变化显示病变的植物可能会导致一个不正确的诊断因为业余园丁和爱好者可以更多的困难决定比一个专业的植物病理学家。自动化系统旨在帮助植物的外观和视觉识别植物病害的症状可以很大的帮助业余园艺过程以及训练有素的专业人员作为验证系统疾病诊断。

计算机视觉的发展提供了一个机会来扩大和提高精确的植物保护的实践和扩展市场的精准农业领域的计算机视觉应用。

利用常见的数字图像处理技术,如色彩分析和阈值(9)是用于植物病害的检测和分类的目的。

各种不同的方法目前用于检测植物疾病,最常见的人工神经网络(ann) [10)和支持向量机(svm) [11]。他们是结合不同的图像预处理方法有利于更好的特征提取。

在机器学习和认知科学,安是一个信息处理模式,灵感来源于生物神经系统的方式,如大脑处理信息。大脑是由大量的高度相互连接的神经元共同努力来解决具体问题。

一个人工神经元是一个处理元素与许多输入和一个输出。虽然人工神经元可以有多个输出,只有一个输出将被考虑。他们的输入也可以承担任何值在0和1之间。同时,神经元权重对于每一个输入和一个整体的偏见。

权重是实数表达各自的输入输出的重要性。偏见是用来控制输出神经元变得多么简单1。对神经元有很大的偏见,很容易输出1,但当偏差非常-然后很难输出1。

神经元的输出不是0或1。相反,它是 ,在那里 被称为传递函数。有不同类型的传递函数:一步,线性、乙状结肠,等等。的平滑度 意味着小的变化 的重量和 偏见会产生微小变化 在神经元的输出。小的输出变化是近似的 基本上,小重量变化或偏见导致小网络输出(图相应的变化1)。

神经网络,与他们的杰出能力意义来自复杂的或不完全的数据,可以申请提取模式和检测趋势难以注意到的人或计算机技术。其他优势网络自适应学习、自组织、实时操作,等等。

有两个主要类别的ann当谈到架构:前馈人工神经网络的输出任何一层一层同样不太可能影响和反馈人工神经网络在信号旅行涉及循环在两个方向上的网络。

本文中描述的方法是一种新方法在检测植物疾病使用深卷积神经网络训练和调整以适应精确到数据库独立的植物的叶子聚集为多样化的植物病害。开发模型的进步和新奇躺在它的简单;健康的叶子和背景图像与其他类,使模型区分病变的叶子和健康的或从环境中通过使用深CNN。

剩下的纸是组织如下:部分2提出了相关工作,部分3提出了方法,部分4提出了实现结果和相关的讨论,最后,部分5把我们的结论。

实施适当的管理策略如杀菌剂的应用,针对疾病的化学应用程序,并通过农药应用矢量控制可能导致早期信息对作物健康和疾病检测。这可以方便的控制疾病和提高生产力。在[12],作者提出,评论,和识别的需求发展迅速,成本效益和可靠的传感器并促进农业发展。他们描述了当前使用的技术,包括光谱和成像和动荡的profiling-based植物病害检测方法发展为目的的地面传感器系统,协助监测田间条件下植物的健康和疾病。

分析他们的工作和分析后提出的作者的13- - - - - -16),它是决定使用图像处理疾病识别方法等方法一般用于植物病害诊断,例如,双链核糖核酸(RNA)分析,核酸探针和显微镜。

许多程序目前在植物病害检测应用计算机视觉。其中一个是疾病检测提取颜色特征,作者在17)。摘要YcbCr、铸铁和CIELB颜色模型研究;因此,病斑是成功地检测到来自不同来源的噪音的影响,如相机闪光灯。

此外,植物病害检测可以通过提取形状特征的方法。帕蒂尔疾病检测和Bodhe应用这种技术在甘蔗叶用阈值分割阈值确定叶面积和三角形损伤区域,得到的平均准确率98.60%,最后实验(18]。

此外,提取纹理特征可以用于检测植物病害。帕蒂尔和Kumar提出了一个模型,用于植物病害检测使用纹理特性如惯性、同质性和相关性计算灰度同现矩阵获得的图像(19]。结合色彩提取,他们尝试检测疾病玉米叶子。

结合所有这些特性提供了一个健壮的特性集形象改善和更好的分类。在[20.),作者提出了著名的传统的特征提取方法的调查。由于人工智能(AI)科学的迅速发展,本文的工作主要集中在应用这些方法和技术。

有一些方法,应用前馈反向传播神经网络组成的一个输入,一个输出,一个隐层的需要确定叶的物种,害虫,或疾病;这个模型提出了作者在21]。他们开发了一个软件模型,提出补救措施农作物害虫和疾病管理。

作者在提出的另一种方法22)包含了粒子群优化(PSO)的特征提取(23)和神经网络的方向决定了受伤叶斑病的棉花和提高系统的准确性与最终的整体精度为95%。

同时,检测和分化的植物疾病可以通过使用支持向量机算法。这种技术是实现甜菜疾病,在24),根据疾病的类型和阶段,分类精度在65%和90%之间。

同样的,有方法,将特征提取和神经网络集成(向)植物病害识别。通过训练神经网络的确切数量,结合他们的结果之后,向提供更好的泛化学习能力(25]。这种方法实现只认识茶叶疾病最终测试精度为91% (26]。

另一种方法基于叶片图像和使用人工神经网络作为植物病害的自动检测和分类技术结合使用 ——作为一个作者在提出的聚类过程27]。安由10个隐藏层。输出的数量是6类的数量代表五种疾病的情况下健康的叶子。平均来说,使用这种方法分类的准确性为94.67%。

作者在28- - - - - -31日]介绍了深度学习的方法解决最复杂的任务在不同研究领域的生物学、生物信息学、生物医药、机器人技术和3 d技术。

在我们的研究中,我们利用植物病害识别的深度学习方法,由深度学习技术的演变及其在实践中的应用。广泛搜索的最先进的文学产生了没有证据表明,研究人员探索深度学习方法叶植物病害识别的图像。我们的方法识别的应用深度CNN提出了下面的部分。

3所示。材料和方法

整个过程发展中植物病害识别的模型使用深CNN进一步详细描述。完整的过程分为下面几个部分必要的阶段,开始采集图像使用深层神经网络分类过程。

3.1。数据集

适当的数据集需要在物体识别研究的所有阶段,从训练开始阶段评估识别算法的性能。所有收集到的图像数据集从互联网下载,搜索疾病和植物的名字在各种来源不同的语言,如拉丁、英语、德语、塞尔维亚和匈牙利。图像数据集被分成15个不同的类。13类代表植物病害可以直观地从树叶。

为了区分健康叶片和癌变组织,一个类中添加数据集。它只包含健康叶片的图像。一个额外的类背景图像的数据集是有利于获得更准确的分类。因此,深可以训练神经网络来区分从周围的树叶。背景图片来自斯坦福大学的背景数据集(32]。

在这个阶段,所有重复拍摄的图像从不同来源比较发达python脚本被删除的应用程序。脚本删除重复通过比较图像的元数据:名称、大小和日期。自动删除后,图像是由人类专家评估的迭代。

下一步是丰富和增强图像数据集。提出了研究的主要目标是培养网络学习的特点,区分一个类。因此,当使用更多的增强图像,网络学习的机会增加适当的特性。最后,培训数据库包含30880张图片和2589创建图像进行验证。增加过程中描述的部分3.3

1显示所有支持疾病与原始图像的数量和增强图像的数量为每个类用作疾病分类模型训练和验证数据集。

3.2。图像预处理和标签

从互联网上下载的图片在各种格式不同的分辨率和质量。为了得到更好的特征提取,最后目的图像用作深层神经网络分类器是数据集预处理,以获得一致性。此外,所涉及的图像预处理过程手工裁剪的图像,使叶片周围的广场,为了突出感兴趣的区域(植物叶片)。阶段中收集数据集的图像,图像分辨率和较小的尺寸小于500 px并不视为有效的图像数据集。此外,只有感兴趣的区域的图像的高分辨率数据集被标记为符合条件的候选人。这样的话,这是确保学习图像包含所有需要的信息功能。图像数据集用于图像的大小 减少训练时间,自动计算通过编写脚本在Python中,使用OpenCV框架(33]。

许多资源可以通过搜索在互联网上找到,但他们的关系往往是不可靠的。为了确认数据集类的准确性,最初按关键字搜索,分组农业专家检查叶片图像并将所有的图像缩略词以适当的疾病。众所周知,重要的是要使用精确分类图像的训练数据集和验证。只有这样可以开发一个适当的和可靠的检测模型。在这个阶段,复制图像,左后收集和分组图像类的初始迭代中描述的部分3.1从数据中删除。

3.3。增加的过程

应用增强的主要目的是增加数据集和介绍轻微变形的图像可以帮助减少过度拟合训练阶段。在机器学习中,以及统计数据,过度拟合出现在一个统计模型描述了随机噪声或错误而不是潜在的关系(34]。数转换技术的图像增强包含一个包括仿射变换、视角转换,和简单的图像旋转。仿射变换应用于表达平移和旋转(线性变换和矢量加法,resp。) (35),所有平行线在原始图像仍并行输出图像。找到一个变换矩阵,三分从原始图像需要以及相应的输出图像的位置。视角转换的 变换矩阵是必需的。直线仍将直接即使变换。增大的过程,应用简单的图像旋转,以及旋转由不同程度在不同的轴上。

转换应用于增强过程见图2,其中第一行表示生成的应用仿射变换得到的图像在单一形象;第二行代表图像从视角转换获得对输入图像和最后一行可视化简单的输入图像的旋转。增加的过程中选择符合需求;树叶在自然环境中可能不同的视觉角度。

这个阶段,为了自动化增强过程大量图像数据集,特定应用程序是在c++开发使用OpenCV库(36),可能在运行时改变转换的参数,提高了灵活性。

3.4。神经网络训练

培训的深卷积神经网络图像分类模型从一个数据集描述的部分3.1提出了。有几个著名的最先进的深度学习框架,如Python库Theano [37)和机器学习库扩展Lua, Torch7 [38]。此外,还有咖啡,开发的一个开源的深度学习框架BVLC [39)包含参考pretrained CaffeNet模型。本研究的目的,使用了这个框架,随着学习的权重非常大的数据集,ImageNet [40]。

咖啡框架适用于两个研究实验和工业部署。框架的核心是在c++开发并提供命令行,Python和MATLAB接口。咖啡与cuDNN集成图书馆加速咖啡模型(41,42]。CaffeNet深CNN,多层,逐步从输入图像计算功能43]。具体地说,网络包含八个学习层次和五个卷积和三个完全连接层(44]。

CaffeNet架构被认为是一个起点,但是修改和调整,以支持我们的15类(类)。最后一层是改变,将softmax层的输出参数化研究提出的要求。

卷积层是卷积神经网络的基本构建块。层的参数组成的一组可学的内核,拥有一个小的接受域但扩展通过完整的输入量的深度45]。

每个卷积层都有 同等大小的地图, 和一个内核的大小 , 是在输入图像的某些区域转移。跳过因素 定义的过滤器/内核忽略多少像素 - - - 方向之间后续的运算(46]。输出的大小可以被定义为地图 在哪里 表示层。每个地图层 连接到最 地图图层

修正线性单元(ReLU)作为代替饱和非线性。这个激活函数自适应地学习整流器和提高精度的参数可以忽略额外的计算成本(47]。它被定义为 在哪里 代表非线性激活函数的输入 通道。

深CNN ReLUs火车快几倍。该方法应用于每一个卷积和的输出完全连接层。

尽管输出,不需要输入正常化;应用ReLU非线性后第一次和第二次卷积层,因为它减少了(和前5名的错误率。隐层神经元在CNN,在划分为“特征图。“内的神经元功能映射共享相同的重量和偏见。内的神经元功能地图搜索相同的特性。这些神经元是独一无二的,因为他们是连接到不同的神经元在较低的层。所以第一隐层神经元内特性映射将连接到输入图像的不同区域。隐藏层划分为特征图中的每个神经元功能地图上的什么地方查找相同的功能,但是在输入图像的不同位置。地图的基本特性,是应用卷积的结果在一个图像。每一层的功能显示在不同的块,其中可视化表示的最强的激活地图所提供的特性,从第一个卷积层,功能从每个像素到简单的线条,到第五卷积层学习功能,如叶子的形状和某些部位(图显示3)。

cnn的另一个重要层是池层,这是一种非线性将采样。池操作给翻译的形式不变性(48];设有独立在每个深度片空间的输入和修改尺寸。重叠的连接池是有益的应用于减少过度拟合。也有利于减少过度拟合,一个辍学层(49)中使用前两个完全连接层。但是辍学的缺点是它增加培训时间2 - 3次比较确切的标准神经网络架构(50]。贝叶斯优化实验也证明ReLUs和辍学有协同效应,这意味着它是有利时一起使用(51]。

cnn引用他们的学习能力的进步丰富图像中层表示而不是hand-designed低级特征用于其他图像分类方法(52]。

4说明了过滤后的输出图像的每一个卷积和池层深的网络。输出图像标签的名称对应的层在每一个图像的右下角。

3.5。执行测试

人工神经网络的测量性能的常见方法是将数据分为训练集和测试集,然后训练一个神经网络训练集和使用的测试集预测。因此,从最初的结果测试集和我们的模型预测结果,我们可以计算预测的准确性。与2589年不同的测试进行了原始图像,当训练的30880张图片数据库。

精度检验,10倍交叉验证技术被用来评估一个预测模型。交叉验证过程后重复每千训练迭代。总体估计的结果测试图形表示为排名前,测试如果顶级(概率最高的国家之一)是一样的目标标签。前5错误率有测试如果目标标签是五大预测,5的概率最高的国家。图像的数量从每个标签类是用于验证测试表1。测试结果给出部分4单独完整的数据集和每个类。

3.6。微调

微调寻求增加一个过程或函数的有效性或效率进行小的修改来改善或优化的结果。softmax原始CaffeNet模型中的分类函数分类器计算概率ImageNet 1000班的数据集。调整学习实验需要一点学习,但他们仍然比从头学习更快53]。微调过程开始,这个softmax分类器移除,如前所述,说明部分3.4和新一与随机值初始化。新softmax从头训练分类器使用反向传播算法和部分中描述的数据集的数据3.1。这个数据集有15个不同的类别(43]。由于规模较小的数据集用于这项研究ImageNet相比,ilsvrc - 2012 (54],过度拟合是限制使用低初始学习利率调整隐藏层(55]。学习速率的顶层设为10,而所有其他七个学习层次的学习速率为0.1。利用bp算法竞选100000次迭代。微调的过程是隐藏层和hyperparameters重复更改参数。植物病害的最适合模型检测的过程是通过实验调整参数。模型的结果微调,在部分作进一步的解释4

3.7。设备

一个电脑被用于整个过程描述的植物病害检测模型的训练和测试。培训的CNN进行图形处理单元(GPU)模式。每个迭代训练了大约八个小时在这展示在表指定机器的基本特征2

4所示。结果与讨论

在这一节中给出的结果是相关的培训与整个数据库包含原始和增强图像。众所周知,卷积网络能够学习功能更大的数据集上训练时,成果当训练只有原始图像不会探索。

经过网络的参数的调整,总体精度达到了96.3%,100后训练迭代(95.8%没有微调)。即使在30日训练迭代精度高的结果极其减少损失,但60迭代后,平衡精度和损失进行了精度高。图中绿线在图5显示网络的成功验证测试集,通过训练迭代。每1万个训练迭代后,模型的快照。图中蓝线代表了损失在训练阶段。通过训练迭代,损失迅速减少。

(成功是96.3%,五大成功是99.99% 100000次迭代后如图67,分别。

此外,训练模型测试每个单独的类。测试每个图像上执行的验证集。结果显示强调有多少图片从每个类的准确预测。图8说明训练模型的预测结果为每个类分开。类数字跟随枚举表1

结果显示在图8,值得注意的是,训练模型的准确性略少类训练数据集的图像数量较低,更具体地说类桃子,白粉病,苹果,白粉病,葡萄藤,枯萎。实现精度范围从91.11%桃子,背景图像的白粉病,高达98.21%。高精度的模型预测的背景图像允许良好的植物叶子和环境分离。

所显示的良好实践原则,实现结果应该与其他结果。考虑到这样一个事实:在这个研究开发自己的图像数据库,没有人使用它。此外,由于没有人使用深度学习在科学文献识别植物病害,比较它与其他的例子是不可能的。尽管如此,由于广泛的审查,深度学习技术显示更好的结果在模式识别、图像分割和目标检测。这也证明在实践中通过大量的比赛赢了卷积神经网络(56]。目前,有一个商业解决方案,Leafsnap [57),它使用视觉识别为了识别树种的树叶的图片但随着网络提出了分类植物疾病而不是类型的植物,Leafsnap不是用来比较的实现结果。最后,比较我们的结果与其他方法检测疾病从叶子图像,可以说,我们的方法提供了更好的结果(23,24,26,27]。

5。结论

有许多方法在植物病害自动或计算机视觉检测和分类的过程,但是,这是缺乏研究领域。此外,市场上还没有商业解决方案,除处理植物种类识别基于叶子图像。

本文使用深度学习方法的一种新方法探索为了从叶子图像自动分类和检测植物病害。开发模型能够检测叶存在和区分健康叶片和13个不同的疾病,它可以直观地诊断。分别描述了完整的过程,从收集用于训练和验证图像预处理和图像增强,最后培训深CNN和微调的过程。不同的测试是为了检查执行新创建的模型的性能。

创建新的植物病害图像数据库,包含超过3000个原始图像从可用的网络资源和扩展到超过30000名使用适当的转换。实验结果达到精度在91%和98%之间,为单独的类的测试。最后总体训练模型的准确性为96.3%。微调并没有显示显著变化的总体精度,但增大过程有更大的影响力取得可观的成果。

方法没有被利用,据我们所知,在植物病害识别,没有与相关的结果,使用的技术。与其他方法相比,在部分2,相当甚至更好的结果,尤其是考虑到更广泛的在提出研究的类的数量。

这项研究的扩展将对采集图像进行数据库使用不同的技术,提高模型的精度的调整和扩充。

未来的主要目标工作将开发一个完整的系统,包括服务器端组件包含一个训练模型,并应用智能移动设备的特性,比如显示公认的疾病在水果,蔬菜,和其他植物,叶子图像被手机相机。该应用程序将作为一个援助农民(无论级别的经验),允许快速和高效的植物病害识别和促进决策过程时使用化学杀虫剂。

此外,未来的工作将包括传播模型通过训练它的使用更广泛的土地上的植物病害识别领域,结合果园和葡萄园被无人机航拍照片和卷积神经网络目标检测。通过扩展这项研究,作者希望获得有价值的对可持续发展的影响,为子孙后代影响作物的质量。

相互竞争的利益

作者宣称没有利益冲突有关的出版。

确认

本文的研究是由FP7国税局项目QoSTREAM之下。