文摘

作物产量的生产和质量严重影响作物疾病造成不利影响粮食安全以及经济损失。在印度,农业是主要的收入来源在大多数农村地区。因此,有一个强烈的需要运用新颖的自动作物疾病检测和精确的计算机应用技术及其分类,这样可以及时推荐预防性行动。在文学,许多计算机应用技术通过利用机器学习的不同组合,深度学习,CNN和各种图像处理技术及其相关的优缺点已经讨论。在这项研究中,我们系统地回顾了最近的研究由各种各样的学者和研究人员的真菌和细菌病害检测和分类,总结了基于作物利用的重要参数如类型,深度学习/机器学习架构,数据集用于试验,性能矩阵类型的疾病检测和分类,模型精度达到最高。按照分析,基于机器学习的分类方法,研究利用实域植物叶子图像和30%的70%利用实验室条件疾病分类在植物叶子图像基于深度学习方法的情况下,55%的研究从PlantVillage laboratory-conditioned图像数据集,使用25%利用实域图像,20%使用开放的图像数据集。平均精度达到与深度上优于方法相当高98.8%相比,基于机器学习方法在92.2%。基于深度学习的方法,我们也分析了pretrained的表演和从头训练模型,用于各种研究植物叶子疾病分类。Pretrained模型执行更好的分类精度为99.64%而从头开始训练模型实现了98.64%的平均精度。我们还强调了一些重大问题在计算机应用中遇到疾病检测和分类方法用于文学和提供建议,帮助和指导研究人员探索新的维度识别作物疾病。

1。介绍

农业是一个关键的收入来源对于大多数印度人居住在偏远或semiurban地区(1]。同时,农业部门大大有助于印度经济。作物的感染可能导致显著降低作物产量以及质量(2]。因此,早期疾病检测、预防和管理非常重要。在当前阶段,各种计算机自动建立疾病检测系统已经提出的几位研究人员3]。现代农业的时代是不断变化的,可分为两个时期:1943年到2006年,当深度学习和阈值的概念被引入,第二从2012年到现在。在第一的进化,众多创新发生反向传播,链式法则,Neocognitron,和LeNet(手写文字识别),在第二阶段,各种未来深度学习架构,像AlexNet VGG, ZFNet, GoogLeNet, ResNet, SegNet, YOLO,意思U-Net,快速R-CNN,和面具R-CNN已经提出了许多应用程序(如图像识别,无人驾驶汽车,和医疗保健4),他们的表现进行了分析使用不同的性能矩阵如准确性、精度、召回和F1-score。

很多研究已经完成在过去的几年里,利用各种图像处理技术与不同深度上优于模型在多种植物病害,其中有些是描绘在图1品种的数据集。工作时遇到了一些问题深度学习/机器学习模型:大部分(约80.00%)的研究利用laboratory-conditioned数据集PlantVillage数据集,训练和评价的目的。模型被开发使用图片,生成在实验室,通常不能概括(非常少精度比laboratory-conditioned图像)实域图像(5]。其他问题如下,例如:实域背景植物照片可以很复杂,这可能会严重影响性能的模型被使用;有时候,功能可能不可见或可能重叠与其他特性,所以在这种情况下,适当的特征提取和选择是一个重大的挑战6]。除了作物疾病的分类和诊断,疾病严重程度的测量水平更重要的早期疾病检测和补救措施(7]。

在这项研究中,我们编译和分析最近的一些深度学习——植物病害诊断和基于机器学习技术。我们也遇到重大问题突出。疾病检测的挑战已经在很大程度上克服由于革命的出现模型/架构在植物病害检测的领域,但是,也存在一些问题,如缺乏实域图像数据集,数据注释和prelabeling早期疾病检测、精确的感染区域/症状识别、和提取在不同疾病之间的相似症状的情况下,精确的级间严重性评估,深度学习效率模型被使用(8]。发明方法精制精度在实域图像非常重要农作物保护和疾病诊断,这样潜在的问题可能是可以避免的。

以下是其他研究结构:我们总结了植物病害检测的一般方法和分类在第二节;负责植物病害的主要因素的轮廓在第三节;的文献综述进行机器学习和深度学习模型是在第四节,我们得出V节的具体建议。

2。一个简短的介绍植物病害识别和分类

计算机视觉是人工智能的子域名,允许机器假冒人类视觉系统和使他们能够准确地画出来,检查,认识到现实世界的图像就像一个人一样。大多数增长领域,如医疗诊断、间谍、卫星图像,和农业综合企业,已经展示了计算机应用技术的价值。计算机可视化系统可以投入农业领域有效地检测和分类根据不同的疾病特性或植物病害症状中提取。计算机应用系统使用一个定义良好的一系列步骤从图像采集了各种图像处理任务,包括缩放、滤波、分割、特征提取和选择,最后,检测和分类是通过机器学习或方法基于深度学习(9]。图2描述了完整的程序所使用的大多数计算机应用技术来识别和植物病害进行分类。

3所示。负责植物病害的因素

广泛的农业植物的疾病,可以发生在不同的阶段的发展和伤害可能导致有害的植物的生长影响整体作物生产。有许多因素负责植物病害在不同发展阶段的植物。如图3,作物疾病的因素分为两大类:一是生物因素和非生物因素。生物因素,如病毒、真菌、细菌、螨虫,蛞蝓发展由于微生物感染植物而非生物因素对植物造成伤害增长由于环境因素像水、温度、辐照、和营养缺乏症。

4所示。文献综述

我们最近的探索各种计算机应用植物病害检测和分类算法在这个研究。算法在调查中被分为两大类:机器学习(毫升)和深度学习(DL)。第一部分文献综述总结了基于机器学习的技术和基于第二部分总结了深学习技巧。我们还提出了一个比较分析的研究算法以表格形式。

4.1。基于机器学习技术

本节描述最近的基于机器学习植物病害检测和分类技术。

通过结合moth-flame优化技术的部署与粗糙集的概念,一个番茄植物病害检测技术提出了(10]。moth-flame与粗糙集的结合有助于提高该算法的准确性,和性能评估反对使用粗糙集算法和遗传算法。Ref。6)提出了一个患病的图像分类方法,首先将输入图像分成superpixels,然后,一个 - - - - - -意味着聚类算法应用于提取每个superpixel损伤图像,形成集群。分割后,特征提取的三个元素的颜色每个分段损伤图像,用于进一步病叶识别任务分类模型。遗传算法叶色叶疾病识别和分类方法引入图像分割(11]。本研究进行了分类任务两个步骤:首先,它分类使用 - - - - - -意味着通过最小距离聚类标准,随后,第二阶段利用支持向量机分类,其分类精度从86.54%上升到95.71%。神经网络分类器:径向基函数神经网络(时滞)大小,两次水稻疾病的检测和分类,命名稻瘟病和棕色的点,提出了(12]。研究首先使用了主成分分析(PCA)算法来减少输入图像的尺寸,然后,特性,如颜色、形状、纹理和病变的水稻的叶子中提取的疾病检测和分类使用时滞分类器,大小和性能评估使用精度,精度和召回指标。Ref。7]讨论了疾病的分类和严重程度测量黄瓜叶子。在这方面,首先,通过预处理输入图像质量增强,然后,细分是通过完成的 - - - - - -意味着算法。分割图像然后通过机器学习技术,用于分类和严重程度是衡量使用受损面积除以总植物的叶子。Ref。2]讨论了资讯和ANN-based爆炸水稻疾病诊断和分类技术。输入图像分割使用 - - - - - -意味着集群,然后适当的参数如均值、标准差,能源、同质性、熵和灰度同现矩阵应用灰度共生矩阵建立()从分段检索图像。这些分段特性被应用于资讯和安疾病分类的分类器。结果表明,ANN优于资讯。

Ref。13)提出了一个极端学习机(ELM)算法在番茄白粉病疾病分类数据集(TPMD)不平衡数据集。平衡数据集,研究人员使用四个不同重采样技术。如结果所示,榆树算法运行不平衡和平衡的数据集,使用分类精度和性能评估和AUC曲线。算法更好的性能平衡的数据集,在四个重采样技术,极端学习机(ELM)算法优于重要性抽样(IMS)的分类精度为89.19%,AUC的88.57%。Ref。14]讨论了胶囊的应用网络对马铃薯叶片两种疾病的分类(早和晚疫病)在马铃薯植物。PlantVillage数据集使用的研究,和获得的结果进行了比较与一些pretrained models-ResNet18, VGG16, GoogleLetNet,也在同一数据集训练。结果表明,胶囊网络(CapsNet)做得更好的准确性达91.83%,比pretrained CNN模型。Ref。15)概述了应用支持向量机和逻辑回归分类器在番茄白粉病病数据集的实时数据。在应用混合SVM-LR分类器之前,它首先使用随机采样过密和平衡数据集,之后,将数据集划分为训练(70%)和测试(30%)的数据集。拟议中的SVM-LR分类器应用于两个阶段——第一阶段包括降噪,由支持向量机进行自适应sampling-based降噪(ANR);在这之后,逻辑回归(LR)是应用于修改后的数据集在第一阶段生产疾病分类。此外,该方法的性能可以得到改善,通过融合特征选择和优化技术。Ref。3),仅基于颜色特征,提出了一个水稻疾病检测和分类模型。在这方面,七个输出入学6类和一个健康的阶级被视为疾病。七个不同的分类器的功效,如支持向量机,判别分析,然而,摘要,决策树,随机森林,和逻辑回归,对性能矩阵,准确度、灵敏度、特异性,AUC,中华民国,F1-score,也是比较和评估。SVM优于所有分类器分类精度最高的94.65

以下4.4.1。表1分析

总结如表1,各种类型的植物文化像西红柿、香蕉、黄瓜、苹果、玫瑰、芒果、柠檬、土豆和大米与不同的数据集已经被各种调查研究人员识别和诊断使用机器学习(ML)技术。在下一节中,我们有一个parameter-wise分析表1

图中所描绘的一样4- - - - - -7和表2- - - - - -5,我们进一步分析了参数比如作物类型,类型的分类器使用,数据集使用的研究,所获得的最高精确度的分类器。这parameter-wise分析后,我们可以得出这样的结论:大部分研究总结在表1正在进行番茄或大米植物和利用PlantVillage数据集实验目的。大多数机器学习——基于(ML)的方法采用支持向量机(SVM)或 - - - - - -意味着分类器进行分类。

大多数ML-based实域图像数据集分类方法用于训练和测试的目的。但实域图像数据集是有限大小的使用可能会影响模型的训练。所以实域图像数据集的另一个问题是数据集的大小。这些ML-based方法的准确性,使用某种形式的分割/集群作为预处理步骤是完全高于其他人。所以,适当的分割等预处理步骤可以显著提高输入的质量,可以提高分类器的性能。

4.2。基于深度学习的方法

这部分的文献综述概述了最近总结不同深度上优于算法,实现了植物病害检测和分类在最近一段时间。

AlexNet、AlexNetOWTBn GoogLeNet、OverFeat VGG五CNN模型,尝试在一个开放的数据集包括约87848的25种不同作物图像58(植物、疾病)对不同的类,和他们的表现进行了分析。两个模型VGG和AlexNetOWTBn成功率最高的选择对真实图像进一步的培训和测试。结果显示,一些初步结果与实际条件数据表现显著的性能减少(25 - 35%)和模型训练时表现更好真实图像和测试实验室的图像。在所有的模型测试,VGG最大的成功率99.53% (8,16]。在这项研究中,两个CNN基线模型,ResNet50和ResNet50聚合非成象的上下文信息,被训练和测试数据集的千百个现实条件的图像具有17五种不同作物的疾病通过手机拍摄。模型首先对准ImageNet数据集,然后,他们对实体条件重新训练和验证数据集开发与这些pretrained初始化权重。结果显示,模型的性能类似的大型数据集与多种作物和分割数据集不同的作物。Ref。5)提出了植物病害诊断CNN-based模型利用对象检测架构与VGG16 ResNet50, MobileNet ResNet101,快R-CNN R-CNN面具。快R-CCN用于疾病检测和面具R-CNN分段的病变区域的影响。这项研究还与对象检测不同的注释机制使用。标签是用于快速R-CNN和LabelMe R-CNN面具。ResNet101有最好的检出率,但最需要的培训和测试时间,而MobileNet最快的时间比ResNet101但不精确。所以,基于场景,可以选择最好的模型。裁判。17]分析了深度学习模型的使用植物病害诊断和发现的一些挑战和影响因素模型的有效性。其中一些因素相关研究中使用的数据集,以及其他固有的植物疾病。Dataset-related问题仅限于带注释的数据集,症状表现,协变量转变,图像背景和捕获的条件。相比之下,内在问题的因素包括系统分割、症状变化,同时障碍和疾病有相似的症状。所有提到的因素会显著影响性能如果不妥善照顾。Ref。18CNN)概述了应用模型PlantVillage数据集的识别疾病的各种类型的植物包括苹果,葡萄,玉米,番茄。增强的数据集也适用于在不同阶层之间保持平衡。Ref。19)提出了一种植物叶子图像分类的方法,首先使用一个精明的边缘检测边缘检测器,然后将检测到的边缘使用浅CNN分为两类:背景边缘或植物边缘。之后,它进一步subclassifies植物边缘分为三类:植物边缘,叶边缘和内部图像噪声。它进一步提出分割边缘转换成叶子图像用于叶数的目的。该方法可以很有效的CNN二进制分类(背景分割)。Ref。20.)做了一个全面的列表的各种深度学习模型用于作物疾病诊断在最近一段时间,比较评价自己的长处和缺点。研究主要分类识别模型分成两个几个类型还没有与可视化技术和可视化和另一个突出的一些可视化技术用于识别症状。

在[21),分类不同的番茄植物疾病,深度学习体系结构与集成的鲸鱼优化算法和实验PlantVillage图像数据集。该方法首先应用一个炎热的编码分类数据的图像转换成二进制数字(0或1)然后PCA减少输入数据集的维数,选择预测最可接受的特性;鲸鱼优化策略被使用。网格搜索hyperparameter调优技术被用来优化hyperparameters性能优化。Ref。22ResNet50]讨论了应用程序为使用数据增加番茄植物病害分类和转换来生成一个大型数据集从给定的原始数据集来提高分类系统的性能并减少过度拟合的可能性。分类,模式分类两个阶段:在第一阶段,它分类叶的健康或不健康的,如果它是不健康的,它被列为第二阶段的疾病。Ref。23)强调了使用三种不同的CNN模型,AlexNet, SqueezeNet,《盗梦空间》V3,确定的程度在番茄晚疫病致病性早,中间,和晚期,利用几种类型的番茄叶片图像的数据集从PlantVillage数据集。为更好的性能,实现模型的在两个ways-feature进行提取和传输学习中多类支持向量机训练使用检索功能。最后,研究评估这三个模型的性能与参数,即。分类的准确性,意味着F1-score,和回忆。Ref。24)提出了一个通用的基于功能的疾病检测方法使用剩余网络ResNet50架构,进一步整合与疾病严重程度的测量基于比例疾病受损区域的温室番茄植物的叶子。通用特性使好的泛化的看不见的实例数据。研究还提出和比较不同模型的结果,由一个二进制分类系统生病和健康的叶子和另一个十类不同类型的疾病(9和1对健康叶)输出,训练和测试在不同的增强图像数据集。研究结果表明模型的二进制类(健康和患病)比十级模型,更好的泛化和病叶只能被其形状。而且,比例disease-damaged区域用于严重程度检测方法只适用于离散和局部症状,一般是由真菌和细菌等疾病。它不适合系统的症状,比如病毒症状进步萎黄病,叶卷曲,发育不良

在[25],研究提出了残余CNN上优于架构与集成的注意机制疾病识别番茄叶子PlantVillage数据集。这个架构提供更多weightage背景相关的功能分配更多的重量比其他不那么重要特性,显著影响的性能模型。这项研究使用了 - - - - - -SoftMax分类器对输入图像分类方法。最后,研究比较了使用5倍交叉验证进行的实验的结果PlantVillage数据集,三个CNN models-baseline CNN,剩余CNN,及残留attention-embedded CNN提供84%,95%,和98%的准确性,分别为(26]。四个pretrained CNN模型的有效性对番茄植物病害检测评估使用两个数据集:实验室设置和字段。绩效评估,研究8实验(4 pretrained参数和参数调整)使用10倍交叉验证。对于每个数据集,F1-score、精度、准确性、和回忆性能指标生成和比较。根据结果表明,所有四个模型表现得更好(10 - 15%更好)实验室数据集字段数据集相比,和在四个模型被提出,《盗梦空间》V3与99.6%和93.6%精度优于实验室和现场数据集,分别。Ref。27]介绍了CNN的一个应用程序分层疾病检测特征提取番茄叶子。应用分割和特征提取之前,先使用高斯滤波器从输入图像去除噪声。这种预处理后,CNN应用分类器,分类数据集分成两classes-healthy叶子或患病的树叶。根据实验的结果表明,CNN分类器执行比AlexNet和安。Ref。28)提出了基于视觉疾病的作物疾病识别方法独立于作物物种的特性。实验目的,三种不同algorithms-GoogLeNet VGG16,和《盗梦空间》V3-were训练和评估不同的意象的常见病种PlantVillage数据集本身,与转移学习和训练数据集的方法。根据结果显示,模型显示更好的泛化常见疾病数据集上看不见的病变的图像相比disease-crop策略,在三种模型中,VGG16表现。

Ref。29日)提出了EfficientNet深度学习架构是一个八口之家模型B0 B7、分类和检测植物病害与增加利用PlantVillage数据集。ReLU,而是建议模型拥有漂亮的小说激活函数。其他著名的结果相比,深度学习模型。模型的性能评估使用的参数如准确性、敏感性、特异性和精确度。结果显示,B5和B4模型优于合成精度98.84%和99.39%的原始和增广数据集,分别。Ref。30.想出了一个CNN-based模型是应用于PlantVillage和增加数据集,对植物病害识别和分类。实验九疾病和一个健康的类,与pretrained模型结果进行了比较和VGG16一样,《盗梦空间》V3, MobileNet。拟议的CNN模型优于91.2%的测试精度。

在[31日),首先,两个分割方案进行评估performance-U-Net和SegNet实际条件为背景去除图像数据集,并根据性能,U-Net捡起,其编码器阶段改变基于多尺度特征检索和命名为KijaniNet疾病。对pretrained建议的体系结构的性能评估模型。KijaniNet显示更好的结果比U-Net SegNet现实条件的图像数据集。Ref。32)提出了一个模型,检测植物病害包括分割和分类。研究首先使用提出分割有效地从葡萄中提取病斑植物叶子和也将他们从复杂背景图像,然后进行进一步的分类、分割画面放到CNN-based模型。应用分割预处理对疾病图像有助于达到更好的精度。

4.2.1。准备表6分析

6总结了parameter-by-parameter检查基于深入学习研究。从这个表格数据,我们进一步探讨了调查使用的类型的作物,性质和类型的分类器,数据表7,最高精度通过不同类型的分类器。深度学习的大多数——(DL)方法基于卷积神经网络(CNN)或CNN作为其基本模型的变种,见下表8检测和分类植物病害PlantVillage数据集(见表9和图8)。大部分的研究工作总结表6利用pretrained深度学习模型(见表8和图9)对番茄叶片图像(见表10和图10)分类,精度达到了99.64%的利用率pretrained深度学习模型(见表9和图11)。模型的性能,采用某种分割等图像预处理技术,过滤,或集成的上下文信息,以更好地隔离的病变区域形象或某种优化特征提取和选择、输入图像深度学习模型,相当高(约98.43和98.46,见下表9比其他的)。另一个值得注意的一点是,性能模型,利用实域图像相对较低(见表9和图11)。

与深度学习模型,还有有两点需要顾忌,我们应该有相当大的数据集的相关植物图像有效培训和推广实域图像。另一个是应该有某种图像预处理或优化启发式特征提取和选择有效地检测和段病变区域从输入植物叶子图像。

4.3。植物病害的检测和分类:关键问题

紧随其后的是一个详细的和最近的许多机器学习的关键研究——基于深学习方法用于植物病害识别和分类在文献中,我们总结了一些重要的挑战在作物疾病的识别和分类,使研究者的社区探索原因,可能极大地影响植物鉴别和诊断基于实时系统。一些因素和问题可能影响疾病的识别和分类;他们中的大多数下面列出:(一)植物病害检测系统的性能主要取决于疾病的特性,提取和使用的分类器类型(2](b)大多数的研究利用laboratory-conditioned图像数据集PlantVillage数据集而不是实域图像数据集。分类器的性能严重影响了使用的数据集用于训练和测试的目的2](c)背景去除和叶的病变区域图像的分割是至关重要的实域图像可能有不同的复杂背景,这大大影响性能的检测模型(18](d)受感染的面积和严重程度估计测量与检测任务可以用来控制农药的使用(23](e)它很难告诉如果工厂有感染或缺乏矿物质或营养37](f)因为植物可以在任何发展阶段的污染,所以早期疾病检测是至关重要的38](g)疾病模型用于实时检测的效率应该考虑在资源受限的设备上(24](h)大多数疾病症状没有明显的边界,而是融入正常组织,很难区分健康和生病的部分(16](我)不同的疾病可能同时创建不同的表现,所以很难确定,单独或组合成混合症状(多种疾病在同一叶片的共存)(21](j)适当的选择和调整hyperparameters有可能对性能有重大影响(32](k)计算机应用疾病检测和分类系统的性能深受图像获取、预处理、病变碎片,特征提取,分类器是利用(37](左)由于疾病的均匀性特征,受污染的区域,并选择适当的属性、疾病识别系统面临重大挑战(39]

5。结论和建议

计算机应用系统使用一个定义良好的一系列步骤从图像采集了各种图像处理任务,包括缩放、滤波、分割、选择、和提取特征,最后,基于机器学习或深学习算法用于识别和分类。我们还看了各种各样的当前研究基于机器学习或深学习算法用于识别和分析植物病害。此外,我们提出了parameter-wise解剖参数的使用的作物类型等分类器使用,数据集的本质,和最高精度通过不同类型的分类器。我们也提出了一些关于研究工作总结表的统计信息1- - - - - -6通过表2- - - - - -5、表10- - - - - -9,数据4- - - - - -8。我们提出了一个系统分析最近的基于机器学习或深学习研究植物病害检测和分类。根据我们的调查,53%(见图10)的深度上优于植物叶子图像分类研究利用pretrained模型,和大约33%的研究利用某种分割或与深度学习模型优化的性能改进。在基于机器学习方法的情况下,70%(多数)研究采用实域图像,而在深层上优于方法,多数(55%)的研究利用laboratory-conditioned PlantVillage数据集的照片。机器学习和深度学习模型的表现实域法师上不如那些laboratory-conditioned图像和深度学习模型实现更高精度(99.64%)相比,机器学习模型(95.71%)。所以,深度学习模型是一个更好的选择对于图像分类任务相比,基于机器学习的方法。但有些问题仍未解决机器学习和深度学习模型的性能严重依赖于底层模型用于分类的训练目的,和大多数的研究在文献中使用laboratory-conditioned图像数据集PlantVillage数据集和UCI机器学习库。模型训练laboratory-conditioned图像数据集通常不给好的泛化实域图像。因此,对于更好的泛化real-conditioned病变的植物叶片图像,研究人员应该首先收集足够数量的real-conditioned图像模型的训练和测试。同时,质量和数量的相关特征送入模型影响模型的性能在很大程度上。如果一个是使用一些深度学习模型,然后,我们建议使用适当的分割技术有效段病变只从整个叶子图像并提取相关特征的分段的病变。这可能有助于提高性能和减少无关的输入特性。

我们还强调了一些重要的问题与植物病害识别和分类,对模型的性能产生重大影响。这项工作将有助于研究团体理解可能显著影响性能的因素,和研究人员将指导调查新的疾病在农业方面识别和分类区域通过基于实时系统。

数据可用性

研究相关的数据可以从相应的作者((电子邮件保护))要求。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究得到了科技部(DST),印度政府,新德里,在跨学科Cyber-Physical系统(icp)项目(项目倾斜”的应用在农业物联网(物联网),“参考编号t - 319)。