研究文章|开放获取
华敏赵、削弱徐Olarewaju Lawal, Shujuan张, ”根据CNN甜瓜成熟阶段分类模型”,机器人杂志, 卷。2021年, 文章的ID8828340, 12 页面, 2021年。 https://doi.org/10.1155/2021/8828340
根据CNN甜瓜成熟阶段分类模型
文摘
如何快速、准确地判断甜瓜的成熟消费者和甜瓜排序员工是很重要的。本文提出一种新颖的方法来解决在温室甜瓜成熟阶段分类的困难和其他复杂的环境。甜瓜的颜色特征作为成熟的主要特征的歧视。修改29-layer ResNet应用提出了双向数据扩增方法的成熟阶段甜瓜分类使用室内和室外数据集来创建一个健壮的分类模型,该模型可以更好地推广。结果表明,代码数据增加第一种方式引起性能下降超过输入图像augmentation-the第二种方式。这个代码的有效性建立数据增加相比,图像增强。然而,双向数据对应包括户外和室内的组合数据集来创建一个分类模型揭示了一个很好的表现F1得分∼99%,因此该模型适用于计算机平台快速甜瓜成熟阶段的分类。
1。介绍
甜瓜果实提供必需营养素和几对人健康的好处。它成熟更快在潮湿和温暖的天气比在凉爽的条件。甜瓜果实的颜色由绿色变为黄色在成熟阶段,使视力受损的人很难,超市或杂货店工人,农场工人,孩子等等分类他们的成熟阶段。一般来说,各种各样,不规则的形状,颜色和纹理特征一直是一个相对复杂的问题与水果相关的分类(1]。例如,水果的目视检查需要训练有素的雇主熟悉水果的独特特征的分类(2),这是劳动密集型和相对昂贵。因此,一个分类模型,该模型适用于手机和自动分拣系统需要取代传统的分类方法。这将促进自检,快速检查,包装,和甜瓜的交通系统。
深度学习与卷积神经网络(cnn)是一种工具广泛用于图像分析和图像分类,无论他们允许识别和检测对象定位在一个图像。此外,它可以自动提取复杂的特性和直接从输入图像(3]。Anatya et al。4CNN)用于研究苹果的成熟度分类模型,芒果,和其他五个水果。分类结果的准确性50图像的检索精度值的88.93%。Saranya et al。5]研究了香蕉成熟的分类方法基于CNN。CNN模型训练整体验证的准确性为96.14%。你等。6]研究番茄检测和基于Fast-RCNN成熟度分类模型和RGB-D图像,检测精度达到92.71%和91.52%成熟度分类精度。刘等人。7还研究了番茄的成熟度分类模型。越剧et al。8)研究了基于yolov2检测不成熟的芒果。此外,Parvathi和泰米尔Selvi [9]。研究了椰子的成熟度分类模型,黄花梨(10],新鲜的茶拍摄[11),和其他农业产品通过使用深度学习的方法,取得了良好的精度。上述研究结果表明,深度学习在水果成熟度分类性能优良。CNN架构由卷积层、汇聚层,ReLU层,层完全连接层和损失。CNN的核心区块是卷积层,由过滤器(或内核)检测不同类型的功能从输入图像,后来通过前进。池层是放在中间连续卷积层减少参数的数量和计算网络中,而ReLU层的激活函数集负值为零。完全连接层(平)形式最后几层网络中通过卷积或汇聚层的输出结果达到一个分类的决定。最后,损失层应用于显示预测之间的偏差(输出)和真正的标签。CNN的影像分类方法如AlexNet [12],VGGNet [13],ResNet [14)等主要用于提取功能,从而实现精度有时超过人类层面的表现。这些图像分类器分类图像中单个对象,输出一个类别每图像匹配的概率,给一个类(15]。最近,钟和大16]报道95%的准确率在水果360数据集产生基于EfficientNet [17pretrained CNN)。Duong et al。18还利用EfficientNet和建立基于水果的水果识别系统运行360。在相同的数据集,伤和Oltean19)实现了99.31%的平均性能精度对训练集和测试组十个不同的CNN配置93.59%的准确率。然而,深度学习探索性研究甜瓜成熟阶段很少。
他等。14开发了先进的ResNet,介绍跳过连接或快捷键连接,如图1为更深层次的CNN解决从饱和精度下降。1×1卷积层添加到网络的开始和结束。,连接(参数)可以减少的数量,而网络的性能不退化。ResNet由卷积和身份块和也使用批处理规范化(20.]。ResNet也是一个优秀的图像分类网络,语义分割和对象检测与VGGNet相比,GoogLeNet [21)等不同的ResNets包括ResNet34, ResNet50由2600万参数,ResNet101 4400万101层的参数,和ResNet152 152层。与此同时,ResNet50和ResNet101是广泛应用于目标检测模型。王等人。22)使用ResNet和ResNeXt检测蓝莓的内部机械损伤用高光谱透射率的数据类型和实现F1分数,平均精度为89.52% / 87.84% / 89.05%和88.44%,分别为ResNet / ResNeXt。Mahajan和Chaudhary23]探索ResNet图像分类分类和18-layer CNN报道93.57%的准确率比34-layer和50-layer CNN在91.58%和92.67%,分别。然而,很少研究提供双向数据增加甜瓜的分类基于ResNet阶段。第一种方法是一个CNN代码扩充,而第二种方法是输入图像增强。
在深度学习,需要一个有效的数据扩增方法更多的学习数据为了获得一个更好的,好地实现模型。这个数据扩增方法是基于可能的相机捕捉到的图像的方法。尽管数据扩增方法可能造成精度下降,他们构成了一个数量的增加和减少过度拟合训练数据。Mikołajczyk和Grochowski24)提出了改进数据增加深度学习在图像分类问题,验证三个医学案例研究,虽然土屋et al。(25道路伤害的分类实验结果测试和检测表明,数据扩增方法可以有效地提高精度和有效。然而,研究涉及CNN-ResNet应用双向数据增加甜瓜分类是有限的。因此,探索深度学习在甜瓜成熟阶段的分类是甜瓜自动分拣系统具有重要意义。
本文的主要目的是创建一个健壮的分类模型,可以更好的推广室内和室外甜瓜成熟的阶段,可以适用于移动电话、自动分拣系统,等等。提出了双向数据扩增方法对甜瓜的成熟阶段分类使用室内和室外数据集分类模型。甜瓜的颜色被用作特色的成熟阶段。独立数据扩增方法应用到每个类的数据集包括CNN代码扩充为了展示分类有效性通过修改ResNet29架构的应用程序。获得的实验结果显示一些有趣的现象对甜瓜成熟阶段分类。
2。材料和方法
2.1。数据集的准备
甜瓜的图像识别成熟阶段和使用了数码相机的分辨率3968×2976从Wanghaizhuang村庄,Houcheng乡、山西省,中国正在建设县。“xingtian-24”“甜瓜的样本在不同成熟阶段的同一品种温室没有缺陷。甜瓜果实的成熟阶段,由绿色变为黄色被归类为0:绿色,1:白色,和2:黄色。从温室称为户外收集的图像数据集大小416×416像素,训练集划分为75%,20%有效的设置,根据每个类和5%的测试集。完成户外图像捕获后,甜瓜果实收获和发送到实验室室内图像捕获。的Shengyue SY8031自动对焦摄像头和5500 k LED灯是用于室内图像采集,如图2。为了防止颜色偏差时采取图片,相机的白平衡调整LED灯。与此同时,一块黑布表面的扩散是一个可调升降台的照相馆,然后甜瓜被放在桌上,在正面和背面图片被抓获。捕获的原因室内图像是一个真正的图像与背景分离的甜瓜为适当的分类。户外数据集一样,室内训练集数据集也分为75%,20%的有效设置,和5%的测试集,表1提供户外和室内数据集的细节,和相应的样本图像如图3。完成的表格1数据集,为户外训练集数据集添加到室内数据集在相应的类中。同样的过程也适用于有效集和测试集。这是提高模型对室内和室外使用。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
(一)
(b)
(c)
本研究应用双向数据扩增方法来提高分类模型的通用性,以便了解更多强大的功能。第一种方法使用CNN代码增加显示在表中2从Keras-ImageDataGenerator26]。与此同时,第二种方法增强随机输入的图像数据集通过十三个图像增强方法(27的三层所表3并显示在图4。图像增强方法增加75%的训练集户外和室内数据集。选择图像增强方法基于相机的图片可能的方法和各种环境条件分类模型可以操作。主要的想法是创建一个健壮的分类模型,可以更好的推广,可以适用于计算机平台。所有图像对应的数据集提出了表4包括增强室内和室外合并后的数据集的数据集。室内和露天数据集进行了以同样的方式如表所示1。最后,室内数据集(表1在A-out-indoor)添加到相应的数据集(表4)来创建所有数据集表所示5。
|
||||||||||||||||||||||
|
1来源:ImageDataGenerator [26]。 |
||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||
|
1来源:imgaug [27]。 |
||||||||||||||||||||||||||||||||||
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
(j)
(k)
(左)
(m)
(n)
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||
2.2。ResNet架构
的想法ResNet采用基于其跳过层之间的连接,将输出从先前层添加到输出的堆叠层。根据(13),更深层次的培训网络构成分类性能的增加。29-layer ResNet使用本文解决退化问题的网络,加快训练速度,促进网络收敛越快。图5详细展示了修改后的29-layer ResNet。ResNet 29-layer选择基于输入图像分辨率128×128像素流入网络损失及其收敛性和精度达到优异成绩(28]。值得注意的是,最后完全连接层扮演了一个角色作为分类器,计算并输出甜瓜的分数。
2.3。模型训练和评估
分类模型的训练和测试是在Windows上10以下规范:英特尔®™核心i7 - 8700 @ 64位3.20 GHz CPU, 16 GB的RAM, NVIDIA方形住宅区M4000 GPU, CUDA v10.2, cuDNN v7.6.5。ResNet收到一个输入图像大小为128×128×3。随机梯度下降法(西班牙)优化器采用在这项研究中,因为它需要更少的内存和计算一次只有一个点。西班牙的学习速率优化器被设置为1×10的一个常数−2,0.9和势头直言叉作为一个成本函数。此外,表中提到的代码扩充方法2模型中包括网络。模型训练50时代根据构造数据集和结构如图6。图6显示了14个数据集训练。与代码意味着网络用于训练数据集包含表2信息,而数据集,其中包含一个前缀(−)意味着与图像增强(表3)。分类器的性能是评价使用方程(1)。精度是正确的数量的比率预测甜瓜的总数预测甜瓜,召回的数量的比例是正确预测甜瓜在数据集,甜瓜的总数F1分数之间的权衡是回忆和精确显示训练模型的综合性能。 TP是真阳性,FP是假阳性,TN是真阴性,FN假阴性。
3所示。结果与讨论
3.1。评价指标
有效集的获得损失率曲线类似于训练集,错误在50岁时期较低,表明户外和室内甜瓜的高稳定性。户外的图7(一)和室内图7 (c),没有代码,显示了性能优良的有效准确性与最低有效损失近100%。混淆矩阵的分类结果还显示一个优秀的性能预测100%的数字7(一)和7 (c)0是绿色,1是白色,2是黄色的。然而,图的性能7 (c)比这更稳定的图7(一)由于他们的形象特征的背景不同。代码扩充到网络的结合构成了低稳定性数据中找到7 (b)和7 (d)错过了预测相应的混淆矩阵所示。尽管如此,图7 (d)比图更稳定吗7 (b)。这是由于不同的背景图像。获得的结果图8趋势同样如图7,除了图8包含图像增强。错过了预测的数量在室内比室外的混淆矩阵图8 (c)>图8(一个)因为没有代码扩充和图8 (d)>图8 (b)因为代码扩充。这是一个迹象表明户外图像调整到外部特性或背景图像相比,室内图像。换句话说,双向对应的室外比室内进行。
(一)
(b)
(c)
(d)
(一)
(b)
(c)
(d)
同样,室外和室内数据集的结果没有图像增强显示,它可以更好地执行的混淆矩阵结合室外和室内数据与图像增强。除了图9(一个)没有代码和图像增强显示100%预测,错过了预测图的数量9 (b)<图9 (c)<图9 (d)。这进一步证实了双向对应构成性能下降。参照混淆矩阵获得的结果,代码增加引起的性能下降超过了图像增强。图10对所有数据证明代码扩充的效果相结合,在错过了预测图中观察到的数量10 (b)更比图10 ()。此外,增加的代码负责图像增强相比更不稳定。然而,所有的数据集的结果可以很好地概括甜瓜成熟阶段的分类。
(一)
(b)
(c)
(d)
(一)
(b)
的平均性能结果精度、召回和F1得分表所示6。的F1分室内和室内数据集有或没有发现代码增加100%比其他数据集。这解释说,提取的图像特征没有背景中发现室内,在室外和室内组合称赞每个室内数据集的结果。没有代码扩充F1分数的数据是100%,而代码扩充F1分不同的数据集的数据集。最少的F1分数为95%,注意到在室内增加代码,类似于图8 (d)结果。就像图10,所有的数据集显示一个优秀的平均表现。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.2。计算机应用程序
创建的模型从所有的数据集都进行了相应的测试集测试可视化的目的。图11显示了模型的可视化结果从所有数据集创建代码扩充。这个数字证明具有良好的预测性能。与此同时,创建了模型转换成模型。tflite model_unquant。tflite使用TensorFlow和Keras为移动应用程序包。图12从所有的数据集创建转换模型的结果与代码扩充。图12(一个)显示绿色的甜瓜,图12 (b)显示白色的甜瓜,图12 (c)显示黄色的甜瓜,和图12 (d)显示测试的分类的推理时间转换模型。这是一个迹象表明,我们的模型是适用于任何计算机应用程序。除了移动应用,计算机基础也可以应用程序交互与电气、机械系统等等,以执行其他任务自动分拣系统等。
(一)
(b)
(c)
(d)
3.3。与其他模型相比
表7显示了测试的结果模型创建的表中所有数据集6。比较结果表明我们ResNet29模型比其他模型。的F1得分ResNeXt50、Densenet121 InceptionV4类似ResNet29为99%,但与一个更大的模型的大小。如果模型规模大,它将消耗更多的计算资源,缓慢的速度模型。同时,MobileNet-v2模型的大小小于ResNet29模型,但其测试结果是我们ResNet29不如。因此,我们修改ResNet29模型具有更多的优势比其他模型甜瓜成熟阶段分类。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4所示。结论
甜瓜成熟阶段的颜色变异使视力受损的人更难,超市或杂货店工人,甚至是农场工人进行分类。提出了双向数据扩增方法对甜瓜的成熟阶段分类使用室内和室外数据集来创建一个健壮的分类模型,可以更好的推广。采用改良ResNet 29层创建分类模型。结果表明,代码增加(第一)引起的性能下降超过图像增强(第二种方式)。这是说代码增加是在构建一个健壮的模型更可靠的比图像增强呼吁未来分类方法的调查。然而,双向数据对应包括户外和室内的组合数据集显示一个优秀的性能F1分数∼99%,适用于计算机平台快速甜瓜成熟阶段分类,比如移动电话应用程序等等。
此外,尽管本文提出的模型可以实现更好的分类效果的甜瓜成熟,它需要配合使用的对象检测算法更好的自动排序/选择设备。摘要甜瓜目标检测算法没有提及,在未来需要研究。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究是由山西大学科技创新项目,中国(项目没有。2019 l0402),山西农业大学博士研究项目(项目号2018 yj43),优秀的医生山西省晋工作奖励基金研究项目(项目号SXYBKY2018030)。
引用
- f . Garcia-Lamont j·塞万提斯,s·鲁伊兹和a . Lopez-Chau”颜色特征比较机器的水果识别,建立”智能计算理论和方法卷,92年,第270 - 258页,2015年。视图:出版商的网站|谷歌学术搜索
- e . o . Olaniyi好Oyedotun, a . Khashman“智能评分系统对香蕉果实使用神经网络仲裁”食物的过程工程》杂志上,40卷,不。1,p。9日,2017。视图:出版商的网站|谷歌学术搜索
- a·柯伊拉腊k·b·沃尔什和c·麦卡锡,z . Wang“深度学习——方法概述和审查使用水果检测和产量估算,“计算机和电子产品在农业卷,162年,第234 - 219页,2019年。视图:出版商的网站|谷歌学术搜索
- s . Anatya v c . Mawardi j . Hendryli et al .,“水果成熟度分类使用卷积神经网络方法,”IOP会议系列:材料科学,卷1007,不。1,文章ID 012149, 2020。视图:谷歌学术搜索
- n . Saranya k Srinivasan, s . Kumar“香蕉成熟阶段标识:深度学习的方法,”环境智能人性化计算杂志》上,1卷,2021年。视图:出版商的网站|谷歌学术搜索
- 你,薛y, y, h .广域网和l .毛”检测的激情水果和成熟度分类使用红绿蓝深度图像,”生物系统工程卷,175年,第167 - 156页,2018年。视图:出版商的网站|谷歌学术搜索
- j . j . Liuπ,l·r·夏”小说和高精度番茄成熟度识别算法基于多层次深残余网络,”多媒体工具和应用程序,卷79,不。13 - 14日,第9417 - 9403页,2020年。视图:出版商的网站|谷歌学术搜索
- x越剧,h . Ning, t . Shuqin et al .,“不成熟的芒果检测基于改进YOLOv2,”中国农业工程学会的事务,34卷,不。07年,173 - 179年,2018页。视图:谷歌学术搜索
- Parvathi和s .泰米尔Selvi”检测的成熟阶段的椰子在复杂背景使用更快的R-CNN模型,”生物系统工程,卷202,不。6,119 - 132年,2021页。视图:出版商的网站|谷歌学术搜索
- c . y . h . j . Liu, w·汉et al .,“黄花梨的收获时间的确定基于可见近红外光谱学卷积神经网络,”光谱和光谱分析,40卷,不。9日,第2936 - 2932页,2020年。视图:谷歌学术搜索
- b .陈和j .严“新鲜茶拍摄成熟度评估通过多光谱成像和深标签分配学习,”IEICE——交易信息和系统,卷103,不。9日,第2022 - 2019页,2020年。视图:出版商的网站|谷歌学术搜索
- a . Krizhevsky i Sutskever g·辛顿,“ImageNet分类与深卷积神经网络,”先进的神经信息处理系统,25卷,不。2、2012。视图:谷歌学术搜索
- k . Simonyan和A . Zisserman”一个很深的卷积网络大规模图像识别,”2014年,https://arxiv.org/abs/1409.1556。视图:谷歌学术搜索
- k . x张,他任美国et al .,“深残余学习图像识别,”学报2016年IEEE计算机视觉与模式识别会议(CVPR)美国拉斯维加斯,NV, 2016年6月。视图:谷歌学术搜索
- a . b . Amjoud和m . Amrouch“卷积神经网络骨干为目标检测,施普林格,图像和信号处理。ICISP 2020。”在计算机科学的课堂讲稿卷,2020篇文章ID 4152816, 22页,2020年。视图:出版商的网站|谷歌学术搜索
- 砀t p c和d . v . Tai,“水果识别系统基于现代深度学习技术,”物理学杂志》的会议文章ID 012050卷,1327年,2019年。视图:谷歌学术搜索
- m . Tan和问:诉Le“EfficientNet:反思为卷积神经网络模型扩展,”2019年,https://arxiv.org/abs/1905.11946。视图:谷歌学术搜索
- l . t . Duong p·t·阮c . Di Sipio et al .,“水果自动识别使用EfficientNet和运行,”计算机和电子产品在农业,卷171,p . 2020。视图:出版商的网站|谷歌学术搜索
- h . Murean和m . Oltean”水果识别图像,采用深度学习”《数学Sapientiae Informatica,10卷,不。1,26-42,2017页。视图:谷歌学术搜索
- 约飞和c . Szegedy“批量标准化:加速深层网络训练通过减少内部协变量转变,”2015年,https://arxiv.org/abs/1502.03167。视图:谷歌学术搜索
- c . Szegedy诉Vanhoucke,美国约飞et al .,“重新考虑初始计算机视觉架构,”2015年,https://arxiv.org/abs/1512.00567。视图:谷歌学术搜索
- 胡m z . Wang, g .翟”应用程序准确、快速检测的深度学习架构内部机械损伤的蓝莓利用高光谱透射率数据,”传感器,18卷,不。4,p。2018。视图:出版商的网站|谷歌学术搜索
- a Mahajan和s Chaudhary”分类的影像分类基于表征深层网络(RESNET)”学报2019年第三国际会议上电子、通讯和航空航天技术(ICECA)2019年6月,印度哥印拜陀。视图:谷歌学术搜索
- a . Mikolajczyk和m . Grochowski”数据增加改善深度学习在图像分类问题,“国际跨学科博士研讨会卷,99年,第122 - 117页,2018年。视图:出版商的网站|谷歌学术搜索
- 土屋h, s .福井y Iwahori, y Hayashi, w . Achariyaviriya和b . Kijsirikul”的方法分类的数据增加道路伤害考虑对分类精度的影响,“Procedia计算机科学卷,159年,第1458 - 1449页,2019年。视图:出版商的网站|谷歌学术搜索
- 2020年,Keras-cn可用:https://keras-cn.readthedocs.io/en/latest/preprocessing/image/。
- Imgaug a . b .荣格,2020年,可以在:https://github.com/aleju/imgaug。
- h . AY和n . AY”整流器非线性改善声学模型,神经网络”机器学习程序的国际会议2013年5月,亚特兰大,乔治亚州,美国。视图:谷歌学术搜索
版权
版权©2021华敏赵等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。