检测和分类的早期腐烂在蓝莓基于改进深剩余3 d卷积神经网络在高光谱图像

文摘

最近,腐烂的蓝莓的自动检测在食品行业仍然是一个挑战。蓝莓皮表面上发生的早期腐烂,可能采取高光谱成像模式的可行性,检测衰退地区的蓝莓。改进深剩余3 d卷积神经网络(3 d-cnn)框架提出了高光谱图像分类,实现快速训练,分类,和参数优化。丰富的光谱和空间特性可以迅速从样本中提取完整的高光谱图像使用我们提出的网络。这结合了树结构Parzen估计量(TPE)自适应和选择超参数优化网络性能。此外,针对一些样本的问题,提出了一种新颖的策略来提高高光谱图像样本数据,从而提高训练效果。标准高光谱蓝莓数据集上实验结果表明,该框架与AlexNet GoogleNet相比提高了分类精度。此外,我们提出了网络减少了参数的数量减半,培训时间约10%。

1。介绍

蓝莓是全球流行的优秀的风味和较高的营养价值1]。最新鲜的蓝莓用于消费是精心挑选和长距离运输。损坏在运输将加速水果腐烂,减少整体质量(2]。因此,重要的是要确定烂从健康的蓝莓蓝莓去除低质量的供应链(从新鲜蓝莓蓝莓3]。

在当前工业标准,蓝莓的内部衰减通常被认为是由人类接触或通过观察蓝莓的黑暗腐败的组织(4,5]。蓝莓的腐烂的组织变得黑暗和明显,类似于黑色,和容易用肉眼观察。然而,它需要很多的人力和时间来确定衰减的程度,它将变得不准确经过几个小时的持续检查(6]。此外,检查效率很低,早期衰减并不准确的检验。硬度测量方法的发展加快了检测过程的水果质量评价,使水果分类更准确,包括蓝莓硬度和质地分析仪(7,番茄声脉冲响应测量8),基于频率共振和桃子检验方法(9]。这些方法可以提供更准确的硬度测量,但许多硬度测量技术需要直接联系水果,这可能导致损坏的蓝莓。

国内外一些研究人员利用无损检测技术,如机器视觉和光谱成像检测疾病或成熟水果(10),取得了不错的成绩。乔治娜et al。11]利用机器视觉技术来提取14类型的特性,比如颜色,形状,和纹理的柑橘,然后使用分类和回归树(CART),朴素贝叶斯(NB)和多层感知器(MLP)检测柑橘溃疡病,黑点,硬化。Lewers et al。12]利用机器视觉技术检测石榴疾病,在k - means和阈值分割方法被用于实验的病变区域提取石榴,并采用离散小波变换得到一组病变的视觉特征作为输入向量的支持向量机(SVM)模型,以确定石榴疾病。Lorente [13]使用光谱成像系统获得的高光谱图像声音,slight-decayed, moderate-decayed, severe-decayed桃子,阈值分割的方法来检测疾病的桃子,然后连续投影算法(SPA)六波长特征提取,建立了偏最小二乘判别分析(PLS-DA)模型来识别疾病,并进一步提高了识别速度的腐烂的桃子。王等人。14)也使用光谱成像技术获得的光谱数据感兴趣的区域,在五个特征波长排列测试方法,提取和多元偏最小二乘回归判别分析模型用于检测citrus-rot疾病由真菌感染引起的。王等人。15)使用光谱成像技术获得苹果的光谱数据。首先,阈值分割方法用于部分苹果病变区域提取高光谱数据;然后,采用连续投影算法来提取三个特征波长的波长;最后,一种改进的线性判别分析结合支持向量机和BP人工神经网络模型来检测苹果疾病。刘等人。16]运用光谱成像技术检测和区分裂缝,皮,畸形,隐藏的伤害,和正常的油桃果实。十个波长特征提取和十大主成分值是通过主成分分析。油桃的疾病领域被阈值分割提取。最后,主成分值和六个结构索引(意思是,对比、相关、能源、同质性、和熵)融合建立榆树模型检测和区分外部缺陷样品和完整的样品。

光谱成像技术覆盖的范围420 - 1000 nm是用来检测油桃果实在文献[17]。400年RGB图像通过共有400个样本,其中包括四种类型的缺陷特征和声音的特性。油桃果实的后获取高光谱图像光谱数据提取感兴趣的区域(ROI)。使用Kennard石头算法,各种样本随机分为训练集(280)和测试集(120)。首先,根据计算偏最小二乘回归(PLSR),波长497 nm、534 nm, 657 nm、677 nm、696 nm、709 nm、745 nm、823 nm、868 nm和943 nm被选为最佳的敏感波长(慢波睡眠),分别。随后,876纳米波长的形象被选为特性的图像;然后,主成分分析(PCA), Sobel边缘检测和区域生长算法进行了有缺陷的和正常的油桃提取缺陷区域。此外,十个主要组件(pc)选择基于PCA和7个结构特征变量(意思是,对比、相关、能源、同质性、和熵)提取利用灰度共生矩阵法应用灰度共生矩阵建立(),分别。最后,高光谱成像技术的能力测试通过使用极端学习机(ELM)模型。榆树分类模型的基础是建立在个人电脑和纹理特征的组合。 The results show the correct discrimination accuracy of defective samples was 91.67 %, and the correct discrimination accuracy of normal samples was 100%. The research revealed that the hyperspectral imaging technique is a promising tool for detecting defective features in nectarine which could provide a theoretical reference and basis for design in the classification system of fruits in further work [18- - - - - -20.]。

在上述研究,是否使用机器视觉技术和光谱成像技术,这种疾病领域的柑橘、石榴和其他中型水果需要分开正常区域。因为疾病区域的颜色特征明显不同与正常区域,这种疾病可以很容易地由阈值分割区域。然而,蓝莓的皮肤颜色是深色的,和正常和疾病区域的颜色特征很相似,所以很难段蓝莓疾病有效利用传统的阈值分割方法(15]。随着智能信号处理技术的发展,利用卷积神经网络(CNN),我们可以克服上述的缺点21]。CNN有非常突出的表现在机器视觉任务通过使用本地接受域模型来模拟人类大脑图像处理。例如,二维卷积神经网络(2 d-cnn)用于我的空间特征主成分乐队,和光谱特性融合的特征融合技术对图像进行分类(21]。在双通道CNN方法中,一维卷积神经网络用于光谱特征信息,提取空间特征信息,融合,分类2 d-cnn,也取得了良好的结果。然而,这些方法有一个缺点:在特征提取之前,主成分分析(PCA)和其他方法应该用于选择主成分乐队降低维度,否则太多的参数将被引入,这是困难的训练和优化网络。

3 d-cnn卷积核的优势在高光谱图像特征提取光谱信息和空间信息提取同步,使充分发挥三维高光谱图像的优势(22]。3 d-cnn特性模型直接提取的光谱空间特性高光谱图像的端到端,比2 d-cnn特性更好的分类效果。光谱spatial-based残余网络介绍了残余结构3 d-cnn网络和使用两个三维卷积核的光谱和空间特性来提取深特性,可以提高识别精度为霉菌蓝莓(23]。

现有3 d-cnn模型中存在一些问题,例如,网络层的数量通常是浅,hyperparameter优化耗时费力,和准确性需要进一步改善。解决上述问题,传统的高光谱三维卷积方法作了改进,以获得深功能较强表示,它结合了树结构Parzen估计量(TPE)自适应和选择超参数优化网络性能(23]。此外,针对一些样本的问题,提出了一种新颖的策略来提高高光谱图像样本数据,从而提高训练效果。

本文的贡献总结如下:(1)一种改进的深剩余3 d卷积神经网络提出了。模型的输入图像是原始高光谱图像,不需要降维方法,图像空间和光谱特征被保留。提取的特征是高光谱图像的更具代表性。它充分利用光谱和空间三维关联信息,而不只是他们的独立和独立的功能信息。(2)它可以避免引入过多的参数,防止过度拟合,提高计算效率;与2 d-cnn相比,3 d-cnn更适合高光谱图像处理任务。(3)丰富的光谱和空间特性可以迅速从样本中提取完整的高光谱图像使用我们提出的网络。这结合了树结构Parzen估计量(TPE)自适应andselects超参数优化网络性能。此外,针对一些样本的问题,提出了一种新颖的策略来提高高光谱图像样本数据,从而提高训练效果。

2。蓝莓及其光谱成像特性

由于本研究使用光谱成像模式检测腐烂的蓝莓的领域,这部分需要介绍蓝莓和光谱成像功能。蓝莓是一种典型的更年期的水果。在成熟的过程中,内部的物理和化学性质的水果是不断变化,逐渐改变颜色从绿色蓝色或深紫色,和蓝莓采摘时期相对集中。图1(一)显示了在果树新鲜蓝莓。因为在夏天采摘季节的温度高,果实采摘后很容易软化甚至布朗。在运输的过程中、存储和销售,他们也容易腐烂和疾病。因为水果的采摘时间的关键因素之一,导致水果的味道,提前采摘水果也会导致僵硬和酸味,影响果实的风味和价值,很难满足饮食需求;挑选水果太迟了会导致因而得以防止葡萄过度成熟,很容易恶化,方便储存,所以它不容易进行后续处理。图1 (b)显示了陈腐的蓝莓。因此,分拣蓝莓采摘后增加蓝莓的附加值具有重要意义。

(一)

(b)

高光谱成像技术集成了图像处理和光谱技术来获得高光谱三维立方体数据(超立方体)。高光谱数据立方体并不代表空间三维的图像。严格地说,高光谱图像应该是2.5 d图像数据。图像而言,大部分的数字图像通常是RGB(红、绿、蓝色)图像,是由三个基本的颜色。也就是说,RGB图像可分为红色、绿色和蓝色的组件,每个组件可以生成一个灰度图像。在数字图像、灰度图像由一个二维数据矩阵,和每个数据矩阵是通常被称为一个像素。例如,一个256×256 RGB图像,其实际数据存储大小是256×256×3,其中3表示其三个RGB组件。如果这三个组件扩展到成百上千的连续带,如100连续乐队,图像的数据将会扩展到256×256×100,这100是光谱的扩张,这使得图像添加丰富的光谱信息。的x和y高光谱图像代表其图像的像素尺寸。从图像尺寸如果你取一个点,这个点可以连接在光谱维的频谱。

3所示。深剩余3 d卷积神经网络

3.1。3 d卷积神经网络

2 d-cnn,经典的深度学习在图像处理,具有出色的性能在各种机器视觉任务,如图像分类、目标检测,和密集的字幕任务(24- - - - - -26]。2 d-cnn是特性的优势可以直接从普通图像中提取完整的端到端处理。2 d-cnn如图的结构2,在那里是卷积的大小在卷积层和内核l卷积的输出通道数层。卷积过程可以由以下方程: 在哪里是年代通道的数量;和分别卷积核的大小;和是线性系数。

每个通道都需要培训一个卷积内核在执行二维卷积处理。如果2 d-cnn直接使用在高光谱图像分类任务,会引入大量的参数计算,因为许多频道的高光谱图像。太多的参数不仅让网络更容易过度拟合,影响精度,而且大大减少了网络的训练速度和计算效率。

通常,为了解决这类问题,学者以降维预处理之前输入高光谱图像。例如,他们使用PCA方法提取3个主成分渠道的高光谱图像,使用随机PCA(随机PCA, R-PCA)保持10到30主成分频道,然后用2 d-cnn分类。因为2只d-cnn执行卷积操作空间和光谱维简单线性操作,这种方法的明显缺点是,它会导致光谱数据的损失,这将影响识别结果(27]。

不同于2 d-cnn 3 d-cnn卷积结构如图3,在那里和是飞机卷积核的卷积层和光谱维度,然后呢卷积的输出通道数层。该模型可以描述如下: 在哪里的光谱维卷积内核。

3 d-cnn算法,一个卷积内核维度比2 d-cnn,可以解决上面的问题,因为它具有以下优点:(1)输入图像的原始高光谱图像,而不需要使用降维方法,保留图像空间和光谱特性。(2)高光谱图像的特征提取更代表。3 d-cnn不同于2 d-cnn。飞机卷积,执行卷积操作空间和光谱维提取的特征的“光谱”结合高光谱图像。它充分利用光谱和空间三维关联信息,而不只是他们的独立和独立的功能信息。(3)它可以避免引入过多的参数,防止过度拟合,提高计算效率。假设卷积核的大小是3,高光谱通道的数量是200,和输出通道的数量是32,第一个2 d-cnn操作需要3×3×200×32 = 57600参数,和3 d-cnn操作需要3×3×3×1×32 = 864参数。

因此,相比之下,2 d-cnn, 3 d-cnn更适合高光谱图像处理任务。然而,随着网络结构的深化,消失梯度问题就会出现,会影响训练效果的深层神经网络,所以引入残差结构尤为重要。

3.2。剩余3 d-cnn结构

在深度学习,更深层次的网络结构,更准确的提取的特征和分类的结果就越好。然而,随着网络结构的继续深化,梯度扩散或爆炸在反向传播过程中,对网络训练造成坏的影响。后残余结构,提出了由于快捷键的存在,梯度是更容易和有效传播,这很好解决问题。为了建立一个更深层次的网络结构,本文还引入了残差3 d-cnn块卷积和设计剩余的3 d结构。

根据设计规则的卷积核的大小2 d-cnn,连续几个3×3卷积核卷积有相同的视野大内核,包含更少的参数和更少的更复杂的非线性特性。研究结果表明,3×3×3小卷积核是时空特性的最优选择学习的视频输入。此外,许多算法对CT三维图像检测也使用3×3×3卷积核,取得了良好的效果。因为高光谱图像和视频和CT图像平面图像信息和类似的三维数据结构,作为参考,本文设计卷积内核结构网络中用于光谱特征提取3×3×3的大小。

剩余回旋的结构块如图4。在本文的残余结构,有两种形式的捷径,一个是身份残块,其输入和输出尺寸保持不变,如图4(一)。另一种是卷积残块,不同的输入和输出尺寸。设计的目的是改变通道的数量。卷积形式使用的快捷方式l×l×l卷积核,不引入大量的参数,如图4 (b)。深化或并发症的网络结构必然会引入一些额外的hyperparameters,如每个卷积的卷积内核层的大小和数量的渠道,所以这些hyperparameters需要选择更合理。

(一)

(b)

为了提高计算效率,网络并不直接执行卷积操作与3的大小在每个卷积层输入但使用一个瓶颈结构,这将有效地减少参数的数量和计算复杂度。假设有256个特征作为输入,如果只有3×3×3卷积操作执行,256×3×3×3×256 = 1769472卷积操作必须执行;如果采用瓶颈结构,那么只有(256×l×l×l×64)+(64×3×3×3×64)+(64×1×1×1×256)= 143360卷积操作执行。瓶颈结构用于NIN GoogleNet, ResNet [12,28]。这种结构可以有效地降低计算复杂度,提高网络的非线性表达能力在一定程度上。

此外,一批标准化层(BN)介绍了卷积后层。BN可以有效地防止消失的梯度和梯度爆炸。虽然引入了额外的计算,它可以使整个模型的收敛速度更快。值得注意的是,网络使用ELU(指数线性单元)代替ReLU(修正线性单元)的非线性激活函数。虽然ReLU功能有很好的特点,广泛使用,当其存在的输入是负的,衍生品将成为0和不再变化,这将导致神经元死亡的问题,永远不会被激活。ELU函数来解决这个问题,提出了一种“软饱和”状态的部分小于0,不使导数成为0,从而保持神经元存活(29日]。

4所示。基于三维深度剩余模型检测和分类

网络的输入是一个三维数据矩阵3 d-cnn,这是通过将原始图像中的一个像素为中心及其大小年代×年代×L,l是高光谱图像通道的数量和S平面尺寸的大小。然而,大量的计算和识别精度由大小不同的视野范围也不同。根据准确率之间的权衡,操作效率,和其他因素,本文最后固定尺寸7×7在多光谱图像。

我们都知道,深度学习模型有两个优化任务。一是内部参数的优化,如神经网络权重的分配;另一种是hyperparameters的优化,如结构参数和神经网络的学习速率。优化hyperparameters深度学习一直是一个难点,如渠道的数量和卷积核的大小在方程(2);此外,体重也有选择初始化方法,正则化方法和不同的训练方法。设置这些参数需要丰富的培训经验,专业知识,和大量的实验。因此,TPE算法适应hyperparameter优化,介绍了用于快速选择合适的hyperparameters,和它更节省时间和节省劳力相对于手动调整hyperparameters。此外,训练效果也更好。

假设代表hyperparameters选择模型; 表示每个hyperparameter的选择域;然后,hyperparameter选择域模型的空间被定义为。当k用于hyperparameter倍crossvalidation方法 ,hyperparameters的优化问题可以表示为: 在哪里是在培训和损失函数吗和被表示为训练集和验证集样本,分别。

最近,最常用的hyperparameter优化方法仍然是手工搜索和网格搜索(暴力搜索),但他们的效率极低,所以hyperparameter优化一直是一个非常繁琐的过程。

TPE算法是一个连续的基于模型的全局优化算法(Smoa)。Smoa算法使用先前hyperparameters推荐下hyperparameters通过优化标准。不同的Smoa算法使用不同的优化准则。TPE算法以预期的改进(EI)为优化准则。在每次迭代之后,算法返回hyperparameter EI最好的选择。通过这种方式,通过持续推荐hyperparameters EI最好的标准,该算法可以找到最优hyperparameter速度比网格搜索。随机森林算法相比,TPE采用2概率分布来模拟后验概率,更好的建模策略和优势hyperparameter优化。hyperparameters的类型可以是整数和实数连续,例如,神经元的数量使用整数,辍学比例使用连续的实数,优化方法的分类器可以使用SGD, RMSProp,亚当,等等。

4.1。我们的模型结构

网络输入第一个提出的卷积核的卷积层l×l×7的步长l×l×2和最大池层与内核l×l×3的步长l×l×2。目的是为了减少渠道和提高操作效率。然后,两组残余结构单元的设计,每个单元是由两个卷积残余构造块。第一批剩余结构单元被设置l×l×3,其目的是提取和融合光谱特性;第二组的剩余结构单元被设置为3×3×3,用于提取高光谱图像的光谱特性。最后,全球池7×7×1层和一个完全连接层(FC)用于分类;每个隐层使用策略在文献[28卷积)初始化内核参数和调整规范的术语的。激活函数表示为指数线性单元,和亚当优化器选择训练我们的模型实验。

4.2。培训流程和算法框架

根据结构hyperparameters手动初始化,hyperparameters定义的搜索空间自动调整。有近10000的可能性在搜索空间。算法和TPE算法搜索50迭代使用相同的数据集。100时代被用于培训操作。最后,他们的识别准确率。选择最高的hyperparameter准确率的hyperparameter网络。

在本文中,将Softmax层作为分类器。因为它是优于其他分类器,如支持向量机(SVM)在处理multiclassification问题,它有一个广泛的应用在深度学习。它的功能是定义如下: 在哪里在课堂上是分类器的输出值吗我;是类的数量;和概率是相对的。

该算法计算每个类的相对概率为输出值,和类相对概率最高的分类结果。

在高光谱图像进行像素级分类,总体步骤可以分为3个步骤:步骤1:一片区域的大小7×7×L从高光谱图像提取作为网络输入,和中央像素提取的类标签对象类,l是渠道的数量的原始高光谱图像。步骤2:特征提取的基本结构是我们改进的3 d残留卷积结构,及其原理图如图4。采用优化hyperparameters TPE算法,可实现端到端高光谱特征提取“谱”。步骤3:使用crossentropy损失和反向传播网络是训练;最后,检测并得到分类结果。将Softmax层深的输出网络转化为一个概率分布,预测概率分布之间的距离,真正的概率分布可以由crossentropy计算。

5。实验结果和分析

5.1。高光谱曲线分析

众所周知,有噪声干扰霉区域和区域之间的蓝莓的波长范围400 - 450 nm。为了不影响后续检测的准确性,这个波段的光谱数据范围。此外,蓝莓发霉的光谱反射率区域可见乐队(450 - 760 nm)略高于区域。在近红外波段(760 - 1000海里),声音的光谱反射率地区高于霉地区(30.]。光谱反射率的差异的原因之间的蓝莓发霉面积和声音是蓝莓发霉的颜色面积略有不同的声音,和主要组件和蓝莓发霉区域的物理和化学性质变化是由于蓝莓疾病的衰变,光谱反射率是改变。因此,450 - 1000 nm范围的光谱数据被用来建立一个训练数据集和测试,以检测发霉蓝莓。高光谱成像系统用于收集光谱图像和图所示5。

5.2。数据集

培训深入学习网络需要大量的图像样本,但是收集到的蓝莓数据通常是在实际应用不足。为了获得更多的数据,以便深学习模式具有较强的泛化能力,获得的蓝莓高光谱图像扩大。MATLAB软件用于执行角度旋转、尺度变换,镜像变换,并添加噪声扩大获得图像的数量。最后,同样大小的形象重塑256×256。这些图像分为训练集和测试集,其数量如表所示1。


	声音	Slight-decayed	Moderate-decayed	Severe-decayed

培训	15820年	7821年	3575年	6951年
测试	526年	425年	358年	398年
总	16346年	8246年	3933年	7349年

5.3。参数设置

本文提出的网络参数设置如下:深度= 40,growth_rate = 12,瓶颈= True,减少= 0.5,批量大小设置为16,学习速率设置为0.001,和最大迭代次数设置为10000次;为了提高优化效率,采用ADAMDAM优化算法。这种优化方法是使用一种改进的随机梯度下降算法执行的,可迭代更新基于神经网络的权值训练数据。

网络的输入是一个三维数据矩阵的大小 ,在哪里高光谱图像通道的数量和吗的视野。计算复杂性有很密切的关系与字段的视图的大小,因此它的大小需要进一步实验确定。

为了验证算法的泛化能力,所有数据集分为三个部分:数据集,数据集2,数据集3。图6显示运行10时代不同的蓝莓的准确性高光谱与不同大小的输入数据集。它可以发现输入尺寸越大,越快算法的准确率上升之前3时代和模型可以收敛越快。时间的火车10时代和测试所花费的时间与不同的输入尺寸如图6。它可以发现输入的大小越大,训练时间花的时间越长。自从大输入收敛速度比规模较小的输入,它还需要更多的培训和测试时间。因此,根据识别性能和计算效率之间的权衡,输入高光谱图像的大小是固定的。

(一)

(b)

(c)

5.4。定量评价指标

为了评估模型的性能,采用FPPI作为评价标准,关注的出现频率FP(假阳性)。霉菌检测矩形获得每个图像,本文使用的评估标准是检出率(博士)和假阳性/图像(FPPI),和的关系如下: 其中TP表示积极的样品检测的数量正确;TP + FN代表所有积极的样品的图片的数量;和FP + TN是假阳性的数量。此外,总体精度(OA),平均精度(AA), kappa系数(K)也选为定量评价指标(31日]。

5.5。定性和定量比较分析

为了更好地验证我们提出的算法的性能本文AlexNet [32],GoogleNet [33),3 d-cnn [34],ResNet [35)选为对比模型;给出了四种算法的准确性从相应的纸和开放源码,和准确性提供了5个独立的测试。总体分类精度预测精度之间的比例和数量在所有测试集。平均分类精度之间的比例的正确预测每个类,每个类的总数,最后所有类精度的平均值;kappa系数代表错误减少的比例,它的计算是基于混淆矩阵。

摘要神经网络AlexNet 8层;卷积的前5层层提取图像特征和使用池层以减少图像特征的维数;多个旋转使图像变得更加抽象的具体特性,从而更好的高光谱图像特征。如表所示2,随着迭代次数的增加,网络的准确性已经增加到100%。事实上,由于缺乏高光谱的蓝莓形象,有一个培训的过程中过度拟合情况。过度拟合将导致所有moderate-decayed蓝莓分为severe-decayed蓝莓训练网络时采用分类声音,slight-decayed moderate-decayed, severe-decayed蓝莓。


数量的迭代	精度	预测概率

One hundred.	0.81	0.84
200年	0.87	0.90
300年	0.92	0.95
400年	0.93	0.96
500年	0.95	0.98
1000年	0.95	1
1500年	0.99	1
2000年	0.97	1
3000年	0.95	1

当网络的迭代次数达到200年的健身训练模型不是很高。蓝莓高光谱图像分类时,网络不能正确分类的蓝莓。当声音蓝莓高光谱图像输入到网络识别网络训练完成后,超过50%的蓝莓分为声音和超过40%被归类为腐烂的蓝莓,但是声音概率大于衰变概率,它的声音可以判断条件,可以实现精确分类的目的。

CaffeNet也有8层。每一层的输出是下一层的输入。每个光谱层中的数据格式有四个维度;第一个维度是图片的数量,第二个维度是通道的数量,第三和第四维度是图像的宽度和高度。损失函数往往是凸深度学习,没有解析解,需要解决的优化方法。本文提出算法和反向算法被称为交替更新参数,以尽可能减少损失值,最后得到局部最优解。在网络的过程中迭代,10倍crossvalidation用于验证性能。从这可以看出,网络增加迅速,精度和网络趋于收敛的过程中训练,最终达到100%。然而,由于缺乏数据,增加迭代次数将导致过度拟合。因为巨大的参数过度拟合的过程中,网络的训练集的数据拟合结果是好的,但外面的样本数据集的预测结果非常贫困,那里是一个很好的分类错误概率。 ResNet uses the residual neural network to perform nondestructive detection of blueberries. The detection accuracy rate is up to 90%, and the effect is better. The texture features of the sound blueberry image are obviously different with moderate-decayed and severe-decayed blueberries. It is easy to identify the mildew blueberries using ResNet technology, and the detection effect on the slight-decayed blueberry is poor. The proposed model in this paper is an improved 3D-CNN method for nondestructive detection of blueberries, and its four types of blueberries have better classification performance. Table3显示了在不同的比较模型的精确性。我们的算法获得最好的分类结果是17.2%,20.2%,和19.8%高于GoogleNet OA, AA, kappa系数,分别。与GoogleNet相比,我们的算法大大提高了分类精度。与ResNet相比,我们的指标增长了13%,14.4%,和9.6%,分别。换句话说,我们提出算法具有最好的OA, AA, kappa系数。


类	AlexNet	GoogleNet	3 d-cnn	ResNet	提出了

声音	85.3	83.4	82.7	97.2	98.25
Slight-decayed	96.3	94.2	89.7	83.1	95.1
Moderate-decayed	69.6	70.4	62.0	84.4	93.6
Severe-decayed	58.0	66.9	65.5	84.4	89.4
OA (%)	77.8	81.9	80.6	85.6	95.2
AA (%)	61.3	64.2	68.3	79.8	91.5
K (%)	74.5	79.3	77.9	84.6	94.6

为了分析蓝莓模识别算法的性能本文图7显示检出率之间的关系和FPPI每张图象(假阳性)。表4预测概率是蓝莓的测试集,验证了不同的模型。从实验结果可以看到,有一个在GoogleNet和AlexNet过度拟合情况。因为GoogleNet网络达到22层,它可以同时学到很多的功能,但是在这个实验中训练样本的数量相对较少,这也会导致网络训练期间过度拟合。ResNet网络和提出网络都可以准确地确定蓝莓的衰减高光谱图像,但ResNet的准确性不如该算法。FPPI = 1时,该检测算法的检出率是96.69%,而最好的算法是ResNet算法的结果比较,结果是95.42%,虽然GoogleNet的检出率,AlexNet,和3 d-cnn是89.12%,91.88%,92.15%。


模型	AlexNet (%)	GoogleNet (%)	3 d-cnn (%)	ResNet (%)	提出(%)

检出率	89.12	91.88	92.15	95.42	96.69

5.6。泛化性能

本文测试训练网络的分类效果在不同的数据集来验证模型的泛化能力。本文使用蓝莓的模型训练数据集1分类数据集2,分别和数据集3。分类层是不同的,所以转移训练方法是用来取代分类网络模型和调整的一部分。网络的其他部分的参数不更新。训练数据集仍然是分为20%,10%的验证,和70%的测试样品。实验结果如表所示5。它可以发现高光谱分类模型具有很高的准确率为蓝莓,证明其“空间谱”特征提取部分有一定的泛化能力。


索引	数据集
索引	1	2	3

OA (%)	98.37	96.35	95.31
AA (%)	97.85	92.61	92.09
K (%)	98.29	96.25	95.22

6。结论

改进深剩余3 d卷积神经网络(3 d-cnn)框架提出了高光谱图像分类,实现快速训练,分类,和参数优化。丰富的光谱和空间特性可以迅速从样本中提取完整的高光谱图像使用我们提出的网络。这结合了树结构Parzen估计量(TPE)自适应和选择超参数优化网络性能。此外,针对一些样本的问题,提出了一种新颖的策略来提高高光谱图像样本数据,从而提高训练效果。标准高光谱蓝莓数据集上实验结果表明,该框架与AlexNet GoogleNet相比提高了分类精度。此外,我们提出了网络减少了参数的数量减半,培训时间约10%。

数据可用性

标签数据集用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是支持的科学研究基金会的内蒙古民族大学”(没有。NMDYB18023);内蒙古民族大学的科学研究基金会”(没有。NMDYB19037);内蒙古自治区高等教育科学研究项目(没有。NJZY19155);内蒙古自治区高等教育科学研究项目(没有。NJZY18160);赛尔创新项目(没有。NGIINGII20170612); and Science Research Project of Inner Mongolia University for the Nationalities (no. NMDGP1706).

引用

胡m z . Wang, g .翟”应用程序准确、快速检测的深度学习架构内部机械损伤的蓝莓利用高光谱透射率数据,”传感器,18卷,不。4、1126 - 1135年,2018页。视图:谷歌学术搜索
生物信息学r .实验室,“机器学习”,简报的生物信息学,7卷,不。1,第112 - 86页,2009。视图:谷歌学术搜索
d . Lorente”,选择最佳的波长特性衰减检测在柑橘类水果使用ROC曲线和神经网络,”食品和生物处理技术》第六卷,没有。2、530 - 541年,2013页。视图:谷歌学术搜索
美国Bargoti j·p·安德伍德,“图像分割水果检测和产量估算的苹果园,”《机器人技术领域,34卷,不。6,1039 - 1060年,2017页。视图:谷歌学术搜索
c .南帝、b . Tudu和c . Koley“芒果收获的分级的机器视觉技术成熟度和质量的基础上,“IEEE传感器杂志,34卷,p。2016。视图:谷歌学术搜索
j·d·泰格”敌对的机器学习。“网络计算”IEEE,15卷,不。5、4 - 6,2011页。视图:谷歌学术搜索
n . El-Bendary”为评价番茄成熟,使用机器学习技术”专家系统与应用程序,42卷,不。4、1892 - 1905年,2015页。视图:谷歌学术搜索
o·古普塔,“机器学习方法大规模生产、分类”科学报告,8卷,不。1,p。5226年,2018。视图:谷歌学术搜索
m . Rahnemoonfar和c·谢泼德,“深数:水果计算基于深度模拟学习,”传感器,17卷,不。4 p。905年,2017年。视图:谷歌学术搜索
m·s·侯赛因·m·h·Al-Hammadi g·默罕默德,“水果自动分级使用深度学习的工业应用,”IEEE工业信息,45卷,p。2018。视图:谷歌学术搜索
罗k . s . Lewers y, b . t . Vinyard”评价草莓育种选择采后果实腐烂。”Euphytica,卷186,不。2、539 - 555年,2012页。视图:谷歌学术搜索
s .曹”效应的超声治疗在草莓果实腐烂和质量维护收获后,“食品控制,21卷,不。4、0 - 532年,2010页。视图:谷歌学术搜索
d . Lorente“中华民国特征选择方法的比较发现腐烂柑橘类水果用高光谱图像,”食品与生物处理技术》第六卷,没有。12日,第3619 - 3613页,2013年。视图:谷歌学术搜索
j . b . Wang雪,s .张“衰变和疾病的检测梨枣基于光谱成像技术,”中国农业机械学会的事务,7卷,不。6,2094 - 2107年,2013页。视图:谷歌学术搜索
张h . p . Liu, k B加工,“活跃的深度学习的高光谱图像分类,”IEEE选择杂志的主题应用地球观测和遥感卷,45 1-13,2013页。视图:谷歌学术搜索
x周”,深度学习与分组功能空间谱的高光谱图像分类,“IEEE地球科学和遥感信,14卷,不。1,第101 - 97页,2017。视图:谷歌学术搜索
杨x”,高光谱图像分类与深度学习模型。”IEEE地球科学和遥感卷。99年,硕士论文,2018页。视图:谷歌学术搜索
h .黄”,空间谱特征提取的高光谱图像基于深度学习,”激光与光电子学进展,54卷,不。10,101001年,页2017。视图:谷歌学术搜索
美国刘问:施,“多任务为高光谱图像分类与光谱知识深度学习,”2019年。视图:谷歌学术搜索
d .张”,高光谱图像分类使用空间和边缘特征基于深度学习,”国际期刊《模式识别与人工智能,45卷,2018年。视图:谷歌学术搜索
陈y,“深度上优于高光谱数据的分类,“IEEE选择杂志的主题应用地球观测和遥感,7卷,不。6,2094 - 2107年,2014页。视图:谷歌学术搜索
w·赵和美国Du Spectral-spatial高光谱图像分类的特征提取:减少尺寸和深度学习的方法,”IEEE地球科学和遥感,54卷,不。8,4544 - 4554年,2016页。视图:谷歌学术搜索
j .曰,美国毛和m .李“深度学习的高光谱图像分类框架使用空间金字塔池、”遥感信,卷7,7号到9号,2016页。视图:谷歌学术搜索
h .吴邦国委员长和s·普拉萨德,”Semi-supervised深度学习使用伪标签高光谱图像分类,“IEEE图像处理,卷99,p . 2017。视图:谷歌学术搜索
w·赵”,结合多尺度深度学习特性对高光谱遥感图像的分类,“国际遥感杂志》上,36卷,不。13日,3368 - 3379年,2015页。视图:谷歌学术搜索
r·文卡特斯和美国Prabu高光谱图像特征分类使用递归神经网络,深度学习”医疗系统杂志2019年,43卷,p。7日。视图:谷歌学术搜索
f·贝”,Semi-supervised深度学习基于双重策略的高光谱图像分类样本选择,”遥感,10卷,不。4、574 - 585年,2018页。视图:谷歌学术搜索
施c和s .双关,“多尺度分层复发性神经网络高光谱图像分类,“Neurocomputing,10卷,2018年。视图:谷歌学术搜索
d·亚当,”公牛。“有效的全局优化算法的收敛率,机器学习研究杂志》上,12卷,不。10日,3 - 4,2011页。视图:谷歌学术搜索
杨,“模糊基于签名的区别的子空间投影为高光谱数据分类、”IEEE选择杂志的主题在地球观测与遥感应用9卷,第4202 - 4196页,2011年。视图:谷歌学术搜索
e .谢”,无人监督的高光谱特征选择基于模糊c和灰太狼优化器,”国际遥感杂志》上,12卷,2019年。视图:谷歌学术搜索
a . Krizhevsky i Sutskever g·辛顿,“ImageNet分类与深卷积神经网络,”先进的神经信息处理系统,25卷,p。2012。视图:谷歌学术搜索
c . Szegedy“更深的曲线玲珑,”2014。视图:谷歌学术搜索
李y”,实践领域适应,适应批量标准化”模式识别,80卷,2016年。视图:谷歌学术搜索
m . e . Paoletti,“深锥体残余网络spectral-spatial高光谱图像分类,“IEEE地球科学和遥感卷,57号2、740 - 754年,2019页。视图:谷歌学术搜索

科学的规划

对智能世界2020年科学规划

检测和分类的早期腐烂在蓝莓基于改进深剩余3 d卷积神经网络在高光谱图像

文摘

1。介绍

2。蓝莓及其光谱成像特性

3所示。深剩余3 d卷积神经网络

3.1。3 d卷积神经网络

3.2。剩余3 d-cnn结构

4所示。基于三维深度剩余模型检测和分类

4.1。我们的模型结构

4.2。培训流程和算法框架

5。实验结果和分析

5.1。高光谱曲线分析

5.2。数据集

5.3。参数设置

5.4。定量评价指标

5.5。定性和定量比较分析

5.6。泛化性能

6。结论

数据可用性

的利益冲突

确认

引用

版权

更多相关文章

相关文章