文摘

皇冠梨是一种重要的经济作物,但他们的质量,严重的影响了经济的不同程度的伤害。改善的总体质量皇冠梨,排序的皇冠梨需要不同程度的损害。然而,传统的检测方法有一些缺点,如低效率和大错误。因此,高光谱技术被用来区分声音和三个不同层次的损伤(定义为水平I, II, III损伤,分别)皇冠梨的研究。改善歧视性模型的准确性,吸光度(一个)光谱和Kubelka-Munk (K- - - - - -)添加了光谱反射率(R)光谱。三个光谱进行预处理;然后,偏最小二乘判别分析(PLS-DA)模型和支持向量机(SVM)模型建立了歧视的皇冠梨不同程度的损害。判别模型的结果表明,支持向量机基于精度的歧视R,一个,K- - - - - -光谱是高于PLS-DA;A-RAW-SVM模型与整体性能最好的歧视歧视精度100%的测试和校准集,为98.98%。最后,选择的光谱是竞争适应再加权抽样(汽车)和不提供信息的变量消除(UVE)获得特征波长,和支持向量机模型建立基于过滤R,一个,K- - - - - -。他们的歧视A-RAW-CARS-SVM模型结果表明,最好的辨别能力,和歧视的精度测试和校准的模型分别是96.88%和100%,分别。结果表明,最好的歧视皇冠梨的不同程度的损伤是基于支持向量机模型一个光谱。本研究提供了理论基础和实验依据使用高光谱检测皇冠梨的损害。

1。介绍

皇冠梨是一种重要的经济作物,广泛生长在亚热带地区。它很受欢迎,因为它们脆,甜,多汁,皮薄1]。由于皮薄的特点,皇冠梨生产挑选期间不可避免的机械损伤,运输和储存在成熟之后,可以分为表面损伤,表皮擦伤,影响损伤根据不同程度的损伤(2]。受损的皇冠梨很容易滋生细菌和腐烂和恶化在相对较短的时间,他们也感染声音皇冠梨,影响声音的保质期皇冠梨(3]。皇冠梨损坏后可以采取了不同的处理和分类根据不同程度的损坏,获得更高的经济效益。皇冠梨有轻微损伤早期通常仍然可以食用。皇冠梨,严重损伤后可以考虑删除损坏的部分加工食品。目前,受损的皇冠梨主要依靠人工分拣。这种分类方法有一个很大的错误和低效率。因此,有必要探索一个精确、无损、有效的检测方法来实现皇冠梨的排序不同受损的水平。

为了区分不同层次的损伤皇冠梨更有效,研究人员提出了多种检测技术研究。金等。4]使用infrared-locked温度记录的损失评估工作由喂养周期热能梨,梨,梨的热辐射收集的大小来确定损伤和破坏的深度。结果表明,温度记录所产生的相位信息可以用来检测受损的水果。然而,热辐射会造成一些破坏水果的质量。罗等。5)使用空间频率域成像(SFDI)检测不同层次的损伤(声音、轻微和严重损害)的梨。结果表明,在527 nm SFDI的准确性为100%;这表明SFDI技术可以用来检测水果的损伤水平。然而,SFDI强烈影响皮的颜色,和皮的不同颜色描述的光学特性造成巨大困难。周et al。6)使用光学相干断层扫描(OCT)来检测损伤的梨。结果表明,10月可用于损伤诊断的梨,但10月的分辨率和探测深度技术需要改进。早期损坏的微不足道的区别和声音的皇冠梨增加的难度排序通过视觉技术(7]。为了克服上述检测技术的局限性,提出了高光谱技术检测受损程度的梨。高光谱技术被视为一个新兴的无损检测技术,它提供了大量的信息样本的特征(8]。

许多学者研究了损伤水果利用高光谱技术,取得了许多令人满意的成果。李等人。9)利用高光谱在桃子实现早期损伤的检测。他们比较的能力短波近红外光谱和长波NIR区分瘀伤,它得出的结论是,短波近红外光谱最好歧视性能力的准确性达96.5%受伤的桃子。谭et al。10]利用高光谱检测早期损伤和确定苹果的受损程度的准确性为97.5%。太阳et al。11)利用高光谱识别不同级别的损害西红柿的准确性为90.93%。上述研究显示使用的可行性高光谱检测损伤的水果。大多数的研究基于高光谱检测水果质量利用反射光谱建立的分析模型(12]。

水果的物理和化学性质可能改变被损坏后,这些理化性质可以与光谱(13]。高光谱和化学计量学可以用来检测化合物的含量的变化在水果14]。然而,有很多背景信息,噪声信息,和无用的信息在光谱判断基于反射光谱直接获得的光谱仪器,这些导致low-discrimination精度(90.93%)的水果,不同程度的损伤。因此,反射(R)光谱吸光度(一个)光谱,Kubelka-Munk (K- - - - - -)光谱结合化学计量学提出了确定水果的不同程度的损伤,提高识别精度。

2。材料和方法

2.1。皇冠梨样品

皇冠梨样品用于实验得到在江西当地果园。样品没有外部目视检查选择的损害,和样品之间的赤道直径70和80毫米,重量在250年和280年之间被储存在室温25°C。

2.2。定量损伤实验

样品被撞击破坏实验使用钟摆设备如图1(一)。钟摆由一个摇臂和表面产生影响,以及样品固定在摆臂的结束。摆臂是发布的不同角度,样本会导致不同程度的损害。样品由30°,40°,和50°释放被定义为一级,II, III损伤,分别。样品如图与不同程度的损害1 (b)。样品分为四组,其中一个作为对照组,其余3组遭受损害实验3水平的影响。64个样本的每一个声音,I, II, III损伤实验得到的损害的影响。

2.3。收购的高光谱图像

所有的样本都被盖亚分类器的图像高光谱仪器。高光谱图像采集系统的组成如图2,由Dualix光谱成像仪器制造有限公司皇冠梨样品按顺序放置在运输平台,执行和光谱采集顺序生成三维数据体包含了图像信息和光谱信息。高光谱采集仪器预热30分钟之前收购降低收购错误引起的基线漂移。

2.4。光谱校准

的暗电流和不均匀分布光源存在于高光谱仪器直接进行收购时,他们可能会导致大的实验错误,所以光谱校正过程进行的 在哪里R是校准样品图像采集数据,Ry是全黑图像采集数据,Rz是白人图像采集数据,R0是原样品图像采集数据。

2.5。光谱提取

光谱提取是进行了高光谱图像获取光谱信息,它可以用来描述的示例。可见光谱的波长范围397.5∼1014.0纳米分辨率为3.5纳米。选择感兴趣的区域(ROI)赤道地区的声音样本和损坏的样品来减少光的不均匀度。的平均值计算ROI内的反射反射光谱(R这个示例。的R计算了光谱(2)和(3)获得吸光度(一个)光谱和Kubelka-Munk (K- - - - - -分别)光谱。

2.6。光谱数据预处理

R,一个,K- - - - - -光谱数据可能包含信息异常造成的一些不相关的特征的样本除了被测样品的信息。因此,原始数据需要处理消除或减弱的影响异常信息,并保留有效信息来改善歧视模型的适用性和鲁棒性。高斯滤波器的预处理方法(GF),标准正态变异(SNV) Savitzky-Golay导数(SGD)乘法散射校正(MSC),和相关优化扭曲(牛)是常用的。

2.7。特征波长选择

有多个之间的相关性R,一个,K- - - - - -以不同波长的光谱,光谱导致冗余信息。这种冗余信息减少了歧视模型的速度和准确度,因此,需要消除冗余信息(15]。在实践中,一个好的执行分类模型不仅需要歧视精度高但也有歧视速度快;因此,原始光谱可以缩减规模竞争适应再加权抽样(汽车)和不提供信息的变量消除(UVE) [16]。汽车是一个基于回归系数的波长选择抽样方法,和UVE是拒绝不提供信息的变量的采样方法基于模型的变量的值稳定。这两个方法被广泛用于特征波长的光谱数据的选择17]。

2.8。模型建立

Kennard-Stone (KS)算法实现均匀分层抽样的样本在特征空间中选择基于变量之间的欧氏距离,减少了对最终结果的影响由于分区过程中引入额外的偏见(18]。KS算法用于样品的光谱数据划分为两个相互排斥的校正集和测试集(校准设置:测试集= 3:1)。偏最小二乘判别分析(PLS-DA)和支持向量机(SVM)模型是基于R,一个,K- - - - - -光谱,分别。PLS-DA用于找到一个线性回归模型预测和观察变量投射到一个新的空间(19]。SVM通过内核方法可以用来执行非线性分类的决策边界的最大边界超平面解决学习样本(20.]。精度和准确度可以用来评估分类模型的性能。基于混淆矩阵的精度通常是评估的F1的值,这是一个调和平均数基于精度和召回。越接近F1值更接近于1,模型的精度越高(21]。的F1值计算由以下方程: TP是真正的情况下,FN错误计数器的情况,FP是假阳性的情况。

F1值适用于二进制分类模型,评估的准确率multiclassification需要计算模型F1每个类别的价值,一般是采取宏观F价值模型和宏观F值计算 其中Fi是F1每个类别和价值n是类的数量。

3所示。结果与讨论

3.1。皇冠梨的光谱分析

R,一个,K- - - - - -声音和光谱数据样本均不同程度的损伤,和它们的光谱曲线被绘制。损坏的平均值的水平R光谱图所示3(一个),声音样本表现出光谱反射率最高,其次是我损坏程度和II级攻击最后第三级别伤害。有明显降低的光谱反射率受损皇冠梨,和光谱差异的原因主要是由于细胞膜的破裂损伤后的皇冠梨,导致水分流失,容易氧化,与苹果损伤研究的结果是一致的(22]。数据3 (b)3 (c)显示的曲线特征一个光谱和K- - - - - -光谱是不同的,一个光谱和K- - - - - -光谱曲线表明,第三级的光谱值伤害,水平我伤害,II级损伤,成为低和声音样本序列。三所呈现的不同的趋势和特征光谱曲线是歧视的基础模型。

3.2。光谱预处理

光谱通常预处理之前建立的判别模型。预处理的目的是提取有效信息和消除背景信息和噪声。的R,一个,K- - - - - -基于GF皇冠梨的光谱进行预处理,MSC, SNV,牛,和SGD光谱预处理后的变化称为反射光谱的一个例子。图4显示的光谱特征R光谱变化显著不同的预处理后,和这些变化更明显的波峰和波谷。高斯滤波计算高斯函数来减少自身噪声的原始光谱。MSC和SNV方法主要是用来消除散射影响的非均匀分布的粒子和粒子的大小。牛将两个信号的分段线性拉伸和压缩的光谱。SGD可以用来有效地消除基线和其他背景干扰通过执行1导数光谱曲线。

3.3。模型建立和分析

歧视的准确性PLS-DA基于的结果R光谱,一个光谱,K- - - - - -光谱表所示1。最好的模型的基础上R光谱是由SNV模型进行预处理的歧视精度测试和校正集的64.06%和65.63%。基于最好的模型一个光谱是由牛模型进行预处理与歧视60.94%和54.17%的精度测试和校准。基于最好的模型K- - - - - -光谱模型是基于原始的歧视精度测试和校正集的64.06%和75.52%,分别。的判别结果,很明显,K- - - - - -光谱表现出最好的性能建模PLS-DA判别模型。

歧视的结果的准确性基于支持向量机模型R光谱,一个光谱,K- - - - - -光谱表所示2。基于最好的模型R光谱模型是基于原始与歧视96.88%和98.96%的精度测试和校准集。基于最好的模型一个光谱模型是基于原始与歧视100%和98.98%的精度测试和校准集。基于最好的模型K- - - - - -光谱模型基于牛与歧视95.31%和98.44%的精度测试和校准集。的判别结果,很明显,SVM模型性能最好的判别依据一个光谱。

判别结果的表12,很明显,女友的支持向量机模型的预测性能模型中是最好的R光谱。在模型的基础上一个当光谱,支持向量机模型一个光谱不进行预处理的最佳性能。在模型的基础上K- - - - - -光谱,牛的SVM模型预处理具有最好的性能。歧视模型的结果表明,SVM模型歧视精度高于PLS-DA模型。PLS-DA歧视性能力差的原因可能是由于一个事实,即光谱信息没有线性相关的细胞样本测试下的失水减少预测能力。相比之下,支持向量机是一种由内核非线性分类方法,所以它获得歧视精度高的检测不同的损伤程度的皇冠梨。曹et al。23)利用高光谱结合支持向量机和请模型来检测损伤的梨,和结果表明,支持向量机模型更准确预测损伤级别的梨。实验歧视的结果表明,支持向量机可以用来有效地歧视伤害的梨。

最优模型的判别结果R,一个,K- - - - - -光谱分别进行了分析。基于最优模型R光谱是R-GF-SVM,混淆矩阵模型的结果如图的歧视5(一个)。2 II级损伤样本测试集的并被错误地归类为级别我破坏样品:1声校准设置分类错误的样本级我破坏样品,和1 II级损伤样本并被错误地归类为第三级损伤样本。基于最优模型一个光谱是A-RAW-SVM,歧视的混淆矩阵模型结果如图5 (b)。没有在测试集分类错误的样本;1的声音在校正集样本并被错误地归类为II级损伤样本,和1 II级损伤样本并被错误地归类为第三级损伤样本。基于最优模型K- - - - - -光谱是K-M-COW-SVM,混淆矩阵模型的结果如图的歧视5 (c)。2级我破坏样品测试集的并被错误地归类为II级损伤样本,和1 II级损伤样本分类错误1声音样本。2级我破坏样品校准集中并被错误地归类为II级损伤样品,和1级三世损伤样本并被错误地归类为II级损伤样本。

计算模型的精度歧视,歧视的结果如图所示5。R-GF-SVM模型的准确率,A-RAW-SVM模型,K-M-COW-SVM模型计算了(4),结果如表所示3

- fR-GF-SVM价值模型,A-RAW-SVM模型,A-RAW-SVM是0.9844,0.9922,和0.9767,分别。越接近宏- f值为1时,模型的精度越高表示(24]。从表23它可以发现,基于性能模型一个光谱是最好的,其准确度和精密度高于R光谱和K- - - - - -光谱。

3.4。选择的特征波长

简化模型的光谱数据集,提高速度运行,汽车和UVE被用来过滤特征波长的光谱与更好的建模结果,分别。总共有9个光谱选择,他们歧视精度都大于89.06%,R-RAW, R-GF, R-COW,原始,A-GF,一头牛,K-M-RAW K-M-GF, K-M-COW。波长的子集与最小的RMSECV是通过第一次建立偏最小二乘模型汽车,然后,模型选择对应的波长较大的回归系数(25]。原始光谱作为一个例子来介绍汽车的特征波长的选择,及其选择过程如图6。汽车执行100次抽样的抽样,样本变量的数量逐渐减少抽样样本数量的增加。RMSECV增加然后减少在20分的最小值为0.4902,与特征波长取决于最低RMSEP抽样运行期间(26]。

请模型成立于UVE通过交叉验证,然后,平均值和标准偏差的比值的PLS模型的回归系数计算选择有效的光谱信息(27]。波长选择过程介绍了UVE通过使用原始光谱为例,其选择过程如图7。黄色曲线是原始变量和红色曲线是filtered-free变量。图中的虚线7显示了阈值分割与±37.9147的上限和下限。根据UVE选择原则,阈值分割中波长线应该丢弃,和波长以外的阈值选择分模线区域特征波长(28]。

的结果R光谱特征波长选择如图8。R-RAW光谱有10个特征波长选择汽车算法,光谱的占总数的5.68%。21特征波长选择UVE R-RAW光谱如图8 (b)光谱的,占总数的11.93%。汽车所产生的10个特征波长选择R-GF光谱如图8 (c)光谱的,占总数的5.68%。选择的57特征波长UVE R-GF光谱的算法如图8 (d)光谱的,占总数的32.39%。汽车所产生的16个特征波长选择R-COW光谱如图8 (e)光谱的,占总数的9.09%。111年的特征波长的选择的R-COW光谱UVE算法如图8 (f)光谱的,占总数的63.07%。

特征波长选择的结果一个光谱图所示9。75特征波长选择汽车的原始光谱图所示9(一个),占42.61%的全光谱的波长数。汽车所产生的98个特征波长选择的原始光谱图所示9 (b),占55.68%的全光谱的波长数。85年的特征波长选择汽车A-GF光谱如图9 (c),占48.3%的全光谱的波长数。A-GF 97特征波长的光谱选择UVE图所示9 (d),占55.11%的全光谱的波长数。汽车所产生的6个特征波长选择牛光谱如图9 (e),占3.41%的全光谱的波长数。71牛的光谱特征波长选择UVE图所示9 (f),占40.34%的全光谱的波长数。

特征波长选择的结果K- - - - - -光谱图所示10。75年的特征波长选择汽车K-M-RAW光谱图所示10 (),占42.61%的全光谱的波长数。98年的特征波长选择汽车K-M-RAW光谱图所示10 (b),占55.68%的全光谱的波长数。43特征波长选择汽车K-M-GF光谱图所示10 (c),占24.43%的全光谱的波长数。103年的特征波长的K-M-GF光谱选择UVE图所示10 (d),占58.52%的全光谱的波长数。33特征波长选择汽车K-M-COW光谱图所示10 (e),占18.75%的全光谱的波长数。A-GF 60特征波长的光谱选择UVE图所示10 (f),占34.09%的全光谱的波长数。

从汽车和UVE特征波长选择的结果,可以看出UVE特征波长选择的数量远远超过的数量特征波长选择的汽车。原因可能是汽车和UVE特征波长选择方法基于PLS模型的回归系数,但UVE使用回归系数的测量波长的重要性,而汽车用回归系数的绝对值作为测量波长的重要性(22,23]。周et al。6)高光谱检测糖含量用于梨、波长和光谱特征波长的选择是由汽车和UVE,和他们的结果表明,特征波长的数量选择UVE(390)超过特征波长选择汽车的数量(42)。

3.5。结果和特征波长的光谱分析模型

基于光谱特征选择的SVM模型汽车和UVE筛查选定波长的数量从6 (A-COW-CARS)到111 (K-M-RAW-UVE)。歧视SVM模型的结果如表所示4。58特征波长的R-GF UVE光谱选择的R光谱歧视精度最高,95.32%和100%的测试和校准设置。75年的原始光谱的特征波长选择的汽车一个光谱歧视精度最高,96.88%和100%的测试和校准设置。43特征波长K-M-GF光谱选择的汽车K- - - - - -光谱歧视精度最高,93.75%和96.88%的测试和校准设置。

基于最优模型R光谱特征波长选择R-RAW-UVE-SVM模型后,和歧视的混淆矩阵模型的结果如图所示(11日)。1声音示例测试集分类错误的水平我破坏样品,和1 II级损伤样本分类错误级别我损伤样本。2声音样本标定集中并被错误地归类为II级损伤样品,2级损伤样本并被错误地归类为II级损伤样品,2 II级损伤样本并被错误地归类为伤害我伤害样品和水平3级,2级三世损伤样本并被错误地归类为II级损伤样本。基于最优模型一个光谱特征波长选择A-RAW-CARS-SVM后,和模型的混淆矩阵歧视结果如图11 (b)。1声音样本的测试集分类错误的II级损伤样本,和1 II级损伤样本并被错误地归类为我破坏样品的水平。没有分类错误的样本校准设置。基于最优模型一个光谱特征波长选择A-RAW-CARS-SVM后。模型的混淆矩阵如图歧视的结果11 (b),1声音示例测试集分类错误的II级损伤样本和1 II级损伤样本分类错误的水平我破坏样品。没有分类错误的样本校准设置。基于最优模型K- - - - - -光谱是K-M-GF-UVE-SVM模型。歧视的混淆矩阵模型结果如图11 (c)。1声音示例测试集分类错误的水平我破坏样品;2 II级损伤样本分类错误级别我损伤样本。2声音样本标定集中并被错误地归类为II级损伤样品,1声音样本分类错误级别我破坏样品,2级损伤样本并被错误地归类为II级损伤样品,1级损伤样本并被错误地归类为第三级损伤样本,2级别三世损坏样品并被错误地归类为我伤害,2级三世损伤样本并被错误地归类为II级损伤样品,和1级三世损伤样本分类错误级别我损伤样本。

判别结果的混淆矩阵图所示11,宏观- f的R-RAW-UVE-SVM值模型、A-RAW-CARS-SVM模型,K-M-GF-UVE-SVM模型计算了(4),结果如表所示5

5表明,宏观- fR-RAW-UVE-SVM价值模型,RAW-CARS-SVM模型,K-M-GF-SVM模型是0.9605,0.9922,和0.9481,分别。越接近宏- f值为1时,模型的精度越高。从表45它可以发现,基于SVM模型的准确度和精密度一个光谱特征波长选择高于后R光谱和K- - - - - -后光谱特征波长的选择。结果表明,一个光谱由汽车最好的模型性能的歧视。汽车,被广泛用于光谱数据的特征波长的选择,是一种有效的特征波长选择方法。宣et al。29日)使用的特征波长R光谱选择汽车建立高模型来评估可溶性固体(SSC)和硬度的桃子,和结果表明,高光谱结合高钙最好歧视的结果。詹et al。30.通过配对方法]选择特征波长的高光谱,如汽车和UVE。结果表明,非线性模型偏最小二乘支持向量机(二)CARS-selected梨香味识别光谱有最好的结果。

4所示。结论

在这项研究中,R光谱的声音以及水平I, II, III和受损的皇冠梨是单独使用一个高光谱采集系统,然后,一个光谱和K- - - - - -光谱得到的R光谱的变换方程。线性PLS-DA开发模型和非线性支持向量机模型对三种光谱和判别结果解释道。发现随着皇冠梨的损害程度的增加,光谱反射率和光谱吸光度的增加而减少。在R,一个,K- - - - - -光谱模型,发现非线性支持向量机模型优于线性PLS-DA模型的识别结果。基于支持向量机的判别模型一个光谱表现的RK- - - - - -光谱,判别精度测试和校正集的支持向量机模型的基于原始光谱的100%和98.98%,分别。此外,宏- f模型的价值为0.9922,和A-RAW-SVM模型显示歧视精度高。两个错误的样本中发现的SVM判别模型基于原始光谱特征波长的选择汽车后,和错误的数量汽车选择之前的样品是一样的。宏- fA-RAW-CARS-SVM模型汽车后选择价值为0.9922,模型的准确性是一样完整的光谱模型,而模型的判别时间时间大大减少。总之,高光谱技术可以用来区分不同的损伤程度的皇冠梨,和基于非线性支持向量机模型一个光谱具有更好的区别的影响不同的损伤程度的皇冠梨。

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作得到了国家自然科学基金(12103019)和国家科学技术奖励备份项目培养计划(20192 aei91007)。