文摘
高光谱传感器灰尘保留提供详细信息内容(DRC)的评估。然而,丰富的高光谱数据还没有完全利用传统的图像分析技术。我们集成一些最近开发的机器学习算法来估计刚果民主共和国在植物叶片使用的光谱测量ASD FieldSpec 3。实验进行了三个中国南方常见的绿色植物。首次发现了重要的高光谱变量应用随机森林(RF)算法。三种评估模型被开发使用支持向量机(SVM)分类和回归树(CART),和RF算法。结果表明,增加植物叶片在尘土保留内容增强反射的可见光波长但削弱了它们的反射红外波长。波长450 - 500纳米的范围,550 - 600 nm, 750 - 1000 nm和1100 - 1300 nm使用RF算法和确定为重要变量被用来估计刚果民主共和国。刚果民主共和国的三种机器学习技术的比较评估确认,支持向量机和射频模型表现良好,因为他们估计是类似于刚果民主共和国。具体来说,平均支持向量机和射频模型0.85和0.88。本研究的技术方法被证明是一个成功的例子使用高光谱测量植物叶片上估计刚果民主共和国。本研究的结果可以应用于监控刚果民主共和国在其他植物的叶子,也可以结合其他类型的光谱数据来评估一个地区的刚果民主共和国。
1。介绍
阴霾已经越来越空气污染问题中国的快速工业化和城市化1,2]。城市绿色植物在改善城市大气环境发挥重要作用通过保留灰尘(3- - - - - -5]。绿色植物的灰尘滞留能力测量有助于监视和控制城市空气污染(6,7]。也有价值的评价绿色植物对城市大气环境的影响,进一步指导城市绿色植物的安排和管理(8,9]。
质量差分法是最基本的测量方法的尘埃保留内容(DRC)的植物(10,11]。然而,这种方法是复杂和耗时。此外,刚果民主共和国的监测区域范围内使用质量的区别方法是不可能的。遥感高光谱技术提供了一种有效的方式来监控环境污染对植物的影响通过测量植物光谱特征(12- - - - - -15]。先前的研究调查的影响,灰尘在植物的光谱曲线和特征(16,17]。根据霍勒et al。18),尘埃保留叶子导致红边位置的改变,但肖实验(19]表明,灰尘滞留在红边位置没有影响。红边位置,根据王et al。20.),不是敏感拘留叶子上的灰尘的影响,但红边斜率和光谱布满灰尘的叶子的面积小于dust-less树叶。总之,清洁叶片的光谱特性不同于那些布满灰尘的叶子,这使得它可以估计植物叶片的刚果民主共和国基于遥感光谱信息(12,19,21,22]。
光谱光谱测量设备或传感器所提供的信息通常包括数以百计的乐队。选择合适的乐队为刚果民主共和国估算模型具有重要意义。归一化植被指数(NDVI)、三刃(蓝色,红色,和黄色)位置,刚果民主共和国和斜坡用于构建一个估计模型已经被一些学者通过实验评估(21,23- - - - - -25]。然而,这些变量大多选择经验;相当多的有用的信息被排除在外。单变量/多元线性回归和偏最小二乘回归算法研究了模拟刚果民主共和国和光谱特征之间的关系(16]。然而,很少有研究了使用机器学习。机器学习,作为一个强大的建模工具,成功地提高了环境变量的评估和分类精度(空气污染、植被健康状况、土壤水分、地表温度,等等)和土地覆盖类型从遥感图像26- - - - - -32]。此外,机器学习算法的解决非线性问题的变量与很高的维度。因此,本研究试图探讨构建的可能性为刚果民主共和国使用机器学习算法估计模型。
本研究的目标是(1)调查刚果民主共和国的影响在叶表面的光谱特征,(2)从超光谱提取重要的乐队来减少变量的维度很高,进一步评估的有效性选择的乐队,和(3)构建一个刚果民主共和国使用机器学习算法估计模型。在这项研究中,我们进行了三个实验通常在中国南方种植绿色植物,和光谱测量设备使用一个ASD FieldSpec 3。三个机器学习回归算法用于刚果民主共和国估计模型建设比较目的。
2。材料和方法
2.1。实验植物和采样集合
为了研究目的,三种植物被选为研究对象,包括热带榕属植物microcarpal . f .简历金色叶子(GL),Loropetalum研究方面(r . Br)摘要。var.石Yieh (LC),Cordyline后(l)答:马(CF)。这些植物是最常见和典型的中国南方的绿色植物;调查这些植物有利于促进刚果民主共和国的模拟实验地区的区域范围内。此外,如表所示1,三种植物的叶子有不同的特征颜色,大小,形状,和表面纹理。这也有助于检测模拟的有效性和可能性刚果民主共和国通过使用机器学习算法在不同的植物的叶子。减少极端降雨和风力的影响,植物被种植在一个开放的温室在广州(图1)。图2显示了三种植物和它们的叶子。
十个实验从2017年10月到2018年1月。在实验之前,植物被充分清洗,以确保无尘状态在叶子上。后,三种植物的叶子被收集在一个间隔5 - 7天万里无云的天。收集树叶类似的健康和年龄条件,中间,和底部的树冠,分别,然后在采样袋密封测量尘埃保留。考虑到不同大小的叶子,叶子收集的数量为每个工厂是不同的。其中,有30块GL, LC 50件,5件CF。三个复制每一次测量。
2.2。测量叶片反射光谱和尘埃的内容
2.2.1。测量叶片反射光谱
每个植物光谱测量记录之前和之后尘埃保留获得项目光谱变化的精确测量。在这项研究中,一个ASD FieldSpec 3摄谱仪是用来测量光谱反射率的树叶。该设备是基于电磁波的基本理论。光学探测器收集到的电磁波从地面反射对象,这后来被转换成数字信号。光谱仪的光谱范围是350 - 2500 nm和采样间隔为1纳米。测量速度是固定在0.1秒。光学探针的长度是1米。前面的视场角是25°。反射、辐射和地面辐照度的对象同时收集。
同时收集树叶,光谱反射率测量从10:00至14:30。前面的五个树叶都是测量和重复五次。测量后,叶子被密封在相应的包,用来测量刚果民主共和国收集树叶。探测器应该垂直于叶片,并根据叶子的大小高度应该改变保证光谱仪探测范围内的叶子。具体来说,探测到叶表面的高度计算基于方程如下: 在哪里的高度,叶的宽度,是前面的视场角。考虑,一种植物的叶子的大小也可以不同,我们把每个植物类型的最小宽度在计算高度。GL和信用证,我们将2厘米 ,然后小于等于4.5厘米;CF,我们把20厘米 ,然后小于等于45厘米。在实践中,我们使用4厘米的GL和LC, CF 10厘米。
2.2.2。尘含量测量
在这项研究中,工厂的粉尘保留能力是由尘埃含量单位叶面积、叶的比例测量的尘含量和单位叶面积在一定时间内(6]。叶子尘含量是衡量重量的区别方法,和单位叶面积测量叶面积仪。
第一个过程的重量差分法是洗树叶,然后干燥。两个条件的权重应该测量,并被认为是粉尘含量的差异。为了避免其他对实验的影响,控制变量方法被用于这项研究。这意味着除了烧杯中的液体,浸泡时间,干水、干燥温度、干燥时间、冷却时间是相同的。具体方法如下:(1)收集树叶密封在干和加权烧杯(W1)对应于袋,然后在纯水中浸泡5 - 6小时。同时,采样袋是用清水洗净了,然后倒进烧杯。(2)烧杯和一个干净的玻璃棒搅拌,使灰尘溶入水中。然后,树叶足够洗两次使用镊子和纯水。洗后,镊子和玻璃棒清洗,冲洗水涌入浸泡烧杯。(3)烧杯放在干燥器,温度设置为85°C,干燥时间设置为25小时。干燥后,烧杯放置在干燥容器冷却5小时。(4)树叶是加权(W2)使用一万电子分析天平。不同的重量( )收集的灰尘保留样品。干燥清洁的叶子上的叶面积每袋用叶面积仪设备测量。灰尘滞留的比率/叶面积是单位叶尘埃保留价值。
2.3。光谱数据处理
在光谱特性分析,噪声和非敏感波段需要从收集到的光谱数据,和光谱转换应该完成以下研究。首先,为了确保光谱测量数据的准确性,我们对每个点的5次重复光谱数据,删除明显倾斜的曲线。然后,计算均值。第二,确保测量数据的可比性来自不同时间和条件和消除错误造成的实验环境,我们除以白板反射,因为邻近的光谱反射应该遵循的原则。然后,我们把乐队被水蒸气因为水蒸气吸收同化对光谱曲线有很大的影响,这在植物学光谱波长频带范围是毫无意义的研究。简化以下数据过程中,波段被直接在这个研究。结果如图3。
一阶导数光谱可以减少次线性和二次背景噪音;它还可以减少高光谱遥感测量的影响,因为大气层对光线的散射和吸收33]。也能够减少乘法的影响因素,通过改变光照条件(生产22]。因此,从原始测量反射光谱一阶导数光谱计算实现了刚果民主共和国建立评估模型。一阶导数的方程()表示如下:
, ,和是相邻波长;()是波长的一阶导数 ; (),(),()的原始反射波长 , ,和 ,分别。
2.4。识别功能重要性和评估刚果民主共和国
在本节中,我们提出我们的关键创新:将机器学习算法来识别重要的光谱特性(乐队)。我们估计刚果民主共和国基于这些选择特性和比较各种机器学习算法的有效性。我们的设计是描绘在图4。
2.4.1。识别功能的重要性
一阶导数光谱计算从原始反射光谱测量。超过一千个独立变量提供了原始样本数据集。一个特征选择需要进行高维数据集排除冗余乐队,进一步减少样本集的维数。在这项研究中,我们实现了随机森林(RF)测量功能(FI)每个乐队的重要性34- - - - - -36]。FI值被从最高到最低排序,以及累积值为0.9时被用来推导出重要的变量。
射频是一位杰出的集成学习算法。算法的基本概念是构建大量的基于树的预测来获得更好的性能(37,38]。大量的子集与替代从总样本中随机提取。剩余的样品out-of-bag数据(OOB)。然后,生成一个分类和回归树(CART)在每个子集。预测平均获得的所有输出预测的每个子集。功能的重要性乐队可以描述如下:(1)每个子集的OOB被用来测试估计相应的树,和平均计算错误的OOB树。(2)的值的顺序变量是交换,而其他变量保持不变。(3)排列的OOB误差计算。(4)OOB错误之前和之后的不同排列计算为每个变量,然后所有变量的差异是标准化的范围从0到1.0,FI值的变量。
2.4.2。刚果民主共和国的评估模型
刚果民主共和国估计模型建立了基于所选择的变量。三个常用的机器学习算法用于构造刚果民主共和国和一阶导数光谱之间的模型。支持向量机作为一种监督学习算法,表现在许多遥感应用程序(39- - - - - -42]。车,基于树的算法,很容易实现和已广泛应用于各种领域(43- - - - - -45]。前面提到的RF算法,用于变量选择,也是实现模型刚果民主共和国。选择这三个机器学习算法进行比较的有效性建立刚果民主共和国估计模型由于其广泛使用,性能好,容易实现。为验证目的,总样本集随机分为两个子集,70%部分用来训练模型和30%部分留出进行测试。
3所示。结果与讨论
3.1。光谱特性
图5显示了时间单位刚果民主共和国的变化这三个绿色植物。刚果民主共和国发现单位随时间,但倾向于保持稳定或减少由于饱和效应后很长一段时间。此外,它也被发现,CF的灰尘滞留能力中最重要的三个绿色植物,意味着单位刚果民主共和国为2.23 g / m3,其次是LC (2.21 g / m3)。GL的灰尘滞留能力最低的2.12 g / m3。刚果民主共和国的植物叶子,因此,暂时增加,一段时间后达到饱和,没有降雨,风力干扰。
一般来说,反射率的三个绿色植物叶子上的灰尘,有或没有显示一个普遍的特点,就是类似于许多其他植物的反射。由于植物的色素吸收,三个绿色植物中的可见光波长的反射率较低(小于20%),他们通常有一个反射峰(约550海里GL和LC和大约600海里CF)。在红外波段反射率高(大于60%),由结构的植物的叶子。
同样的植物,叶子的反射率与尘埃和那些干净的显著不同,特别是在可见红外波长(图6)。比较干净的树叶的反射率,满是灰尘的叶子中的可见光波长明显增加了超过70%。众所周知,植物叶片在可见光波长的反射率是依赖于吸收和反射树叶的颜料。叶子上的灰尘保留不仅影响色素吸收,还增加了叶子的反射,导致高反射可见光波长。
(一)
(b)
(c)
然而,满是灰尘的叶子在红外波长的反射率明显低于干净的树叶。主要原因是尘土的叶子可以减少多次反射叶子的结构,特别是CF(图7)。短波红外波长的反射率的特点的三个绿色植物有或没有灰尘的叶子是随机的,因为反射的短波红外波长主要是受树叶水。尘埃保留叶水(图上几乎没有什么影响7)。
基于上述分析,发现明显可见红外波长的反射率之间的相关性的植物叶片和尘埃保留存在。因此,可以建立一个模型来估计刚果民主共和国在植物叶片通过使用光谱信息。
3.2。尘埃保留估计模型
3.2.1之上。波段选择的结果
在上述的分析中,反射的短波红外波长主要是受树叶水和略受灰尘保留的影响。因此,我们只包括光谱波长之间的351和1350海里。有1000乐队从351纳米到1350纳米波长的间隔1海里。因此,1000年独立变量提供的样本数据集。
RF回归算法运行的总样本对于每一个工厂,分别。FI值范围351 - 1350 nm的乐队被来自算法输出。图6介绍了FI估计使用射频分布不同的乐队。可以看出,三种植物FI值表现出不同的分布格局。总的来说,三种植物的FI所有达到高峰值之间的波长750 nm和800 nm,这是敏感的近红外波段植被健康(46]。然而,GL和CF,高FI值主要集中在750 nm和800 nm之间,而LC的FI值范围从550到600纳米,压倒的近红外波段。此外,FI价值观也发生在460 nm和630 nm GL和CF,分别。
FI值被从最高到最低排序;然后,我们积累了FI值从最高到最低。时积累了FI积累值达到0.9。的乐队已经积累被认为是重要的变量和选择刚果民主共和国建立模型。图8显示选中的乐队为每个工厂基于累积FI值阈值为0.9。选择乐队的数量为GL、LC和CF是94年,167年和73年,分别远低于样品的总数。因为FI值三种植物的分布是不同的,选择的乐队的数量是不同的。GL和CF,选中的乐队主要是在350 - 500纳米的范围,750 - 900 nm和1100 - 1350 nm。LC,除了相同范围的GL和CF,许多乐队也选择从550年到600 nm和650 - 700 nm)。
理论上,所选波段的光谱提供样本总数的90%的信息。选中的乐队是作为独立变量为刚果民主共和国建立评估模型。
3.2.2。尘埃保留模型
总样本集随机被分为两个子集,70%部分用来训练模型和30%部分留出进行测试。为每个工厂独立模型建立了基于所选择的乐队。此外,模型还建立了使用总乐队做个比较。表2总结了每个工厂的培训和测试结果使用购物车,支持向量机,分别和射频方法。数据9和10显示之间的散点图估计和测量尘埃量模型使用选定的乐队,乐队,分别。
(一)
(b)
(c)
(一)
(b)
(c)
一般来说,基于建立的模型选择和总乐队都实现了高精度,相似系数的测定(),平均绝对误差(MAE)和均方根误差(RMSE)。测试结果也意味着模型实现选定的乐队产生类似性能的模型考虑总乐队。LC RF-based模型和GL使用选定的乐队产生明显更高值比使用总乐队。这表明降维是必要的,和选择的乐队保存重要的和有用的信息,可以表达谱差异引起的树叶尘埃保留。
LC和GL RF-based模型表现好于其他两种算法,测试分别为0.87和0.92。模型偏差值都小于0.08。CF,基于svm模型优于其他两种算法。总的来说,CART-based模型产生了最准确的估计结果。图11显示了泰勒图三种植物的测试精度。泰勒图有助于比较不同模型的评估。它集成了四个统计图量化建模和观测值之间的对应程度。皮尔逊相关系数四个统计数据,归一化标准差,归一化误差标准差,规范化的偏见。(观察)测量值作为参考。可以找到更多的细节在47]。根据图11CART-based模型产生的,估计结果显示测量值的相关性最低。结果估计使用SVM和射频模型显示类似的标准差和相关性。此外,三个算法都低估了测量尘埃信用证的内容。
(一)
(b)
(c)
4所示。结论
在这项研究中,我们调查了使用机器学习的有效性评估刚果民主共和国的叶子基于遥感高光谱信息。我们进行了三个实验绿色植物在中国南部。光谱测量使用ASD FieldSpec 3。特征选择过程是实现减少原始光谱的高维度。三个常用的机器学习算法,支持向量机,购物车,射频,被用来检测可能的刚果民主共和国和一阶导数光谱之间的关系。结论可以概括如下:(1)重要的光谱反射和刚果民主共和国之间存在的相关性的植物叶片可见红外波长区域:植物叶片的反射增加可见波长和减少红外波长的增加在刚果民主共和国。短波红外波长的反射率的特点的三个绿色植物有或没有灰尘的叶子是随机的,因为这些波长的反射率主要受叶片含水量的影响。(2)光谱从450年到500海里,550到600海里,750到1000海里,1100到1300海里推荐检测和评估刚果民主共和国的树叶。然而,适当的乐队中不同植物。本研究的实验只进行三种类型的植物;特征选择过程建议在任何其他的实际应用。(3)RF算法减少了变量维度。测试结果表明,估算值使用SVM和射频与刚果民主共和国测量方法有很好的协议。SVM和射频,因此,建议对建模基于高光谱数据的刚果民主共和国。最优算法应根据不同的情况来决定。
这项研究提供了一种技术方法估算刚果民主共和国在基于高光谱测量植物叶片。验证结果表明,在这项研究中提出的机器学习模型有效地减少了变量维度和准确地估计不同的植物的刚果民主共和国。因此,这项研究的结果可以应用于监控刚果民主共和国在其他植物的叶子和进一步融合或结合其他类型的光谱数据来衡量刚果民主共和国在区域范围内基于机载高光谱传感器或传感器车载无人机(uav)。
首字母缩略词
| 购物车: | 分类和回归树 |
| CF: | Cordyline后(l)答:马 |
| 刚果民主共和国: | 尘埃保留内容 |
| FI: | 功能的重要性 |
| GL: | 热带榕属植物microcarpal . f .简历金叶子 |
| LC: | Loropetalum研究方面(r . Br)摘要。var.石Yieh |
| 梅: | 平均绝对误差 |
| 归一化植被指数: | 归一化植被指数 |
| OOB: | Out-of-bag数据 |
| R2: | 确定系数 |
| 射频: | 随机森林 |
| RMSE: | 均方根误差 |
| 支持向量机: | 支持向量机。 |
数据可用性
高光谱测量和尘埃保留内容数据用于支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
作者的贡献
Wenlong京和夏周贡献了同样的工作。
确认
本研究联合支持由中国国家自然科学基金(41401430和41401430),广东创新与创业研究小组计划(2016 zt06d336),广东省科学院的科技发展的特殊项目(2017 gdascx - 0101年和2018年gdascx - 0904),广东森林科技创新(2015 kjcx047),广州的科技项目(201604016047),和广东省科技项目(2017 b010117008)。