文摘

土壤有机质(SOM)内容是一个重要的指标来衡量土壤功能、土壤质量的水平。然而,传统的研究估计SOM内容关注的经典整数阶导数光谱数据,而分数阶导数信息被忽视了。在这个研究中,共有103个土壤样本中收集Ebinur湖流域,中国新疆维吾尔族自治区。测量后可见可见和近红外光谱和SOM内容室内,原始反射率和吸光度被分数从0到二阶导数(订单间隔0.2)。偏最小二乘回归(PLSR)申请模型校准,和五个常用的精度指标被用来评估这些22模型的性能。结果表明,随着订单的兴起,这些参数显示,增加或减少的趋势与振动和分数阶达到最优值。最健壮的模型是基于1.8阶导数的校准RRMSEC最低(3.35 g公斤−1)和RMSEP (2.70 g公斤−1)和最高 (0.92), (0.91)和RPD (3.42 > 3.0)。这个模型有良好的预测性能研究中估计SOM的内容区域。

1。介绍

土壤有机质(SOM)的内容是一个重要的指标来衡量土壤功能和质量、水平和检测SOM的内容是一个重要的方法来了解当地的土壤肥力(1,2]。众所周知,SOM和土壤有机碳(SOC)之间的相关性是显著的。土壤是地球上最大的碳汇,在全球碳循环中起着重要作用[3,4]。更严重的是,随着全球变暖,人类活动加剧,以及其他因素,SOC的损失更严重的干旱和半干旱地区(特别是5,6]。通过SOM SOC和碳封存管理的能力近年来吸引了越来越多的关注。

传统上,SOM取决于能力和燃烧方法在实验室。这些方法一般都费力。此外,空气污染有可能的风险在操作过程中。由于效率高、低成本、大规模、nondestruction,和快速数据采集、遥感技术已经被证明是一个有前途的工具来加强或完美的传统方法7,8]。,它提供了一个新鲜的方法定量研究SOM的内容。由于崇高的高光谱分辨率,方便,和可控性,可见光谱分析实验室的土壤是一种时尚,特别是。正是SOM和SOC之间重要的定量关系;SOM的评估内容遥感被证明是一种可行的方法来掌握本地SOC存储的条件。许多研究表明SOM具有独特的光谱响应的可见(可见光和近红外)乐队9- - - - - -12]。在某种程度上,土壤光谱反射率可能反映了SOM的内容。SOM的快速检测内容可以由使用原始光谱反射率数据(R),通过数学变换。

可见光谱的预处理是非常必要和有效的提高谱估计模型的准确性。删除的土壤水分光谱的影响,Minasny等人使用促红细胞生成素预处理测量原始光谱数据(外部参数orthogonalisation)算法,它改善了SOC预测模型的稳定性和准确性在新南威尔士南部,澳大利亚(13]。使用由Savitzky-Golay光谱反射率进行预处理(SG)平滑、一阶导数与SG平滑(FD),和其他数学方法,支持向量机回归模型的预测性能(SVMR)完善(14]。这些光谱反演模型主要基于SOM的R通常和一些适当的预处理方法,反演(1 /R)、对数(lgR),logarithm-inversion (1 / lgR)和均方根( )和第一或二阶导数。与大规模高维数据来源信息,原始光谱进行预处理的传统整数阶导数一般,但它可能会影响信息的有效检测和导致光谱信息在某种程度上的损失。此外,建模的准确性也将受到限制。分数阶导数的概念扩大了经典的整数阶导数(15,16]。由于更好的准确性和更高的效率,它已广泛应用于系统控制和诊断、数字滤波、信号和图像处理、和其他相关领域(17- - - - - -20.]。光谱分析,该算法引入的光谱反射率预处理的盐渍土Ebinur湖盆(21]。研究表明,这是需要提取潜在的土壤光谱信息可见光谱在干旱沙漠地区使用分数阶导数算法。

沙漠土壤Ebinur湖流域的土壤是一个典型的中国西北。Ebinur湖泊盆地是一个典型的湖泊湿地在干旱地区。很少有研究分数导数应用于可见光光谱可见光的沙漠土壤,这方面和先前的研究动机,本研究的目的是利用实验室用可见光谱被分数导数算法结合SOM内容数据建立预测模型比现有的模型更好的准确性和稳定性。

2。材料和方法

2.1。研究区域

研究区位于Ebinur湖盆(82°36 10′′~ 83°E 44°30′~ 45°09′N)在准噶尔盆地的西南,中国新疆维吾尔族自治区。盆地周围是三面环山,北部,西部,南部,分别(22,23]。这个地区是一个主要功能区域生态保护系统,防止灰尘的天山北坡。由于研究区域的干旱荒漠气候,Ebinur湖流域年降水量约102毫米,而潜在蒸发可以达到1447毫米。年平均温度范围从6.6到7.8°C。大风也该地区典型的(24]。沙漠地貌类型主要有石,砾石沙漠,盐沙漠,沼泽,等等。主要的土壤类型皮埃蒙特砾状的石膏沙漠土壤(25,26]。Ebinur湖流域是一个正常的封闭的内陆干旱地区绿洲系统还有一个集成的地区组成的湿地,水文和人类活动。

2.2。土样的采集和化学分析

考虑到典型研究区域的景观特征,如绿洲,沙漠,土壤条件,和网站的可访问性,我们设立了103个站点(30×30 m正方形区域,5样品/网站)。在每一个计量单位,每个样本点的对应坐标被GPS(图记录1)。每一个土壤样本(约0.5千克)放入一个防水袋,密封,编号,然后带回实验室。共有103个表层土(深度0 ~ 20厘米)样本从Ebinur获得新疆维吾尔自治区的湖盆,中国,从2015年5月18到29岁。为了减少含水量的影响,所有样品都充分风干,然后后,这些土壤样本粉碎和筛分2毫米屏幕把石头、植物残渣,和其他杂质。每个样本分为两个相等的部分土壤化学分析和光谱反射率测量实验室,分别。重铬酸钾法用于SOM的决心。

2.3。实验室反射测量

风干土样都单独放入直径12厘米,宽圆形容器深度1.8厘米(1.5厘米土壤被认为是光无限厚)。避免污染的测量,这些容器之前被漆成黑色27]。和一个塑料的表面必须刮统治者以确保相同的平面测量表面,压可以影响土壤的孔隙度,导致错误的测量28,29日]。控制光的条件下,所有土壤样品的反射光谱进行了测量在一个黑暗的实验室有ASD FieldSpec®3便携式光谱仪(分析光谱装置,博尔德有限公司,美国)。谱仪的采样间隔1.4海里(350 ~ 1000 nm)和2海里(1000 ~ 2500海里),而重采样间隔是1纳米。50 W卤素灯作为光源实验室反射测量,闪亮的8°垂直和被放置每个土样表面50厘米以上。光学传感器是安装15厘米的距离从每个土壤样本的平30°天顶角。每个反射测量校准了标准化与100%反射板,确保精度(30.]。对于每一个土壤样本,收集二十光谱曲线,二十的平均值作为最终的反射光谱。

2.4。光谱处理和数据分析

真正的样品信息是不可避免地受到仪器噪声(31日,32]。为了减少噪音,ViewSpecPro软件6.0版本应用纠正和消除断点和删除边际波段大噪声(350 ~ 400 nm和2401 ~ 2500 nm)。SG平滑方法(多项式2的顺序和帧大小5)采用103光谱曲线的平滑9.0.0 OriginPro版本。处理光谱构成最终的数据进行进一步的分析。处理过的所有土壤样品的光谱反射率图所示2

分数微积分是数学的一个理论分支,推广了经典的整数阶导数任意(noninteger)订单31日,32]。分数导数的定义都不同,Grumwald-Letnikov (G-L) Riemann-Liouville (rl)和Capotu。较低的计算成本,G-L定义应用于本研究。其中,v意味着订单,零级意味着数据没有处理的算法。

通常,lg (1 /R)光谱使用,因为它代表了吸光度,在频谱分析。更多的建模结果和非线性关系的改善,平滑和predenoised反射率数据被转换的吸光度(lg (1 /R))。根据(1),R和它的吸光度0 ~ 2日部分衍生品(订单间隔0.2)被计算在Eclipse平台。

2.5。数据建模和验证

由于它利用降维、合成、和解决独立变量之间的共线性问题,偏最小二乘回归(PLSR)已被证明是一个健壮的和可靠的方法在光谱定量研究(7,33- - - - - -35]。的建模、PLSR的好处是,它使用意义测试波长范围选择到达使用波长高度相关的预测方程的分析物,给小重量nonpredictive波长。为了充分利用光谱反射率,波长从401到2400海里都是应用于由PLSR模型校准。从最高到最低排名的基础原则。校准集( )和验证( )选择在相等的时间间隔的校准和精度测试。

能力评估模型进行了测试的五个性能指标:性能比偏差(RPD),校准的系数行列式( ),均方根误差校准(RMSEC)和相应的预测( (RMSEP)。最优模型是由高值的表示 , 和RPD,但低RMSEC和RMSEP。一般来说,如果1.5 < RPD≤2.0,它只表明该模型估计高和低水平的SOM差。如果2.0 < RPD≤2.5,这表明一个更好的预测能力,而如果2.5 < RPD≤3.0,一个很好的预测能力,如果RPD > 3.0,该模型具有良好的预测性能(12,36]。所有上述指标的计算是通过MATLAB软件版本R2012a(美国马MathWorks,纳蒂克)。最终结果是用来评估模型的性能。

3所示。结果

3.1。SOM内容的统计分析

有机质的土壤样本的描述性统计特征的整个数据集,提出了校正集和验证集的表1。与SOM的范围内容(0.68 - -78.39公斤−1)对整个数据集和校准,验证集有一个窄范围4.79 - -39.16 g公斤−1,因为缺乏土壤样本。平均SOM内容和成套的变异系数分别为21.43 g公斤−1和50.46%的值的范围之间的校准和验证集,分别虽然SOM的描述性统计特征内容在校准和验证集类似于六个参数的设置。因此,校准和验证集的SOM内容可以代表整个数据集的充分。

3.2。反射率不同的土壤有机质含量

在可见的地区,由于电子吸收光谱与土壤颜色作用,协助测量SOM的SOM的内容,和光谱反射率相关(12,37]。SOM之间的关系为研究内容和相应的土壤样本的光谱反射率,5代表土壤样品用不同的内容被选中的曲线绘制。0.68 g的图表明SOM内容公斤−1和78.39 g公斤−1分别对应于最高和最低反射率,。光谱曲线的不同有机质含量土壤样本相似的反射率和曲线的斜坡,有三个主要位于1400点附近明显的吸收特性,1900,和2200纳米(图3)。吸收峰在1400纳米是一个典型的对水的吸收带的弯曲和伸展有关地自由水的债券。附近的区域组合范围的1900和2200海里由于弯曲和伸缩振动Al-OH Mg-OH,分别为(38- - - - - -40]。从401年到760海里,反射率随波长的增加急剧增加。反射率逐渐减少,倾向于持平在760到1900纳米之间。第二个光谱吸收峰测量约1900海里。反射率与波长增加急性变化从1900年到2400海里。土壤光谱反射率之间有负相关关系和SOM内容在401 - 2400纳米的范围;与SOM土壤反射率增加内容减少,反之亦然。很容易区分土壤反射率不同的SOM内容在整个光谱范围内,尽管光谱曲线的五个土壤样品,有一些重叠部分但可以歧视大约从400年到600年,从1900年到2000 nm。与传统的研究结果是一致的(30.,41,42]。

3.3。模型校准和验证

模型校准和所有波长可以利用整个反射的光谱信息。导数预处理能有效地消除背景噪声对目标光谱的影响,突出分析物的光谱特性。在这项研究中,所有原始光谱反射率和根据分数导数吸光度数据预处理算法应用于模型校准的过程。订单时间间隔设置为0.2,所有22 PLSR建造的反演模型。综述了五项性能指标校准和验证表2和表3。为 范围从0到1号订单期间,模型的偏好没有显著增加,最高 , ,RPD只有0.41、0.28和1.18,分别。和参数没有达到最大的订单。5的性能指标有一个轻微的改善增加订单从1到1.6订单。基于1.6的RMSEC和RMSEP模型阶导数达到8.84和6.47 g公斤−1,分别。当订单达到1.8时,该模型的性能有显著的促进RMSEC最低(3.35 g公斤−1)和RMSEP (2.70 g公斤−1)和最高 (0.92), (0.91)和RPD (3.42 > 3.0)。增加到2,模型的能力有所下降。

吸光度的变化趋势由PLSR模型组合相似R模型从0到1号订单。RMSEC和RMSEP 6模型保存在高水平的值,也就是说,重大的错误。订单大于1时, 大幅增加,达到最高为1.8。这个模型的稳定性和准确性是完善RMSEC最低(3.06 g公斤−1)和RMSEP (3.06 g公斤−1)。SOM光谱的灵敏度,稳定性,和模型精度提高。这两个模型基于1.8阶的导数R和吸光度有最好的预测精度。

反复筛选后良好的预测性能,有两个模型有可接受的结果 ,R基于1.8,其吸光度模型阶导数,分别。其中22模型,只有一个最好的模型,组合是基于1.8的导数R,代表着高的值 , 和RPD,但低RMSEC和RMSEP,相对。所有乐队的系数和常数项都显示在图4。散点图的测量和预测SOM的内容优化模型图所示5 测量值和预测值的校准和验证集都达到了0.91,和整个性能指标意味着基于可见光光谱可见光被分数导数模型可以用来预测Ebinur湖流域的SOM的内容。

4所示。讨论

由于大量信息,连续的乐队,和高分辨率的光谱反射率测量光谱很容易影响个体差异(样品的粒度,光源的角度,分析物的条件,等等),和大量的噪音43,44]。因此,必要的预处理应该应用于减少光谱的无关紧要的和无用的信息,增加光谱和测量值之间的相关性。通常的土壤光谱预处理方法主要包括平滑、去噪、正常化,导数处理和多个散射校正(45]。对于导数处理,很受欢迎的一阶和二阶导数的应用(46]。一阶导数可以减少造成的影响部分线性或接近线性的背景噪音。通过二阶导数光谱信号漂移可能被削弱。

第一和二阶导数光谱曲线的斜率和曲率,分别。虽然分数导数的显式光谱意义尚未澄清,分数导数的外地和遗传特点被广泛认可。但它表明,介于0和二阶分数阶导数可以确定为对光谱曲线的斜率和曲率的敏感性。导数值斜率变得更加敏感和不敏感与订单增加反射率从0到1日,从1日到二阶导数值曲率变得更加敏感和不敏感的斜率(15]。在的情况下 模型研究,RPD和其他参数回归模型并没有增加或减少单调的订单增加。改变的过程是波浪形的。他们在分数阶达到最佳值(1.8订单)。这些指数并没有像预期的那样继续改善二阶;对模型的能力有所下降。光谱的灵敏度增强了SOM预处理。RPD, , RMSEC, RMSEP都揭示了敏感性。传统研究基于整数阶导数,这些流程细节被忽略了,这可能会导致更好的隐藏模式。

土壤光谱反射率不同由于母质和土壤类型的影响47]。施等人比较了反射率和SOM在不同类型之间的相关性,就像石灰岩土壤和红色的土壤。结果显示,从580年到820纳米波长的反射率可以用来预测SOM的内容(12]。刘等人证实,反射在620 - 810纳米的范围与SOM,和最大相关系数被发现在710纳米48]。与SOM内容的2%作为边界,也就是说,SOM含量超过2%时,掩蔽的SOM扮演了主要角色的光谱特性,SOM含量小于2%时,它变得不那么有效30.,37,49]。不过,很难准确地估计SOM荒漠土壤含量小于2%。在这个研究中,SOM的光谱反射率越高显示相关内容在600 - 900纳米的范围(图4)。我们的结果与以上研究的发现一致。

更高的SOM的内容,预测基于可见光谱被广泛研究黑土地区(7,30.,50]。然而,这种应用程序是在干旱和半干旱沙漠土壤相对较少。杨等人发现了一个优化模型来估计SOM内容棕色石灰性土壤地区的新疆和模型 和RMSE = 0.3250]。Nawar等人使用多元自适应回归样条函数和一阶导数反射率数据来预测SOM El-Tina平原,埃及;的值 和RPD达到0.76和1.98,分别51]。比较我们的结果与先前的研究,在这项研究中,我们不仅考虑到单波段反射率,挖掘更多潜在的通过分数导数光谱信息。它减少了损失的信息,详细的变化趋势5准确性基于索引R和吸光度模型11阶导数。

所有波长的丰富的光谱信息,基于功能模型乐队只利用所有波长的一部分,和乐队的数量是非常有限的。0.01水平的显著性检验是用于当前选择的方法选择特性。这种方法可能会错过一些乐队和不佳导致的损失一些重要的光谱信息。与所有波长PLSR模型,每个波长的光谱参数在整个光谱范围。因为PLSR的优点,一些问题就像样本较少,更多的独立变量和多个变量之间的相关性可以有效地解决。此外,由于分数阶算法的引入,SOM的分数阶谱相关信息发布,以前被忽视了。因此,评估模型的性能在一定程度上增加。Ebinur湖流域是典型的干旱和半干旱地区。我们的研究可以丰富SOM可见光谱研究和提供一个新的视角来估算SOM内容在特殊地区,沙漠土壤有机质含量的质量分数小于2%。

土壤反射光谱的特点不仅直接相关SOM和含水量也遵守规则明显的区域分异。Ebinur湖流域也代表区域有严重盐渍化。SOM模型预测的内容,盐含量和结构可能在某种程度上对精度有一定的影响。为了更好的精度,为进一步研究下一步是区分盐和SOM的特性与光谱反射率曲线。

5。结论

可见光谱的预处理是非常必要和有效的提高谱估计模型的准确性。在这个研究中,分数导数算法用于预处理,以确定最准确的SOM模型内容Ebinur湖泊盆地。我们发现整个5五个性能指标,即 , ,RMSEP RMSEC和RPD没有增加或减少单调增加的订单。的订单,这些参数显示,增加或减少的趋势与振动和分数阶达到最优值。通过22个模型的比较,最健壮的模型是基于1.8阶导数的校准RRMSEC最低(3.35 g公斤−1)和RMSEP (2.70 g公斤−1)和最高 (0.92), (0.91)和RPD (3.42 > 3.0)。这个模型有良好的预测性能研究中估计SOM的内容区域。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项研究得到了国家自然科学基金(41130531,41130531,41661046)和国家关键技术研究与发展计划项目(2014 bac15b01)。作者要感谢主人Huiyun元(学校政治、哲学、语言和沟通研究,大学(University of East Anglia)的语言帮助。