文摘
空间插值的气象参数,密切相关的地球表面,在气候研究中扮演重要角色。然而,大多数传统的空间插值方法忽略的地理语义插值采样点在实际应用。本文提出一种改进的inverse-distance加权插值算法考虑地理语义(S-IDW),这增加了传统IDW的地理语义相似度公式和调整权重系数。在插值过程中,采样点之间的地理语义差异和估计点被认为是全面的。在这项研究中,三组从两个不同地区的地表温度数据被选作实验,和一些常用的空间插值方法进行了比较。实验结果表明,S-IDW表现IDW和一些现有空间插值方法,但也有一些异常值和异常值插值。这种方法提供了一个新的见解对估计精度,数据丢失和误差修正的空间属性相关的气象参数。
1。介绍
气象参数的空间插值是获得相对准确的描述空间属性与气候相关的动力学和天气模式通过一些合理的样品(1]。传统上,抽查的最好方法是获取区域意味着条件以确保平等抽样在该地区的每个位置的机会。然而,观察稀疏采样点和随机分布的实际应用(1]。例如,采样点的位置是系统的顺利和变化。此外,大多数气象模型是目前获得的采样观察台。空间插值方法被广泛用于将离散观测数据转换为连续的表面,以便更好地测量数据元素的空间分布模式(2]。目前,熟悉的空间插值方法,如IDW、克里格,花键,和趋势面方法,已经广泛应用于不同的领域。他们中的大多数在应用程序有一些限制,比如距离加权法和一些问题,影响计算结果由于距离,不适合大范围(3]。克里格方法可以采用不同的变差函数形式和参数不同的采样数据点,有一定的灵活性。然而,它失去了效率高的原始inverse-distance加权法首先确定变差函数,拟合变差函数的参数形式。克里格变异函数需要人工选择,存在时计算量急剧增加的问题有太多的组合变异函数(4]。样条方法不适合稀疏和有限采样点和通常用于高密度采样点插值5]。趋势面方法更多地依赖现有的插值的空间分布趋势元素(6]。因此,许多作家进行了持续的探索和改进空间插值方法(7]。例如,地形和海拔因素的复杂性,介绍了一些研究人员在inverse-distance权重(8,9),和李等人带来了谐波加权系数的方位距离加权插值(2]。自然邻里关系带到距离加权插值(10],一些作者介绍了模糊三角函数到距离加权插值(3]。别人考虑地理因素的时空变化特征,引入了时间序列数据删除一些数值波动,如时空加权克里格和时空inverse-distance加权插值(9]。继承上述作者提出的方法实现了卓越的学术影响和显示高空间自相关,但他们中的大多数是基于数值插值方法,没有考虑地理语义。
灵感来自于梯度理论在图像处理领域,一阶微分的梯度是灰度值,反映了变化率之间的相邻像素的方向X和Y(11]。图像的梯度变化率较大,土地覆盖类型倾向于改变,如土地和水之间的边界图像。现有的基于遥感影像反演研究,如地表温度(LST),植被指数和水分指数,在某种程度上是一个模型来描述遥感信号或遥感数据之间的关系和表面应用程序(12]。例如,温度附近的住宅是完全不同于森林土地或水体。一些暴露的陆地表面的空气温度,就像建造屋顶和路面,温度比森林的阴影。因此,地理语义对探索地理空间的描述表面遥感是不可或缺的像素信息。目前,一些作者所提出的语义克里格方法,取得了很好的研究成果,但仍存在一些问题,如复杂的语义相似度计算方差图进口的(13- - - - - -15]。此外,多变量预测气象因素通过嵌入地理语义为贝叶斯网络削弱了参数不确定性的影响,但缺乏气象建模的知识(16]。尽管上述空间插值方法显示的性能在不同的应用程序中,仍然存在改进的范围由地理语义引入空间插值的过程。此外,信息语义领域的增长空间统计和环境建模17,18]。
本文将地理语义引入逆权重空间插值通过嵌入层次地理语义空间插值模型和使用语义相似度来衡量因素权重。下面的分析进行了研究:(1)S-IDW方法在这项研究是在下一节中解释;(2)实验结果讨论的结果和比较;(3)最后,我们的结论和后续研究的结论部分。
2。方法
S-IDW地理语义知识集成到inverse-distance加权插值方法。考虑到距离对插值结果的影响,土地利用类型对地表温度的影响插值。S-IDW重新考虑插值的重量,增加的重量相同的土地利用类型,并减少的重量不同土地利用类型的基础上,构建S-IDW方法(19]。
S-IDW,第一步是计算地理实体的语义相似度。公式如下:
在方程(1)- (4),的估计价值吗th点插值;的测量值是th离散点;之间的距离吗离散点th点插值;点的纬度是插值;是离散点的纬度;点的经度是插值;的经度是离散点;是测量采样点的数量参与插值;是权力指数,控制程度权重系数随距离的增加而减小点插值和样本点之间。当越大,越接近样本点具有更高的重量;当小,重量是所有采样点分布更均匀。当 ,叫做inverse-distance加权法,这是一种常见和简单的空间插值方法。当 ,它被称为inverse-distance平方方法,通常用于实际应用。在这项研究中, 。
之间的语义相似度吗点插值和th离散点,值范围 。语义相似度是指两个概念的程度可以代替彼此在同一上下文不改变文本的语义结构(19]。语义结构的变化越大,相似度越小;语义结构的变化越小,相似度越大。在这项研究中,综合采用了地理本体语义相似度算法。的基础上,分析语义距离相似度的影响因素,加权和方法被用来计算语义距离相似性,相似性概念属性相似度和信息。计算公式如下(20.]:
计算语义相似度的层次结构指的是地理实体在表1和图1。在公式(5)- (8), 是语义距离,它指的是任何两个概念节点之间的最短路径和b在本体层次结构,是调节因素。在这篇文章中,= 8。代表概念属性概念节点之间的相似性和b。这个函数实体属性的设置,是属性的数量。此外, , 是一个实数,其值控制在[0,2马克斯(IC (a, b))),在哪里 。信息的数量被定义为发生概率的函数的概念一个。在方程(5),当土地使用类型的点插值和th离散点是等价的, ;的土地利用类型点插值和th离散点并不相同, 。
在方程(5), , ,和 ; ,和是语义距离的调整系数相似性、概念属性相似性,和信息相似性,分别; 。 和是地理实体。为方便计算,GB / t21010 - 2017的土地利用分类在中国和它的意思是用来提取地理实体。地理实体的语义属性如表所示1和土地利用现状分类的本体论层次网络结构如图1。基于方程(5),土地利用类型的一些地理实体的语义相似度计算本体如表所示2。
3所示。实验结果和比较
3.1。实验设计和误差度量
试验研究进行了使用地表温度(LST)数据从陆地卫星8 OLI-TIRS卫星。由于表面复杂多变的环境,LST显示不同的特征在不同的表面环境。为了探索空间插值精度在不同的地区和不同的地表温度,LST在不同的时间间隔在2中选择研究领域,和3个不同的LST条件高温、低温和常温用来进行实验。传统数值插值方法的插值精度往往是密切相关的密度和稀疏的离散点。摘要离散点和点是价值选择的随机和均匀分布。15分和60的离散点随机选择的实验。假设的LST值15点缺失或异常,我们使用60离散点已知的LST值插入15分,以弥补和纠正缺失或异常值。流行的空间插值方法包括克里格,IDW,自然,花键,S-IDW。在此基础上,我们比较和分析五种插值方法的结果与原来的LST值15分的重视。如图2语义inverse-distance加权插值的实验流程图所示。
在实验中,估计价值评估的准确性通过根均方误差(RMSE) [21),平均绝对误差(MAE)、平均绝对百分误差(日军)[16),和估计的方差比率值观测值的方差(RVAR) [22,23]。每个指标给出的正式定义如下:
在公式(10)- (13),测量值的总数;的测量值是th离散点;的估计价值吗th点插值;是在离散点测量值的平均值;的平均值估计价值的评估;估计的方差值的插值;是在离散点测量值的方差。最好的拟合测量值与估计值之间理想条件下可以获得如下:RMSE≈0,梅≈0,日军≈0,和RVAR≈1。
3.2。插值结果的分析和讨论研究面积1
为了验证S-IDW的插值效果三个温度环境下,遥感图像的成像日期在研究面积1是1月11日,2018年,2018年4月17日和8月9日,2013年。相应的图像云是0.54%、0.05%和4.76%,分别。在这种情况下,LST反演,反演数据进行提取和处理。60的分布离散分和15分中价值研究面积1如图3。
插值数据结果和插值精度的五个方法在低温条件下研究a1中可以看到表3- - - - - -5。如表所示3的插值结果S-IDW 8 15分的价值更接近地表温度比其他4插值方法。一般来说,通过数理统计分析和皮尔逊相关分析的五个插值方法,指出美,日军,RMSE S-IDW之间更接近最好的拟合值测量和估计的值在理想条件下比其他4插值方法。RVAR而言,自然样条比S-IDW,但S-IDW比克里格和IDW。皮尔森相关,S-IDW的结果,克里格,IDW,和自然插值与LST在0.01水平显著相关(双尾)的相关系数rS-IDW插值结果与LST为0.959,最大关联,重要的相关系数r样条插值结果与LST 0.616在0.05水平(双尾),与最弱的相关性。
插值数据结果和准确性的五个方法在常温条件下研究a1中可以看到表6- - - - - -8。如表所示6的插值结果S-IDW 8 15分的估计更接近地表温度比其他4插值的方法。一般来说,通过数理统计分析,五种插值方法的皮尔逊相关分析,发现美,日军,RMSE S-IDW更接近最好的拟合值测量值与估计值之间的理想条件下比其他4插值方法。日军,自然比S-IDW更好,但S-IDW比克里格,IDW和样条。RVAR而言,花键比S-IDW更好,但S-IDW比克里格。皮尔森相关,S-IDW的结果,克里格,IDW,自然,和花键与LST在0.01水平显著相关(双尾)的相关系数r0.930 S-IDW插值结果与LST之间,最强烈的相关性。
五个方法的插值数据结果和准确性在高温条件下研究a1中可以看到表9- - - - - -11。如表所示9的插值结果S-IDW 4 15分的价值更接近地表温度比其他4插值方法。一般来说,通过数理统计分析和人五种插值方法的相关分析,指出的美和RMSE S-IDW更接近最好的拟合值测量值与估计值之间的理想条件下比其他4插值方法。日军而言,1.252%的S-IDW高于0.781%的IDW和0.057%的花键但低于1.818%的克里格和1.253%的自然。RVAR而言,自然S-IDW 0.827比0.983,但S-IDW比克里格和自然。的人相关,S-IDW的插值结果,克里格,IDW,自然,和花键与LST在0.01水平显著相关(双尾)的相关系数rS-IDW与LST 0.914比0.843 IDW的克里格的0.794,0.791的自然,和0.669的样条。
3.3。在研究面积2插值结果的分析和讨论
为了验证S-IDW的插值效果三个温度环境下,遥感图像的成像日期在研究面积1是2月11日,2017年4月19日,2018年7月10日,2013年。相应的图像云是0.54%、0.05%和4.76%,分别。在这种情况下,LST反演,反演数据进行提取和处理。60离散分布的分和15分在研究价值面积2图所示4。
插值数据结果和精度5方法在低温条件下研究面积2中可以看到表12- - - - - -14。如表所示12的插值结果S-IDW 9 15分的价值更接近地表温度比其他4插值方法。的插值结果S-IDW 11点值是9.052°C,偏离LST值超过其他4插值方法的插值结果。一般来说,通过数理统计分析和皮尔逊相关分析的五种插值方法,众所周知,美,日军,RVAR, RMSE S-IDW之间更接近最好的拟合值测量和估计的值在理想条件下比其他4插值的方法。皮尔森相关,S-IDW的结果,克里格,IDW,自然,和花键与LST在0.01水平显著相关(双尾)的相关系数rS-IDW插值结果与LST是0.890。
5的插值数据结果和精度方法在常温条件下研究面积2中可以看到表15- - - - - -17。如表所示15的插值结果S-IDW 6 15分的价值更接近地表温度比其他4插值方法。11点的LST价值价值是25.245°C,和这一点的S-IDW插值结果的价值是30.266°C,偏离LST值超过其他4插值方法的插值结果。一般来说,通过数理统计分析和皮尔逊相关分析的五种插值方法,众所周知,美和RMSE S-IDW之间更接近最好的拟合值测量和估计的值在理想条件下比其他4插值的方法。在日军方面,1.856%的S-IDW自然高于1.723%,但低于克里格,IDW和样条。RVAR而言,自然的1.051和0.844的IDW更接近测量值之间最好的拟合值和估计的值比0.806 S-IDW理想条件下。皮尔森相关,S-IDW和自然插值的结果与LST在0.05水平显著相关(双尾)的相关系数r0.620 S-IDW插值结果与LST之间,最强烈的相关性。
5的插值数据结果和精度方法在高温条件下研究面积2中可以看到表18- - - - - -20.。如表所示18的插值结果S-IDW 5 15分的价值更接近地表温度比其他4插值方法。点2的LST价值是价值37.981°C和S-IDW点的插值结果2是35.398°C,偏离LST值超过样条插值但比克里格,IDW,和自然插值,类似于10点。一般来说,通过数理统计分析,五种插值方法的皮尔逊相关分析,发现美,日军,RMSE S-IDW更接近最好的拟合值测量值与估计值之间的理想条件下比其他4插值的方法。RVAR而言,克里格的0.870和0.813的自然更接近测量值之间最好的拟合值和估计的值比0.695 S-IDW理想条件下。皮尔森相关,S-IDW的结果,克里格,IDW,自然,和样条插值与LST在0.01水平显著相关(双尾)的相关系数r0.906 S-IDW插值结果与LST之间,最强烈的相关性。
4所示。结论
本文提出S-IDW考虑地理语义,这是一个新颖的空间插值算法的气象参数。已知观测点之间的地理语义相似度和重量和估计点被认为是全面的,这使得IDW的插值结果更加合理。我们选择2研究领域丰富的土地利用类型在不同温度条件下分析插值和使用4种不同的统计方法对插值精度进行评估。与此同时,五种插值方法的插值结果进行了分析和比较,皮尔逊相关分析。实验结果表明,S-IDW精度一般高于inverse-distance加权法,克里格,自然相邻插值、样条函数插值,但也有一些异常值和异常值插值。比较五种方法的插值结果,发现S-IDW的插值结果更接近LST的测量值比其他四个插值方法。美,日军RVAR, RMSE S-IDW更接近最好的拟合值之间的测量和估计的值在理想条件下比其他4插值方法,S-IDW的插值结果之间的相关性和LST也是最强的。在上述实验条件下,S-IDW的插值结果更准确和稳定。
注意,我们检查所涉及的采样点计算,发现语义插值是一种比传统的数值插值时少有效表面有许多类型的相同。当有更多的均匀插值点,有相似度数值插值。在数值插值其他插值方法有明显优势。例如,克里格插值法具有广泛的适用性,可以更好地反映各种地形的变化。样条插值方法适用于逐渐改变表面,如温度、海拔高度、地下水位高度,或污染水平。IDW插值适用于数据和大密度和均匀分布。在我们的实验中,当插值点的类型单一,语义插值的优点是不明显,甚至低于数值插值。与此同时,当有更多的类型、语义插值方法显然是更好的。
然而,仍然有缺陷在我们的研究中,需要进一步研究改进。首先,对未来的开发框架的语义插值,我们希望考虑时间的连续性来弥补一些缺失的数据,将时间因素9,16)与语义研究时空语义插值插值方法。此外,我们也试图集成密度、方向、高程和其他影响因素(6- - - - - -10插值点的语义多因素语义插值方法插值和发展。此外,为了处理预测空间属性的复杂性和不确定性在大多数现实问题,深入学习和人工智能技术(16,24包括逻辑和统计学习算法可以被视为未来扩展的工作在大数据的时代。
数据可用性
S-IDW数据用于支持本研究的发现可以从相应的作者通过电子邮件要求。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
摘要李和睿杰Gan构思并设计了新的分析方法。睿杰Gan蒙牛Wu,摘要,和秀曹写道。鑫鑫,杰张,瞿Hongjiao建议方法应用于研究。睿杰Gan进行实验分析。所有作者阅读和批准最终的手稿。
确认
这项研究是由中国国家自然科学基金资助(批准号41571400)和支持部分安徽省重点实验室开放研究基金项目的农田生态保护和污染防治。