文摘
六个机器学习方法,包括多元线性回归(高),梯度提高决策树,k最近的邻居,随机森林,极端梯度增加(XGB)和深层神经网络(款),比较近地表温度(T空气)估计中国新一代的地球静止气象卫星Fengyun-4A (FY-4A)观察。split-window通道的亮度温度的高级同步辐射成像仪(农业)FY-4A和数值天气预报数据从全球预测系统的预测变量T空气估计。每个模型的性能和估计的时间和空间分布T空气错误进行了分析。结果表明,XGB模型有更好的整体性能R20.902,偏见−0.087°C,均方根误差为1.946°C。的空间变化特征T空气XGB方法的误差是不太明显的比其他方法。XGB模型可以提供更加稳定和高精度T空气对于一个大型T空气估计在中国,可以作为参考T空气评估基于机器学习模型。
1。介绍
空气温度(T空气)是一个基本的气象观测参数(1- - - - - -3),很令人担忧,在水文学等学科,气象和环境科学。此外,它影响大多数陆地表面过程,如光合作用以及陆地表面蒸散(4]。获取高分辨率T空气数据可以减少人类健康风险和促进城市热岛研究,因此高分辨率T空气信息很重要5,6]。这个夏天T空气价值在中国通常高于20°C,除了在高海拔地区(如青藏高原)。夏天的热浪农业粮食生产产生重大影响,以及水和电的使用(7]。本研究着重于夏天的问题T空气估计在中国使用先进的同步辐射成像仪(农业)的数据。
大规模的T空气数据的获取主要是通过表面气象站收集的数据的插值。然而,气象监测站通常是不均匀的分布由于地理因素,甚至一些人烟稀少的地区没有气象观测(8]。因此,内插的准确性T空气数据是有限的,和研究人员无法获得high-spatial-resolutionT空气信息(9]。
气象卫星,如数量的近地卫星(LEO)和地静止轨道(GEO)卫星可以提供连续的表面(即。,陆地表面温度(LST))和大气观测的空间覆盖在全球和区域尺度(10- - - - - -12]。在过去的几十年中,狮子座和地理观测已逐渐应用到T空气估计与气象卫星技术的发展。LEO卫星只能获取数据到一个地方的一天一次或两次。此外,云污染将减少的有效数据T空气估计(13- - - - - -15]。与LEO卫星不同,地理气象卫星可以持续提供数据每15或30分钟三分之一的地球表面(16- - - - - -20.]。因此,GEO卫星组成一个有效的方法获得高空间和high-temporal-resolutionT空气数据在一个固定区域,有可能促进每日变化的研究T空气(20.,21]。
目前,该方法T空气估计从卫星亮度温度(BTs)和陆地表面温度(LST)产品数据可以分为简单线性的,多元线性和非线性方法(21,22]。先前的研究[7,23,24)表明,机器学习算法可以获得精度高T空气值比其他方法。例如,机器学习模型(比如,一个神经网络模型(NN))具有较高的准确性,和均方根误差(RMSE)降低1.29°C与线性模型相比,(7]。
阿勒登上Fengyun-4A (FY-4A)有14个光谱波段(18,20.,25,26]英尺六英寸可见/近红外(可见光及近红外光谱),六个红外(IR)、水蒸气和两个乐队,磁盘满15分钟的时间分辨率和空间分辨率的红外波段4公里。它提供了一个前所未有的机会获得高精度T空气对中国及周边地区的数据。
机器学习方法用于估计T空气基于中分辨率成像光谱仪(MODIS)数据在几项研究[27- - - - - -29日]。然而,目前缺乏相关的研究T空气基于FY-4A估计。使用FY-4A数据来估计高分辨率T空气具有重要意义的研究人类健康和high-temporal high-spatial-resolution吗T空气在东亚。此外,需要及时和高分辨率T空气可持续的适应气候变化的城市规划和管理数据(3]。
本研究旨在开发机器学习方法T空气估计使用FY-4A数据并比较不同的机器学习模型(即的表演。看不到,多元线性回归(MLR),梯度提高决策树(GBTD),k最近的邻居(资讯),随机森林(RF),极端的梯度增加(XGB)和深层神经网络(款)]T空气估计,我们所知,从来没有做过的。通过比较不同的机器学习算法,估算的机器学习算法具有良好的适用性T空气被选中。该算法是没有地表温度产品广泛适用于气象卫星。
本文的其余部分组织如下。节2,研究区和数据用于模型开发,属和建设的六个机器学习模型T空气估计是描述。变量重要性分析,验证结果和讨论部分中描述3。结论提出了部分4。
2。材料和方法
2.1。研究区域
研究区位于中国,人物1显示了1812个气象站的空间分布用于这项研究。在西方有一个更高的高度在中国比在东部,甚至青藏高原平均海拔超过4000米(30.]。有更多的站在东部地区比在西方由于中国人口和经济发展的不均匀分布(图1)。
2.2。数据
在这项研究中使用的数据主要包括FY-4A /阿勒亮度温度(BT)和L2云掩码数据,全球预报系统(GFS) 3 h预报数据,中国1812站的气象资料和其他辅助数据(经度,纬度,儒略日)。
2.2.1。卫星数据
FY-4A,新一代的中国地球同步气象卫星,2016年12月11日推出。这是固定在一个位置99.5°E赤道之上。热红外split-window通道,12和13的阿勒(BT12和英国电信13)主要用于研究云,气溶胶,T空气估计。他们的中心波长10.8和12.0μ米(31日]。
英国电信12,英国电信13和L2云掩膜产品在2018年夏季(即。6月、7月和8月。每隔3 h ARGI数据被选中(即。,00, 03, 06, 09, 12, 15, 18, and 21 UTC) per day. The data were downloaded from the China National Satellite Meteorological Center (http://satellite.nsmc.org.cn/PortalSite/Data/Satellite.aspx)。
2.2.2。气象数据
本研究选择气象数据每隔3 h在2018年夏季在中国1812个观测点。在这项研究中包括使用的气象变量T空气和数字高程模型(DEM)。T空气2018年夏天从−5°C到40°C,和车站的民主党是在0和5000之间。这些数据都从中国获得气象数据服务中心(CMDC) (http://data.cma.cn/)。
2.2.3。数值天气预报数据和辅助数据
先前的研究表明,BTs(或LST)和之间的关系T空气很容易受到表面特征和大气条件(7,31日]。因此,的准确性T空气估计是有效地提高了添加一些辅助参数(32]。在这项研究中,GFS 3 h可沉淀的水蒸气(GFS采集)、相对湿度(GFS RH)预测领域的数据。GFS预报长度的数据(GFS采集和GFS RH)每天使用3 h,每天有八个时期的数据(即。00 03,06年,09年,12日,15日,18日和21 UTC)。根据GFS数据内插的位置和时间信息阿勒像素。GFS数据通过美国国家海洋和大气管理局(NOAA)国家环境预报中心http://www.nco.ncep.noaa.gov/pmb/products/gfs)。表1提供数据的时间和空间分辨率信息用于本研究。
2.3。方法
2.3.1。准备的训练数据集
英国电信12,英国电信13GFS采集,GFS RH和辅助数据作为输入变量,T空气被用来作为响应变量的机器学习模型(表吗1),所有数据点(在空间和时间)都包含在一个模型(即。XGB模型)(33]。的建设代表训练数据是使用机器学习开发成功的检索模型的关键。因此,数据从6月August-except 1日10日、20日和30日——收集原始数据集,和原始数据集随机分为训练数据集(80%,97年,1773个样本)和测试数据集(2944年20%,24日样品)和相同数量的数据为每本(即。1.0°C的温度),如图2。对于验证,数据没有选择用于培训从6月到8月1日,10日、20日和30日。
(一)
(b)
(c)
2.3.2。机器学习算法
机器学习方法已经广泛用于分类和回归遥感领域的(34- - - - - -41]。在这项研究中,六个机器学习方法,也就是说,高钙,GBTD,然而,射频,XGB,用于构建和款T空气估计模型。的流程图T空气估计基于机器学习方法如图3。L2云掩模产品用于检测云。如果数据是万里无云的,FY-4A数据匹配GFS数据和气象站数据(空间和时间相同),然后T空气通过机器学习模型估计。
作为一个简单的机器学习算法,高通常是气象参数的估计的基本工具(42,43]。同样,作为当地的非线性算法,预测资讯的过程一般分为两个步骤。首先,然而算法预测一个点时,再搜索邻居最近在训练数据集。第二,目标变量的均值k最近的邻居是计算44,45]。在这项研究中,高钙和资讯的hyperparameters设置为默认值。与高钙和资讯,射频是一个合奏decision-tree-based方法提高预测精度,这样每棵树的值取决于一个随机向量独立采样和分布相同的树在森林里(34,43,46- - - - - -50]。Scikit-learn库用于hyperparameter调优叫GridSearchCV从Python过滤hyperparameters包括数量的树木(n_estimators),最小数量的样品(min_samples_leaf),和树的最大深度(max_depth)。参数选择的结果是n_estimators = 200, min_samples_leaf = 50, max_depth = 3。
GBTD的原则是按顺序分类算法应用于训练数据的加权版本(51,52),下降沿先前建立的模型损失函数的梯度方向,然后执行一个加权多数表决结果标识符序列。作为GBTD的改进算法,XGB使用所有数据在每个迭代中,这类似于射频(53,54]。因此,XGB降低模型的复杂度和简化学习模型(35,54- - - - - -58]。在这项研究中,四个hyperparameters GBTD和XGB模型(即。,n_estimators, max_depth, learning_rate (lr), and minimum loss reduction) required to make a further partition on a leaf node of the tree (gamma) were empirically tuned based on RMSE. The optimum n_estimators, gamma, max_depth, and lr in the two models were 500, 0.2, 5, and 0.1, respectively.
一个人工神经网络(ANN)是一种生物启发了机器学习方法(59]。款,安与多个隐藏层的一个子集,使用一个完全连接结构,有能力学习的时间和空间关系(60,61年]。它通过反向传播调整连接强度和神经元之间的最小预测误差的迭代62年- - - - - -64年]。款模型中的每个隐层测试在一个隐藏层和5 - 200个神经元在五个间隔。此外,一些广泛使用的优化器(即。,stochastic gradient descent, RMSProp, and Adam) were tested by comparing the calculated results. In this study, the hyperparameters of the DNN were set as follows: batch_size, 128; dropout_rate, 0.1; stop_steps, 20 (if the validation-set loss function was not improved within 20, training will be terminated); and learning rate, 0.001. The optimizer chose Adam, the number of hidden layers was three, and the number of hidden neurons was 256.
2.4。误差分析
四个统计factors-determination系数(R2)、RMSE MSE,意味着偏见(偏见)则用来评估的准确性T空气估计模型如下: 在哪里Tea是估计的T空气,T办公自动化是观察到的T空气气象监测站,N是样本容量。
3所示。结果与讨论
在本节中,变量重要性的结果,和六个机器学习模型的性能验证。的空间分布特征T空气每个模型的误差也进行了分析。
3.1。变量重要性的结果
相关分析之间的线性关系进行分析T空气和英国电信12,英国电信13GFS采集,GFS RH,民主党,经度(长)、纬度(LAT),儒略日(JD)。表2显示了这些变量的相关系数矩阵。
图中描述4(一)GFS采集,民主党、英国电信12,英国电信13有一个更好的相关性T空气比其他变量R四个变量的值是0.635−0.596,0.459,和0.413,分别。这表明,这些变量在线性扮演更重要的角色T空气估计模型。然而,皮尔森相关系数描述两个变量之间的线性相关;不可能确定两个变量之间的非线性关系。因此,变量的重要性RF算法也进行了分析(图4 (b))。RF算法建模的非线性关系。系统采集被确认为最重要的变量T空气估计在射频模型,GFS RH和BT12比其它预测也扮演了重要的角色。因此,采集和RH被用作输入有效改善的准确性T空气估计,与之前的研究一致(65年]。
(一)
(b)
3.2。模型性能结果
评估每个模型的整体性能,使用10倍交叉验证方法。K倍交叉验证模型用于配置选择。当一个特定的值K被选中(K10),数据集被随机均匀分布在K组。一组折叠为测试,K−1组折叠进行训练。的总k使用不同的测试验证,模型性能计算折叠为每个验证(35]。最后,平均验证结果用于评估每个模型的整体性能。
图5说明了六个模型有不同的统计参数,包括RMSE,偏见,MSE,R2。高钙模型性能最低的六个模型。RMSE的变化范围,偏见,MSER2高钙模型相当宽;甚至RMSE的范围为1.602°C - 4.487°C,虽然在这项研究中使用的款模型有更好的整体性能和更高的效率比其他五种型号。款模型显示精度最高,平均RMSE 1.736°C。RMSE款模型的范围为0.852°C - 2.584°C,显示良好的浓度和稳定性,呈现在图5(一个)。此外,整体的表现XGB和GBTD模型的模型是等价的,是更好的比高,然而,射频模型。
(一)
(b)
(c)
(d)
3.3。验证结果
内部模型性能作为一个指标来验证每个模型。模型精度必须评估数据集,并不是用于训练和测试。验证发达高钙,射频,然而,GBTD, XGB和款模型,观察到的数据不是用于训练和测试使用(验证数据集2.3.1节)。图6说明了定量验证估计的结果T空气在验证期间(1日10日、20日和2018年6月30日)。与测试的结果数据集相比,总体精度验证数据集上的六个模型降低了。例如,RMSE款模型的T空气使用测试数据集是1.736°C,而验证的结果是2.006°C。这种差异可能是由于过度拟合因为选择最好的模型并不是基于最终验证结果(35]。
(一)
(b)
(c)
(d)
(e)
(f)
高钙的偏见,射频、款、GBTD,和XGB模型在±0.2°C,表明没有明显的高估或低估。相比之下,然而,模型显示更大的负偏压−0.492°C。的原因,然而,模型有较大的负面偏见可能是可怜的鲁棒性。鲁棒性主要取决于数据集了,可怜的健壮性使模型难以直接适用于其他情况下,所以资讯模型有一个低偏差测试数据集和高偏差的验证数据集。
XGB模型建模有极好的性能R20.902。的R2GBTD和款模型的值分别为0.898和0.890,分别R2剩余价值的三个模型是小于0.89。此外,与其他模型相比,XGB和GBTD模型可以反复学习来生成一个加权平均弱的学习者。因此,XGB和GBTD模型显示一个相对更好的性能在大多数网站验证数据集。一般来说,XGB模型显示总体性能高于其他五个模型验证数据集。
的T空气评估模型基于卫星和数值预报数据易受高度和表面粗糙度等因素。为了进一步评估这些模型的适用性,每个气象观测的空间分布是评价(数据7- - - - - -9)。
(一)
(b)
(c)
(d)
(e)
(f)
(一)
(b)
(c)
(d)
(e)
(f)
(一)
(b)
(c)
(d)
(e)
(f)
可以看出T空气估计错误的模型(图显示明显的空间分布特征7)。一般来说,东部地区的RMSE相对较低(如广东省)和高每个模型的西北地区(例如,新疆)。例如,广东省的RMSE XGB模型大约1.2°C - 1.8°C,而在新疆约2.0°C - 3.2°C。因为西北地区相对较宽T空气昼夜变化、高海拔和几个气象观测,西北和华东的精度差别是显而易见的。此外,资讯的RMSE款,GBTD和XGB模型是相对较低的东部和南部地区。然而,高钙,射频、资讯和款模型有较高的RMSE在中国西北。相比之下,GBTD和XGB模型在中国西北部相对较小的RMSE因为GBTD和XGB模型可以生成重复的加权平均来调整不同地区的适用性通过重复学习的大量的数据。
此外,龚的研究(2015)(66年插图的RMSE GFST空气在大多数东部地区达到1.5°C (3.0°C和在西北地区高于3.5°C。相比之下,结果表明,RMSET空气估计的,款XGB和GBTD模型显然低于GFS数据。在目前的研究中,XGB模型的均方根误差为1.0°C - 2.0°C在最东部地区,这是在西北地区低于3.5°C。此外,RMSE < 2.0°C占48.2%和RMSE < 2.5°C XGB模型中占87.6%。
六个模型显示相同的分布趋势如图8,R2在东部地区较高,但是R2逐渐变得更低,因为它接近了西南地区。与中部地区(例如,河南省),查看天顶角(VZA)在中国西部ARGI比较大。VZA越大,辐射到达传感器将高度受到大气的影响,这可能导致的差异R2的估计T空气西南和中部地区之间的价值。
高的模型,所有中国的偏见。射频和资讯模型,相对较高的负偏压存在在中国西南地区(例如,云贵高原),如图9。这可能是上述三个模型的相对简单的结构,不能模拟复杂T空气中国的变化,导致underfitting。除此之外,T空气估计的模型高估了款在中国西北部,这是原因的RMSE款模型在这些地区也很高。相比之下,GBTD XGB模型和相对较低的偏见在中国西北部,那里绝对偏差范围从2.0°C到3.0°C。总之,偏差较低的沿海地区和更高的西北部地区,主要与夏天的特点有关T空气改变。
图10给出了时间序列的RMSE六个模型验证期间。高钙的RMSE模型明显高于其他模型,RMSE从2.5°C到4.3°C。相比之下,RMSE GBTD和XGB模型显示RMSE相对较低(即。,1.8°C - 2.2°C)相比,射频,然而,款模型。
基于上述分析,预计XGB模型可以提供一个更加可靠和准确的T空气估计比其他模型。为了评估的贡献XGB模型预测因素T空气估计,BTs (BT数据12和英国电信13(GFS)和GFS数据采集和RH)先后介绍了(表3)。如表所示3民主党,经度,纬度,儒略日作为输入变量,和RMSE XGB模型3.003°C。的准确性T空气当英国电信估计是明显改善12和英国电信13包括在模型中。此外,当GFS采集和RH被添加到输入变量,XGB模型的RMSE下降到2.164°C,指示GFS采集和RH的重要影响T空气估计。这些结果是可以理解的因为采集和RH是主要的大气校正和LST检索所需参数。的RMSE XGB模型提高了0.228°C只有GFS数据时介绍了阿勒BTs和GFS数据介绍了输入变量。这表明GFS数据和卫星观测数据在提高有重要的作用T空气估计模型。的RMSET空气估计模型是小于2.0°C卫星BTs和GFS数据引入时,这被认为是“准确”的精度水平67年]。
XGB模型误差与高度的关系,观察到T空气,VZA进行了分析。图11证明了估计的散点图T空气与DEM误差,T空气,VZA。可以看出T空气误差主要包括−3°C到3°C。结果表明在高海拔地区,正的偏移,产生更大的RMSE比低海拔地区。模型显示一个正的偏移T空气低而表现出的负偏压high-air-temperature条件。因此,该模型显示更大的RMSE低,由于低估和高估higher-air-temperature条件。这类似于先前的研究结果(38]。此外,站的不均匀分布模型在高海拔地区的适用性差。值得一提的是,VZA对模型性能的影响可以忽略不计,如图11 (c)。
(一)
(b)
(c)
4所示。结论
在这项研究中,六个机器学习方法(高钙、射频、资讯,款,GBTD,和XGB)T空气估计从FY-4A阿勒在中国数据比较和分析的时空特征的性能。验证结果凸显了高的潜力T空气估计方法利用机器学习和显示XGB模型的准确性比高,射频,资讯,GBTD和款模型在大多数网站T空气估计在中国。验证了使用时空上独立的数据,因此该模型性能被认为是相当可靠的。
本研究提高了先前的研究在以下关键领域。首先,T空气评估模型建立了基于FY-4A农业数据和其他辅助数据。结果表明,high-temporal high-spatial-resolutionT空气(RMSE值< 2.0°C)可以获得基于FY-4A数据。根据这项研究的巴斯克斯(67年),普遍接受的精度水平remote-sensing-based“准确”T空气估计是1°C和2°C之间。第二,六个机器学习模型的精度和性能(高钙,射频,然而,XGB, GBTD,和款)进行比较和分析。结果表明,XGB模型可以提供更稳定和高精度T空气估计,它提供了一个参考T空气评估基于机器学习模型。最后,的准确性T空气估计基于卫星数据可以有效地提高了增加的数值模型T空气。实验结果表明,只用于大规模卫星数据T空气在中国估计,XGB模型的均方根误差为2.376°C,但RMSE利用卫星数据与数值模拟相结合T空气数据达到了1.946°C。
然而,除了本研究的新奇事物,所使用的数据集的限制是晴空的限制条件。同样,机器学习算法不能推断的范围之外T空气价值。如果T空气价值增加超出了范围内不能观察到当前的培训期间,必须重新训练模型。此外,未来的研究可以探讨是否添加其他预测,比如distance-to-coast和植被信息(归一化植被指数等),可以改善的准确性T空气估计模型。
数据可用性
FY-4A农业数据从中国国家卫星气象中心下载(NSMC) (http://satellite.nsmc.org.cn/PortalSite/Data/Satellite.aspx)。GFS数据来源于国家环境预报中心https://www.nco.ncep.noaa.gov/pmb/products/gfs/)。气象站的数据访问中国气象数据服务中心(CMDC) (http://data.cma.cn/)。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作得到了国家自然科学基金(41527806)和中国国家重点研发项目(2016 yfa0600101)。作者要感谢国家卫星气象中心(NSMC)提供FY-4A数据,中国气象数据服务中心(CMDC)气象数据,和国家环境预报中心(NCEP) GFS数据。