文摘
降尺度技术生产高空间分辨率降水分布来分析影响气候变化的数据变得稀缺地区或地方。在这项研究中,基于三个统计学习算法,如支持向量机(SVM),随机森林回归(RF)和梯度增加解释变量(GBR),我们提出了一个有效的降尺度方法生产高空间分辨率降水。为了演示模型的效率和精度比传统的多重线性回归(高)降尺度模型,我们做了一个降尺度分析日常观察到的降水数据来自34个监测站点在孟加拉国。验证表明,的GBR可能达到0.98,与射频(0.94)相比,支持向量机(0.88),和多重线性回归(高)(0.69)模型,所以GBR-based降尺度模型最佳的性能在所有四个降尺度模型。我们建议GBR-based降尺度模型应该被用来取代传统高钙降尺度模型来产生一个更精确的地图洪水灾害管理的高分辨率降水,干旱预测、土地和水资源的长期规划。
1。介绍
全球变暖是显著影响环境,水文,生态系统。持续变暖21圣世纪将显著影响降水和季风的加强,导致极端暴雨和干旱事件(1- - - - - -3]。南亚地区是一个著名的夏季季风。南亚季风的形成主要是由于季节性运动的压力带,风带的影响,以及热陆地和海洋之间的差异以及地形因素。大约80%的降水与季风(南亚有着紧密的联系4- - - - - -6]。超过十亿人依赖季风降雨对农业生产的资助,水力发电,以及其他基本需要(7]。尤其是孟加拉国位于世界上最大的三角洲的密集网络主要河流及其支流,导致孟加拉国洪水频发的国家。由于雨养农业的依赖,孟加拉国和高易受气候变化非常敏感。自孟加拉国只有几个和稀疏的降水监测站,是非常重要的生成高空间分辨率降水数据,以减轻气候变化的影响。然而,只有非常有限的降尺度研究在孟加拉国是由:观测降水数据在孟加拉国缩减规模,利用多重线性回归的核心部分降尺度算法(8,9]。以来,大型和小型动态非线性关系在这些研究被忽视,获得的降尺度精度是不稳定的。模拟的降水数据整体气候模型的耦合模型相互比较项目阶段5 (CMIP5)缩减规模,利用模型输出数据的方法(10,11),但这种方法只能应用于模拟气候数据。
一般来说,任何国家和一些稀疏的降水监测站,降尺度是关键技术来生成高空间分辨率降水数据。降尺度可分为动力降尺度和统计降尺度。动态缩小规模主要取决于物理原则气候系统和高分辨率区域气候模型,而局部变量统计降尺度是基于统计关系和大规模的变量(11]。与动力降尺度依赖一些当地的模型或区域气候模型,统计降尺度使用多重线性回归模型建立局部变量之间的相关性和大规模的变量。因为地球的气候是一个复杂、多维多尺度系统具有不同物理过程作用于不同时间和空间尺度上的统计降尺度不能揭示局部变量之间复杂的非线性关系,大规模的变量(12,13]。
与传统的统计技术相比,先进的统计学习技术显示性能优良在解决复杂非线性问题的变量之间的相关性14]。统计学习技术可以映射预测(s)仅依靠现有的关系而不是显式的函数(15]。主要包括以下统计学习技术。(一)支持向量机(SVM)使用一个内核函数特征映射到一个高维空间分类和回归;支持向量机的主要优势在于可以有效地解决小样本、非线性和高维回归问题。(b)随机森林(RF)是一个基于装袋的集成学习方法,它可以解决分类和回归问题。(c)梯度增加解释变量(GBR)是一种基于提高整体学习模型,减少了损失的拟合残差获得较高的预测精度。相对于其他统计学习技术(如神经网络)、支持向量机只需要少量的样本和射频GBR可以避免过拟合(13),所以在这项研究中,基于支持向量机,射频,GBR,我们提出一种新的降尺度方法产生一个更精细的空间分辨率降水地图。为了演示模型的效率和精度比传统的多重线性回归(高)降尺度模型,我们使用降尺度分析日常观察到的降水数据来自34个监测站点在孟加拉国。此外,在获得高空间分辨率降水分布基础上,我们分析了模式和孟加拉国的降水从1989年到2018年的趋势。
2。降尺度方法
基于三个统计学习算法,如支持向量机(SVM),随机森林回归(RF)和梯度增加解释变量(GBR),我们提出了一个有效的降尺度方法生产高空间分辨率降水,特别是对于任何国家和一些稀疏的降水监测站。
2.1。三个已知统计学习算法
支持向量机(SVM)可以映射到一个高维空间的复杂数据功能使用非线性映射算法和单独的数据使用最优线性超平面(16- - - - - -18]。对于给定训练数据 ,支持向量机是找到回归函数 ,这样有最多偏离实际的价值 ,在哪里是一个内核函数将输入数据映射到一个高维空间,和参数和分别的重量项和偏差项。基本的搜索算法是减少回归风险由以下公式: 在哪里是一个成本函数,参数可以平衡预测误差和模型的复杂性,以避免过度拟合训练数据。
随机森林(RF)使用装袋(或引导聚合)技术、解相关技术结合一系列小规模的决策树为一个程序更好的回归预测(19]。射频可以克服单一决策树的缺点过度拟合训练数据,可以用一些缺失值处理数据。通过使用随机选取的一分之一米预测的n预测,一个新的节点射频可以生成的决策树,在引导重采样技术是用于随机选择k样本N原始训练样本作为训练集,其余的n - k(即样品。,out-of-bag samples) are used for cross validation. Each decision tree is only trained by米预测和k训练样本,不同的决策树是由不同的预测和随机选择的训练样本。为了减少由决策树预测结果的方差最优预测由射频的平均预测决策树(即。所谓聚合过程)。射频模型的预测精度和计算效率主要受决策树的数量和预测/训练样本的数量在每一个决策树(20.]。
梯度增加解释变量(GBR)是一个整体回归树模型,从一个简单的回归树和添加一个新的回归树(一次又一次21]。GBR是加权和回归树: 在哪里是一个米th回归树,提高预测精度。核心程序GBR是不断减少的损失通过搜索最优参数的新回归树适合现有合奏的残留误差的负梯度回归树模型。在细节。F (x)GBR可以通过迭代估计过程通过使用下列公式。
在每个迭代中,一个新的回归树构造残差最小化使用梯度下降法。GBR的输出可以达到更好的泛化性能比单一回归树(22]。从射频GBF背后的想法是非常不同的。RF是建立所有回归树并行和射频的输出预测结果的平均决策树,同时GBR是建立回归树的形式的输出序列和GBR是预测结果的总和所有回归树。
2.2。基于统计学习的降尺度技术
广泛使用的统计降尺度技术通常是基于传统多元线性回归(高),不能有效应对不稳定的降尺度时间序列和降尺度因子之间存在共线性,使降尺度性能显著的改善有限。在这项研究中,基于GBR、射频和支持向量机,我们提出一种有效的降尺度方法生产高空间分辨率降水,每日警所一级的降水数据和经度/纬度/高度作为GBR / SVM / RF模型的输入。输出是缩减规模降水产品。降尺度模型可以在很大程度上弥补缺陷的高钙降尺度方法。
验证我们的降尺度方法,注意到可观察到的降水数据规模小,为了避免过度拟合和使用尽可能多的数据在模型训练,我们利用5倍交叉验证方法23]。主要的模型训练过程是把所有的数据分成五个子集;每次一个子集用于测试集,其余四个子集用于训练集,最后,五训练误差的平均值作为结果。确定的相关性( ),平均绝对误差(MAE)和均方根误差(RMSE)是用来评估不同的降尺度模型的性能。证明的准确性和效率模型与传统的高钙降尺度模型,我们使用降尺度分析日常观察到的降水数据来自孟加拉国。
3所示。研究区域与数据
孟加拉国位于大江大河三角洲从喜马拉雅山脉,导致它的地势非常平坦(图1)。传统上,它分为7个区域(图2)。宽高湿度、温暖的温度和降水的季节性变化的主要气候特点是孟加拉国。这气候主要是由于地理位置,南北大陆大气压力梯度,陆地和海洋表面温度波动24]。由于显著的高在季风季节降水和平板和低三角洲平原河网密度(图1)、洪水及相关灾害频繁发生(25]。由于agriculture-based经济,高空间分辨率降水地图可以发挥关键作用在孟加拉国防洪,抗旱和水资源管理。因为很少有和稀疏的降水监测站在孟加拉,有必要进行降尺度分析观察到的降水数据在孟加拉国。为了实现这一目标,孟加拉国的逐日降水数据是来自34监测站(图3孟加拉国的气象部门,经度,纬度和海拔数据提取孟加拉国从谷歌地球26]。基于统计上优于降尺度模型部分2。2我们可以生产高空间分辨率降水在孟加拉国。
4所示。结果与讨论
4.1。基于最优统计学习空间降尺度模型
基于1989 - 2018年逐日降水数据和经度/纬度海拔数据在孟加拉国,我们使用基于统计学习降尺度模型产生更高的空间分辨率降水数据。表1提供我们的模型的验证结果和传统的高钙降尺度模型在5倍交叉验证处理。降尺度模型展示良好的性能比传统的高钙降尺度模型。而言,值时,缩减规模使用GBR和射频数据显示与原始观测数据一致性良好。在验证分析,GBR产生最高的降尺度模型RMSE最低(0.98)和(9.63)和梅(7.24)。图4显示了缩减规模之间的关联产品和观察到的降水。的GBR降尺度模型取得了最高的性能其次是射频、和SVM降尺度模型排名最后。
(一)
(b)
(c)
在空间分布方面,我们降尺度模型比传统的高钙模型(图5)。缩减规模产生的降水的空间分布地图GBR和射频与观测高协议。降尺度降水产生的支持向量机显示只有粗空间分布特点:中部地区的降水逐渐从西方增加。
(一)
(b)
(c)
(d)
(e)
总之,通过使用我们的降尺度模型(GBR、射频和支持向量机),模拟地形变量和观测降水数据之间的关系在孟加拉国,很明显,GBR降尺度模型表现最好,与射频模型相比,支持向量机模型和传统的高钙模型。
4.2。缩减规模的空间变异分析降水在孟加拉国
为了分析降水的季节性变化在孟加拉国,我们使用我们的GBR降尺度模型生产季节平均降雨量分布在1989 - 2018(图5)。孟加拉国大大高在季风季节降水和低降水在剩下的三个赛季(图6)。在冬季,降水显著降低,接近统一的空间分布;premonsoon季节,降水发生在中部地区最高;在雨季,降水发生在西南部和东南部地区高;postmonsoon季节,降水分布非常不均匀,具有较高的空间变异性。相对干燥的条件将发生在西北部和中部地区。
(一)
(b)
(c)
(d)
使用缩减规模降水的GBR降尺度模型中,我们展示了一个孟加拉国的七个地区(图之间的区别7)。东部地区显示波动最高,其次是东南地区。f统计量的值超过了临界点的方差分析(方差分析)表明这些地区差异显著。
基于Mann-Kendall趋势检验和森的斜率测试(表2)、东部、西南、南部和东南部地区显示出向上的趋势在1989 - 2018年期间,但这种趋势并不显著。剩下的三个区域显示下降趋势,只有一个地区显示统计学意义。在所有七个地区,北部地区显示最高−13.38毫米/年下降的趋势,而东南部地区显示上升趋势,最高4.24毫米/年。
5。结论
对于一个agriculture-based像孟加拉国这样的国家,水资源最有助于农业规划。降水对农业发展起着更重要的作用比其他气候和环境变量。可以影响洪水灾害管理,抗旱,土地和水资源的长期规划,不同的基础设施。因此,生产高空间分辨率降水数据分析气候变化的影响是至关重要的,尤其是对一些国家和稀疏的降水监测站。降尺度是一种有效的方法来解决这个问题。广泛使用的统计降尺度技术通常是基于传统的儿童高,不能有效应对不稳定的降尺度时间序列和降尺度之间的共线性存在的因素,并使显著缩小规模的提高性能有限。在这项研究中,基于GBR、射频和支持向量机,我们提出一种有效的降尺度方法生产高空间分辨率降水从日常警所一级的降水数据和经度/纬度/高度数据。为了证明我们的模型与传统的效率和准确性高钙降尺度模型,我们做了一个降尺度分析日常观察到的降水数据来自34个监测站点在孟加拉国。我们降尺度模型明显优于传统的多重线性回归(高)降尺度模型。的GBR-based降尺度模型在所有四个降尺度模型最佳的性能。 Therefore, we suggest that the GBR-based downscaling models should be used to replace traditional MLR downscaling models to produce a more accurate map of high-resolution precipitation for mitigating impacts of climate disasters, especially South Asian countries with few and sparse precipitation monitoring stations.
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
信息披露
吴一尘和志华张co-first作者。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究受到了欧盟委员会的地平线2020框架计划(861584)和泰山著名教授基金。