文摘

最近,使用数值降水预报已经成为一种常见的方法来改善交货时间流速及流水量预测水库防汛监管。五个操作的控制预测全球预测系统从不同的中心对观测数据进行了一系列的面积加权验证和分类指标在2017年5月到2015年9月——6 subcatchments息县排水的淮河流域。根据防洪安全的需求,采用四种不同的系综方法减少数据集的预测错误,尤其是失踪报警(MA)的错误,这可能是有害的水库管理和防洪。结果表明,原始预测数据集有大量失踪报警错误(MEs)并不能直接应用到洪水预报提前期的延伸。虽然整体方法可以提高降雨的性能预测,失踪报警误差还大,导致一个巨大的防洪风险。提高洪水预报的交货时间,以及避免降雨预测的风险,一个新的集成方法的基础上,提出了支持向量回归(SVR)。与其他方法相比,新方法具有更好的能力在降低我的预测。更具体地说,使用新方法,洪水预报的交货时间可以延长到至少3 d没有伟大的防洪风险,这对应于防洪减灾的目的。

1。介绍

随着经济的快速发展和人口增长,以及气候变化的影响和增加对淡水的需求,中国的很多地区正面临着水资源短缺。与此同时,由于季风气候的影响,在中国洪水灾害频繁发生在雨季,对社会造成巨大的经济损失(1]。流速及流水量预报和洪水调节起着关键的作用在中国的防洪和水资源管理系统(2- - - - - -4]。传统上,洪水预报方法需要从地面站点降水作为输入;预估时间是有限的,不能满足防洪和水资源利用率的需求(5,6]。因此,这是一个最紧迫和重要的任务努力延长交货时间,提高洪水预报的精度。许多先前的研究已经提到的,数值降水预报是一个有效的方法来解决这个问题7,8]。

最近,计算机技术革命和进步的气象和气候模型的不断发展带来了数值天气预报的9- - - - - -11]。观测系统研究的重要组成部分和可预测性试验(THORPEX) TIGGE(全球THORPEX互动大合奏)数据集包含集合预报数据集从11个主要预测中心在世界范围内,从2006年开始,旨在提高影响力的天气预报的准确性在两周内(12,13]。许多研究TIGGE降水预测被广泛开展极端降雨事件和水文预报。克拉克,嗨14]应用中程数值天气预报模式输出摘要(国家环境预报中心)流速及流水量预测在美国,但结果表明,模型显然技能在预测降水和温度较低。Pappenberger et al。15)提高了洪水预报的交货时间提前8天利用TIGGE气象数据作为输入欧洲洪水预警系统。此外,另一个在上淮河流域还显示,一个可靠的洪水警报可以最早提前10天(16]。他等。17)发现,降水将主宰和传播的不确定性通过耦合atmospheric-hydrologic-hydraulic级联系统。苏et al。18)评估定量降水预报的错误概率定量降水预报从六个操作TIGGE全球整体预测系统在2008年至2012年6月到8月在北半球。Sagar et al。19)评估的技巧在印度暴雨数值天气预报模型。

由于降水预测的低技能,许多研究人员认为,可以通过缩小规模提高预测的准确性和集成预测20.- - - - - -24]。尽管几种合奏方法被用来减少降雨的错误预测,大多数这些方法建立了不同的预测和观测值之间的关系可以降低整体的错误,例如平均绝对误差(梅斯)或均方根误差(rmse)而忽略了不同效果的假警报(FA、事件预测发生但没有发生)和失踪报警(马、事件预测不发生但确实发生)在防洪安全23,25]。足总只减少了洪水资源的好处,而一个马是防洪安全不利。在防洪安全是最重要的目标,主要任务是找到一个方法可以提供可靠的降水预报提高洪水预报的交货时间没有带来巨大的洪水风险大的MEs(失踪报警错误)。

在本文中,我们评估五个预测中心的预测在淮河流域在2017年5月到2015年9月——中国。线性和非线性系统分析方法应用于集成预测减少预测误差的目的。此外,由于防洪安全是水资源管理的首要任务,具体将注意MAs的错误,以避免增加防洪风险;一个新的目标函数也会提出。在下一节中,我们详细的评价指标以及校正方法,包括线性和非线性的方法。部分3介绍了数据集的概述和研究区。结果和讨论部分中描述4,最后,提供了结论部分5

2。方法

后处理预测的主要假设是观察和预测相关,和未来行为的系统将保持不变。本研究的目的是为了减少降雨预报的我通过系统分析,降雨预测可以更好地利用在洪水预报在防洪带来巨大的风险。

2.1。验证方法

降水预报的准确性通常是作为评价标准确定降雨预报信息是可用的。估计预测的技能有不同的交货期,多个经典的统计特征进行了测定比较预测和观察,包括美和RMSE。同时,定性分析也补充了基于统计特征的分类标准每日降雨量由中国气象部门制定。根据降雨总量在24 h,这个标准将每日降水划分为七种类型:没有下雨,小雨,中等雨,大雨,暴雨,暴雨倾盆,极端暴雨。一般,气象人员,没有雨意味着每天的降水是0;然而,由于有限的影响小于1毫米的降雨形成的洪水,没有雨的标准改为小于1毫米在这项研究中,每个分类标准在表中有详细描述1

的基础上预测和观察的大小,三组合的结果如下:冲击:预期的大小是一样的的观察报警小姐:预测的幅度小于的观察假警报:预期的大小大于的观察

预测的技能可以评估基于列联表,其中包含的频率组合。从列联表、打击,马和足总可以计算为每个大小:

命中率(人力资源):

马率(MAR):

足总率(远): 在哪里n我,我与预测病例数的大小和的大小来衡量j;N是预估的数量的大小

2.2。整体方法

由于大气运动的确定性和随机性,是不可能获得的初始场数值预报客观和准确,和一个完美的天气预测模型不存在(26]。集成预测是一种有效的方法来消除观测误差和分析误差带来的不确定性通过使用来自不同数据源的数据(27,28]。几个病例证明,可以通过使用集合的方法提高降水预报的准确性。在以前的研究中,研究人员通常使用摄动的预测从一个数据集或控制预测从几个数据集作为输入集合预报的29日- - - - - -31日]。

在本文中,我们使用的控制预测五选定数据集和三种线性集成预测方法相比,即系综均值(EM), bias-removed合奏的意思(BREM)和线性回归(LR)方法32,33]。与此同时,由于先前的研究表明,不同震级的预测错误表现出非线性变化,支持向量机,是一种有效的非线性回归方法,也用于集成预测。

2.2.1。Bias-Removed合奏的意思

bias-removed合奏的意思是发达的合奏的意思是,计算公式如下: 在哪里 代表观察培训期间的平均值,代表成员集合预报中使用的数量,F代表成员的预测价值, 代表成员的平均价值在培训期间,F是集合预报值。

2.2.2。支持向量回归

在公式(4),集合预报值F之间的关系和成员的预测价值F1,F2、…F是线性的。可以被认为是非线性的关系如下:

在公式(5),f代表的是非线性关系。BP人工神经网络模型、支持向量回归模型可以用来近似f

支持向量机(SVM)是一种机械学习方法分类和回归Vanpik等人1995年提出的基于结构风险最小化(SRM)原则(34]。SVR(支持向量回归),具有良好的泛化和非线性处理能力,已经广泛用于水文(35- - - - - -38]。下面简要描述SVR的方法论。

SVR对非线性情况下的基本思想是将原始问题映射到高维特征空间的线性问题的非线性变换近似f与输入向量 ,输出向量 和样本集 :

在公式(6),f(x)是回归函数, 是非线性变换函数, 权向量,b是阈值。然后,εsvr模型是由解决优化问题:

问题的对偶形式可以表示为 在那里, 代表了核函数。拉格朗日乘数法后,α ,在公式(8)已经决定,εsvr回归函数f(x)可以成立

在这项研究中,径向基函数内核参数σ被选为非线性变换:

的参数ε在公式(8)应事先决定的,但是在许多实际情况下,很难确定的价值ε前培训。为了解决这个问题,一个新的参数ν介绍了由Scholkopf(ν-SVR) [39]。随后,优化问题可以被改变

此外,双重形式的公式(11)是

的能力νsvr取决于参数C,ν,σ。成本不变C是一个模型的复杂性和泛化之间的妥协。它是用来调整比率的信心在样本空间范围和经验风险,决定样本的惩罚程度的损失大于ε。的参数ν代表了支持向量的下界和上界的差距错误。此外,自ν介绍了优化ε控制不敏感频带的宽度和影响支持向量的个数,ν也间接影响支持向量的个数和预测精度,并减少ν导致减少支持向量。因此,二次规划问题(公式(12)可以解决通过确定这三个参数和集合预报的美可以通过以下公式计算:

在公式(13),f(x),y显示第i个集合预报和观测值l是样本容量。

通常,为了得到最佳逼近能力、非线性优化算法用于优化参数C,ν,σ通过最小化的美。然而,支持向量的个数可以很大的如果νsvr模型是通过优化算法来解决。因此,参数的范围ν应该分析确定吗Cσ由微扰法。

摘要νsvr模型被用来近似f和SVR的参数优化算法()粒子群优化算法的目标函数最小化的美40,41]。此外,支持向量的个数小于控制l/ 2通过控制的范围ν

本研究中使用的所有SVR模型是基于开源软件开发的LIBSVM林Chih-Jen。更多信息模型是可用的https://www.csie.ntu.edu.tw/∼cjlin /

3所示。数据和研究区域

3.1。研究区域

淮河流域地处中东的中国长江流域和黄河流域之间,面积27万公里2。类似于许多中国盆地受季风气候的影响,流域的年降雨量是不均匀的,在春天干旱在夏季和秋季和冬季和雨。松辽盆地年平均降水量875毫米,和雨季发生从5月至9月,在此期间50% - -75%的年降水量集中。因此,洪水频繁,在雨季洪水资源丰富的盆地。然而,只有少量的洪水资源被用于解决水源的问题在干旱季节。淡水的需求的不断提高流域防洪上实施了新的挑战和风险减轻。息县集水是最重要的一个subcatchments上淮河盆地,位于上游地区的淮河的主流。摘要息县流域被选为淮河流域的典型subwatershed TIGGE评估和正确的降水预报,从而能够提高洪水预报的交货时间。此外,为了满足洪水预报的需求,我们把息县流域划分为六个subcatchments,如图1

3.2。预测数据和观测数据

11个来自不同国家和地区的主要业务预报中心参与TIGGE计划,包括澳大利亚气象局(BoM),中国气象中心(CMA)、天气预报和气候研究中心(CPTEC),加拿大(ECCC)环境和气候变化,欧洲中期天气预报中心(ECMWF),日本气象厅(日本),韩国气象厅(KMA),法国国家气象服务(Meteo-France),英国气象办公室(UKMO),国家环境预报中心(NCEP),和国家中期天气预报中心(NCMRWF)。五个被选在这个研究中心:CMA,日本气象厅KMA, ECMWF和UKMO。其他六个中心并不包括在这项研究由于种种原因。物料清单的数据于2010年结束。CPTEC的位置是在南半球,北半球不包括初始扰动观测气候。的数据集ECCC 2017年失踪几个月。Meteo-France只提供整体预测6:00和18:00 UTC。摘要采用的数据集在2017年失踪很多天。NCMRWF TIGGE于2017年8月开始提供数据。本文中使用的数据集的更多细节简要表2

如表所示2,5个中心的整体预测的差异的水平分辨率和预测长度,一系列的方法应用于数据一致。(1)我们只选择在00:00UTC基准时间的预测;(2)本文中使用的预测长度是168 h(7天);和(3)中心的空间分辨率转换为0.50×0.50。此外,几个站位于不同subcatchments息县在淮河流域盆地被选为验证数据集,如图1

4所示。结果与讨论

获得的结果讨论了以下四个部分:(1)评估生不同的交货期和subcatchments降水预报;(2)雨预测技能不同的搭配方法;(3)一个新的基于SVR的整体方法和我最小化;和(4)比较使用不同的乐团的表演获得方法。

4.1。评估的原始预测

作为本研究的第一步,我们估计原始TIGGE降水预报的准确性从选中的5个中心通过与实测资料的关系。降水预测的性能从不同中心如图2。值得注意的是,日本气象厅在所有subcatchments最好的表演,尤其是对较长的交货时间。对于大多数subcatchments, ECMWF的预测能力接近日本气象厅当交货时间小于5 d,但ECMWF的RMSE急剧上升随着时间变得更长。ECMWF的预测能力,总的来说,UKMO,和现场表现出更明显的下降趋势随着时间的增加导致,而另外两个在不同的交货期预测波动。此外,KMA性能的研究领域很不寻常,的RMSE + 1 d预测几乎是两倍的其他中心的交货时间。然而,RMSE KMA降低到正常水平领先时间增加时,它最不稳定性能的五个数据集。

每日降雨量预测与实际降雨量在2015 - 2017年期间整个息县排水+ 1 d, d + 2, + 5 d和+ 7 d如图3。低技能的KMA + 1 d预测显然是确认图3(一个),这是由于降雨的高估了。表3列出了三个息县排水的利率不同的交货期。从表中,反向小时不同交货期,与图的结果一致2。此外,很明显,所有的法尔斯有不同的交货期比火星更大,表明这些预测可能高估了实际的降雨。然而,图4意味着相反结论的日本气象厅和ECMWF预报可能低估了降雨,因为马的异常值更多,更大的价值比。预测误差分布结果表明,日本气象厅和ECMWF低估了降雨,CMA, KMA, UKMO高估了降雨量。虽然三率和rms表明,日本气象厅和ECMWF是最熟练的数据集在息县排水,正如上面提到的,他们仍然不宜延长交货时间的洪水预报。分析结果证明,原始的降雨预报数据不能满足防洪需求,因此有必要提高天气预报能力的整体方法。

4.2。评估整体预测

如图所示,整体预测是一种可行的方法来减少错误的初始场和系统通过组装不同的数据集。在本文中,我们采用控制预测数据集从五个中心整体预测。此外,乐团的表演方法评估RMSE,三,我和分布方面的培训和验证阶段。使用四种不同的搭配方法在这项研究中,包括线性和非线性方法:EM, BREM, LR和SVR。5月到9月期间的数据,2015 - 2016年被选为培训期间,尽管数据2017年汛期被用于验证。

日本气象厅的数据集是选为最好的原材料,而那些CMA被选为最坏的比较与整体预测在训练期间。四套比CMA方法有更好的表现,只有少数情况下不如日本气象厅(图5),这证明了合奏的预测结果比原数据集。EM的rms和BREM非常接近,rms差异LR和两个并不大。总之,三种线性方法的改进是非常相似的,也就是说,LR是略优于EM和BREM。SVR,非线性方法,训练时期比线性方法更好的性能。此外,由于集合预报的准确性取决于原始数据的准确性,仍然存在反比关系之间的预测准确性和交货时间。

4揭示了一个完全不同的结论,虽然三种线性方法执行同样在RMSE BREM的HR明显高于其他两种方法,即小时甚至低于原始现场数据集。同时,LR的人力资源急剧减少的交货时间达到+ 6 d。这种现象的产生是由于突然没有雨打数量的下降,从127年在+ 5 d - 8 + 6 d。下降的主要原因是,线性方程扩大所有值相同的程度上由于整体预测的低估。此外,SVR有最好的结果,在人力资源增加近15%;然而,与目前相比,3月的下降显然是较小的。

因为本文数值降水预报的应用提高洪水预报的交货时间和防洪安全,MAs的错误(我)预测应考虑。我分配的四个方法在息县流域不同的交货期在培训期间呈现在图6。四种方法的分布表明合奏的性能结果的纠正我。BREM和SVR的MEs在5毫米在不同交货期在训练期间,但是仍有一些大型MEs,最多超过70毫米。SVR的性能在+ 3 d是在洪水预报中可使用,很少有MEs超过20毫米。

SVR具有显著优势促进培训期间的预测的准确性;然而,许多前情况下建议一些校正方法在培训期间表现良好但在验证期间表现不佳。因此,我们评估的准确性验证期间息县流域从三个方面:RMSE, 3月,我和分布。

此外,RMSE和三率显示不同的结果在评估验证期间(图预测能力7和表5)。图7表明LR的性能比EM和BREM在验证期间,优势在训练期间。此外,SVR呈现急剧上升的RMSE + 6 d,显示最糟糕的预测能力的四个方法,而三率表明,该方法具有在每个交货时间。这两种观点都意味着在+ 5 d SVR具有最好的性能。此外,我们比较和分析了每种方法的我进行更全面的评估。

我的BREM分布是最统一的验证期间(图8),大多数的MEs 0到5毫米之间,除了离群值。然而,BREM的离群值大于SVR的防洪安全是不利的。虽然我SVR的分布范围大,离群值更少的数量和价值较小的内+ 3 d。总之,三种线性方法,BREM比其他两个具有明显优势,但SVR比BREM的非线性方法。SVR的结果提出了高精度的RMSE和三个利率,但我的分布表明,它仍然无法避免的巨大劣势授予防洪安全MAs所致。因此,有必要找到一个新的整体方法对洪水预报和较小的我。

4.3。一个新的整体马率最小化的方法

虽然SVR集成预测的结果表明,它可以有效改善降水预报的准确性方面的RMSE和三率,还有大MEs(大约50毫米),这可能会产生巨大的防洪风险。然而,由于菲只可能会导致经济效益损失,而我可能会导致MAs的洪水以及生命的巨大损失和经济损失,结果仍然不能满足的要求延长交货时间没有带来巨大的洪水预报洪水风险。传统的整体方法最小化梅认为整个偏差,这意味着相同重量的我和菲,但它不适合防洪安全是最重要的。因此,我应该尽可能减少整体预测,和适度的铁的损失是可以接受的。为此,提出了一种新的反对函数的νsvr模型通过最小化的RMSE MAs (SVR-MA)。

在哪里f(x)代表函数建立了νsvr。在这里,公式(14)是用来优化参数C,σ,ν通过最小化我而不是美在公式(13)。同时,支持向量的数量控制在2 /l由微扰ν在优化之后。

此外,分析了新方法的改进与SVR和BREM训练期和验证。SVR的rms和SVR-MA明显小于BREM,和RMSE SVR-MA意味着最佳性能的三种方法在+ 3 d(图9)。从三个方面(表6来自不同交货期),所有的小时不到50%,大幅增加,而减少的影响还不清楚。表7说明了数字的、MAs和FAs息县+ 1 d的分水岭。的数量与原SVR相比,在没有雨级使用SVR-MA远低于与SVR,而在小雨数量已经大幅增加。此外,马数量呈现在每个大小略有减少。为目的的防洪安全,它是一个可行的解决方案来交换一些FAs的准确性的减量马数,尤其是对FAs在没有雨,影响有限水资源管理的好处。

我们已经讨论了在本文的前面的一部分,它是有偏见的评价只使用三个利率和RMSE降雨预测。MEs的分布获得使用SVR-MA有不同的交货期如图10。SVR-MA的性能优于SVR,与一个较小的分布范围和更少的离群值的训练周期和验证周期,特别是在交货时间是2 d。大部分的分布范围内的MEs + 3 d在验证周期小于15毫米,几个离群值的预期。此外,大多数的异常值+ 3 d小于30毫米。

总之,与原来的相比νsvr,新的整体方法(SVR-MA) RMSE和三个利率也有类似的表现,证明了新模型仍有良好的近似和生成能力。同时,SVR-MA是一种有效的方法来减少的数量和价值,特别是对于我的数量超过20毫米。大部分的MEs在3 d小于10 mm,最大30毫米左右。新模型不仅降低了整体误差,但也让我特别控制,有利于防洪安全,可以应用到预测期的延长洪水预报与防洪风险小。

5。结论

如何延长交货时间的洪水预测是至关重要的防洪安全,社会和经济的发展。尽管数值预测提供了一种可能的方法来解决这个问题,它仍然是一个迫在眉睫的问题相当评估降雨预报的准确性。简单总结成绩和分类有局限性,不能反映防洪降水预测可能产生的风险。此外,更要注意MAs和FAs的不同影响防洪安全。在这项研究中,我们评估了TIGGE的气象模型的预测能力六subcatchments小地区的降雨量在洪水季节。五个数值数据保留在2015 - 2017年的雨季,而观察到的数据集。我们专注于利用降雨预测数据集的可能性提高洪水预报的交货时间。此外,我们试图提高降水预测的性能通过使用不同的多通道整体方法。

大多数数据集的预测技巧从TIGGE与交货时间成反比关系,按照先前的研究。从不同方面比较不同的数据集进行评估降雨预报的准确性。结果表明,日本气象厅预测每个subcatchment有最好的表现,和KMA CMA表现出不规则的波动在不同交货期。虽然从五小时降雨量的预测中心+ 7 d超过50%,高的CMA的高估,KMA, UKMO,以及日本气象厅明显低估和ECMWF,原始数据集不能满足对洪水预报的需求。

四套方法用于这项研究,包括线性和非线性的方法。SVR的结果在5 d相比更加可靠和准确的其他三个线性方法。以来,在这项研究中,我们将更注重我的衰减,导致洪水的风险控制,提出了一种新的整体方法基于SVR。与原来的SVR相比,SVR-MA有更好的性能而言,我的铁、与利益的损失。然而,大部分的新增FAs从没有雨增强到小雨的水平,具有相对较低的影响水资源管理的效率。与此同时,我们发现SVR-MA的性能取决于数据的准确性;因此,结果SVR-MA + 3 d后表现出低技能的我。值得一提的是,SVR-MA有助于纠正降雨预报和内SVR-MA + 3 d的我可能是一个可接受的洪水预报结果不会造成额外的风险。这些结果为我们提供一种新的方式来提高洪水预报的提前期防洪安全的前提下。

数据可用性

TIGGE数据集可以在下载https://www.ecmwf.int/。LIBSVM软件可以下载https://www.csie.ntu.edu.tw/∼cjlin /

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是国家重点支持的研究和发展项目的中国(格兰特数量:2016 yfc0400909)。本研究得益于TIGGE数据集提供的欧洲中期天气预报中心(ECMWF),阅读,英国。我们感谢审稿人的手稿的建设性的意见和有用的建议。我们也要感谢林教授和LIBSVM的开发团队。