文摘

本研究使用缩减规模降水数据集从16耦合气候模式在25公里的高分辨率从1987年到2001年。的multimodel superensemble方案被广泛测试的降水预报在中纬度地区,地处亚热带,,特别是不同地区的季风带。著名的统计估计理论方法,即最佳线性无偏估计量(蓝色),16日检查成员模型。结果与superensemble方法相比,基于各种技能的分数。结果表明,蓝色是提供有前景的预测。至于比较研究是蓝色和superensemble方案竞争和展示他们的重要性从正常年极端降水年。蓝色的方法能够预测国际跳棋相比其他multimodel计划很好。蓝色的一个基本优点是计算比superensemble便宜方案。这些统计降尺度等项目,蓝色,和superensemble可以进一步提高降雨预测,如果提供了密集的雨量计的数据。

1。介绍

几个multimodel计划被列入文学降雨气候和天气的预测。这些常用multimodel降雨预报方案整体计划,有偏见的合奏的意思,集群技术和superensemble方法。superensemble方案从佛罗里达州立大学(前苏联)自1999年以来通过各种测试人员(1- - - - - -4]。现在良好的降雨数据集质量可以从卫星(如全球降水测量,流量/热带降雨测量任务,TRMM),再分析(例如,一,和雨量计在高分辨率(例如,阿佛洛狄忒)。不知怎么的全球气候模型仍然有粗分辨率为100公里。这种差距的决议呼吁全球气候模型的降尺度。所有模型的缩写缩略词中提到,机构或其他名称。

统计降尺度方法被用来提高成员的水平分辨率模型(4- - - - - -9]。通过这样做,乾湿斑的区域细节降雨隆起。有限制的动态模型和后处理统计技术在预测季节性降雨(1,10]。统计方法的成功依赖于长期培训期间的一系列数据来计算更好的系数。如果训练数据集包含许多新的信息块在洪水和干旱事件,然后他们在预测期获得系数做得更好。另一方面,动态简化模型参数化方案和一些有问题的各种方案中使用它们。在这些模型中,系统误差随时间增长。全球20多个气候预测中心是从事每月季节性捕食本土的全球模型。Multimodel方案提出了为一个赛季带来共识预测(11- - - - - -13]。

印度气象部门使用统计模型和修改他们在一段时间内提供一种改进的印度夏季风降水预测(14- - - - - -17]。一些统计的局限性和动力学模型用于印度降雨预测Nanjundiah[所指出的18)和Gadgil et al。10]。各种新multimodel印度地区降雨预报方案进行测试(19- - - - - -21]。检查5-multimodel计划他们意识到降雨预报的准确性可以增加在印度的地区。此外,他们工作在印度地区的概率预测和发现概率预测优于multimodel合奏的意思。这个小组有许多研究工作的预测降雨使用各种技巧。在中纬度地区海平面气压、风能和降雨量有强烈的领带,因此可用于多元回归方法来缩减规模降雨。在最近的一项研究中,典型相关分析用于缩减规模对印度地区降雨和其他(22,23]。他们发现一些改进的预测能力和印度半岛东北部的部分地区。没有强烈的降雨和其他变量之间的关系像海洋表面温度,风,和即将离任的长波辐射在热带地区。在另一项研究中使用逐步回归,Salvi et al。24)表明,他们的方法可以捕捉印度的降雨量山区。他们评估未来降雨量印度地区的投影。集团从事各种各样的降尺度方法对印度地区降雨。

在这项研究中,我们使用线性回归方法来缩减规模印度地区的降雨量。众所周知,即使在追算模式中,没有一个模型提供了正确的预测了一系列的年。也许,这是一个必需品的multimodel预测技术。在一个更好的方法后处理数据集和统计技术可以共同努力,进一步完善预测。回答各种问题,例如,模型构建superensemble最小数量的成员,数据集的长度,和其他敏感问题可以找到Kumar和克里希那穆提(25]。降雨的产品被缩减规模的方法,然后通过改进第一superensemble方法。在一些研究中,印度夏季风降水的预测被superensemble改进和低档次的方法(25- - - - - -28]。在目前的研究中,我们曾与降雨异常和技能比较最好的模型(ECMWF模式出来最好在16套房的模型对印度地区,Kumar和克里希那穆提(25]),整体的意思(EM),和两个multimodel方案。我们试图把这里的重要方面之一是,如何准确地说,我们可以预测极端事件吗?新的multimodel方案,基于估计理论,即最佳线性无偏估计量(蓝色),已经检查(29日]。此外,本研究比较两个操作方案已被用于预测飓风在大西洋盆地。

本研究说明了性能最好的模型,整体的意思是,合成superensemble (SSE)技术,和蓝色最先进的气候模型耦合15 16日计划在印度地区夏天季节。摘要multimodel统计方法的应用。这项工作中使用的技能分数空间相关系数,RMSE,卡方值测量的协会,ETS,偏见,Heidke技能分数(30.,中华民国(相对操作特征(30.,31日])。中华民国是真阳性利率之间的情节(这里打分数比例或检测概率)和假阳性(这里远比或假警报率)的预测。迈进了一条曲线 设在显示更准确的测试。因此,曲线下的面积是中华民国的测量分数。

2。使用数据集

缩减规模的降雨数据集(15年,1987 - 2001年)从16耦合模型(33纳入本研究。所有的模型都是集成从5月1日到9月30日的夏季(环流)。在这里我们只分析了夏季季风(六月到九月)数据集的研究。表1组件包含大气和海洋的一些细节的模型,即模型名称,分辨率模型,模拟的初始条件,集合预报的数量。系综平均几次运行从单个模型的预测也纳入本研究。这些模型预测铸在2.5度的常见水平分辨率2.5度经度纬度建设multimodel集合体。阿佛洛狄忒降雨(34数据集被用来作为实际降雨量。这个数据是基于成千上万的亚洲季风雨量数据在一个大区域。数据集的空间分辨率为0.25×0.25 lat-lon网格而每日,每月数据的时间间隔。插入模型的数据从粗分辨率高分辨率观测数据集,我们使用4贝塞尔插值方法。

3所示。降尺度和Multimodel计划

班轮回归计划申请降尺度和构造缩减规模数据集从每个成员模型对阿佛洛狄忒降雨数据集。

Chakraborty和克里希那穆提(26]表明改进的降雨量预测与降尺度和没有成员的降尺度模型,整体的意思是,和superensemble方案。他们说明,缩减规模superensemble计划显示了更高的相关性和RMSE在印度夏季季风降水减少。在multimodel合奏,我们认为整个数据集的15年时间(15年×4个月= 60值)的月降水。接下来,我们构造multimodel方案基于缩减规模的数据集。结果表明,15年的数据足以进行降尺度系数稳定在10年之后的数据集(25]。

我们认为,一个数据处理方法提高了模型数据和增加了一些错误。然而,这在某些情况下可以减少。有一个主要的区别降尺度的数学策略和建设multimodel superensemble方案。前缩减规模每个模型分别对观察到的估计,而multimodel superensemble计算单一模型预测考虑预测的成员。它执行删除集体偏见的多元线性回归模型的套件。这两种方法是相互独立的。总体来说,第一次降尺度有助于发芽降雨量预测中的区域特征从每个成员模型,然后基于multimodel superensemble方案改善预测。使用交叉验证方法在superensemble和蓝色的方法。在这种方法中,一年的时间,预测,不采取,而计算降尺度或superensemble权重。

3.1。缩减规模的方法

阿佛洛狄忒降雨(34)用于缩减规模对印度地区降雨预报从成员模型。 在哪里 是降雨的观测和内插模型预测(在同一分辨率),分别; 是回归系数称为最小二乘法拟合斜率和截距;和 误差项。 在哪里 的缩减规模降雨量预测模型;在这里 计算使用(2在每个网格点,分别在每年的每个月。我们遗漏了一年缩减规模的计算来计算 交叉验证的方法。有更多的降尺度方法,例如,典型相关分析和逐步投影模式。表现良好的线性降尺度方法与其他方法相比(35]。我们选择一个线性降尺度方法。

3.2。合成Superensemble技术

superensemble方法(1,36基于multimodel预测)产生一个预测。Multimodel superensemble预测基于缩减规模数据集从模型构建以及成员37]。我们表示如下: 在哪里 superensemble预测, 是观察到的时间意味着(气候学), 单个模型的权重吗 , 是一个模型的预测和预报的意思吗 培训期间, 的数量模型。权重是通过使用最小二乘法最小化误差。权重之和不需要是一个和他们从负到正改变值。

3.3。蓝色的技术

在这项研究中,我们将介绍另一个multimodel施工技术基于估计理论。单个模型缩减规模发芽地区降雨的特点。接下来,superensemble方案和蓝色行动multimodels删除模型偏差。在蓝色的系数是成反比的错误模型和系数的总和就是其中之一。在附录中描述的方法。

4所示。降雨的空间变异性

降水异常的空间模式对1987年、1991年、1995年和2000年被显示在图1。降水异常的阿佛洛狄忒降雨数据集,从ECMWF耦合模型,整体的意思是,superensemble计划,和蓝色所示第一,第二,第三,第四,第五行,分别。阿佛洛狄忒的降水异常,ECMWF模式,EM, superensemble计划,和蓝色捕获一系列的变化从印度地区干旱,洪水年降雨量。1987年被认为是历史上最严重的干旱之一印度夏季季风降水变化,远程,东太平洋的厄尔尼诺事件的影响。印度中部地区严重影响非常低的降雨,而印度东部受过良好的降雨。降水不足在印度中部被大多数的模型模拟,而极端降水的补丁没有捕捉到任何一个。1991年是受到印度北部和东北部低降雨量的影响。有趣的ECMWF捕获它完全以及superensemble计划,但是EM和蓝色的失败。1995年目睹了干旱southcentral印度而洪水的情况下战胜了印度北部。ECMWF模式是最好的模拟降水变化在印度地区,但未能模拟东印度部分地区的降雨量。 SSE tried to simulate the rainfall variability but missed deficient rainfall patches over central India. Some of the patches of dry region over Odisha (20.95N, 85.05E) were remarkably captured. It is to be noted that BLUE did better than other models in case of year 2000, which was almost a monsoon drought (rainfall was −9% of the climatological normal) over Indian region. Tables23表现出逐年空间相关性和RMSE数字模型的所有成员,EM, superensemble计划,和蓝色。从表23,我们发现不同的相关性−0.31到0.59的模型。相关系数的范围是不同的从消极到积极的价值观,这就是为什么我们不能谈论相关的意义。一些年的(例如,1991年,1995年)的相关有意义0.02(双尾概率)。

可以指出,最高的相关一年从模型到模型,然而multimodel方案(蓝色和superensemble)执行比任何成员模型和EM。我们观察到1999年所有的模型和方案有正相关,除了瑟夫,KORAM, MAXP和摘要。表2RMSE范围从1.34到3.82。这里multimodel方案试图最小化RMSE但它们之间的差距和成员模型并不太多。可能会提到,降水变化在斯里兰卡很好被superensemble(相关系数(CC) = 0.44)。每年的降雨量变化的技能在数据解释2(一个)2 (b)在空间相关系数和RMSE方面。蓝色和他们保持他们的空间相关系数为1999年大部分时间除了积极。在图2,我们认为目标区域略小于更大的区域显示在图中1北方地区特别是北方的,因为许多30 n雨量数据稀疏。Chakraborty和克里希那穆提(38)发现1999年的负异常的相关性更大的季风区域。ECMWF和superensemble方案的所有年空间相关性并不高。这是不同的从正到负0.5−0.24。图2 (b)显示RMSE,最低的蓝色。这里superensemble方案出来不同与最低RMSE多年。有趣的是,蓝后几乎是EM。此外,在1995年所有的模型有RMSE最低和最高的相关性,而1999年RMSE达到最高的价值和相关性最低。

在这项研究中,我们还用测量协会的属性来判断一个模型预测和实际降雨量之间的亲密程度。定性变量的结果表示为“是”或“不”或某些类别,即“好”或“坏”,被称为属性的统计文献。是否两个属性相关测试独立使用卡方检验。

3显示了卡方值比较观察和不同模型预测域之间的联系的研究。它是基于每个网格点在印度。目标地区是印度(69 - 92 e, 8-30N)。蓝色显示最高分类协会1996年,1997年,2000年和2001年,尽管superensemble方案显示分类协会最高1987,1990,1998,1999。接下来ECMWF显示最高分类协会1988年,1989年,1992年和1994年,尽管新兴市场推出最高协会1991年,1993年和1995年。蓝色和superensemble方案都做得很好这一措施。一列联表,表3,提供1987年−0.1降雨异常阈值的蓝色。这个表有一个意义来计算技能成绩绝对降雨。ETS和偏见对降水异常的阈值计算了−/天(图3 - 3毫米4(一)4 (b))在印度地区(经度= 69.0,朗e = 92.0;lat = 8.0, lat = 30.0 n)。有趣的是,蓝色是指挥-阈值而superensemble计划指挥所有积极的雨量阈值为15年的时期。蓝色ETS范围在0到0.28之间,而superensemble计划ETS从0.04到0.18不等。表明蓝色有非凡的潜力预测干旱。ETS的0.3被认为是一个不错的降雨(38]。为各种类别的降雨(光,温和,和暴雨)破折号et al。39)获得ETS值0.24到0.03的印度地区。接下来的偏见(图4 (b)蓝色显示了积极的最小偏差阈值而superensemble计划显示了负的最小偏差阈值。蓝色有偏差的范围从0.1到1.67,而superensemble方案0.1到0.4。ECMWF和EM不执行与偏见比multimodel方案。一些不相容的讨论关于ETS虽然得分对极端事件(40]。

Heidke技能分数(HSS)已经提出了各种年(图5),包括洪水和干旱年的印度夏季风。蓝色是1995年和1998年做得更好,同时为1988年和1989年superensemble计划做得好。不过,他们的反应,如果我们确定混合优势的阈值。例如,在1995年,蓝色与ETS−3到1.5但阈值范围的技能退化为1.5到3。以防1988 superensemble方案有利于−0.5到3但偶然−3−1阈值。总的来说,这两个multimodel方案出来更好,做更好的为所有阈值和年除了一些。霍根et al。40)推荐的高速钢在ETS从multimodels表达技能。在表4,我们解释了数字,错过,假警报,1987年正确的底片。它是与表相同5,但一年与价值观。

印度地区降雨量显示高降雨量变化,由于地形变化大的土地,植被和土壤质地。概率预测是基于是/否命题。网格,对于一个阈值,这是/否命题决定打击(降雨量的观测和模型显示零值),错过(观察显示非零降雨模型显示零值),和假警报(降雨观测显示零模型显示了非零值)作为基本变量概率预测。图6展示了民国情节之间的命中率和假率环流季节性降雨异常,为四年。如果中华民国曲线模型是远离的45度的直线模型执行比其他人更好。粉色的虚线表示精确匹配的观察和预测情况下,也就是说,理想情况下的预测。1998年蓝色出来最好的,而2000年superensemble出来是最好的。剩下的两年1987年和1998年他们的反应不一。Acharya et al。41]显示结果三类multimodel计划在印度地区的降雨量。他们发现更好的技能湿和干燥的中华民国年相比正常的季风年。

5。结论和讨论

所有结果基于常用技术指标是缩减规模数据集上执行了15年(1987 - 2001),16个成员模型,并从APHRODTE实际降雨量数据集。年复一年,四个模型的优越性已经引用了基于卡方表示模型的依赖技能矩阵。相关系数的最大值从multimodel获得计划EM,上交所,和蓝色−0.28到0.51,0.16−0.59,0.25−0.52。另一方面,ECMWF范围从0.35−0.49只。明显改善并不多,但对降水异常,肯定是相当可观的。,RMSE, EM范围从1.41到2.78,上交所的范围从1.48到2.79和蓝色的范围从1.36到2.75。分类协会由ECMWF达到0.39,他们是0.42,上交所是0.48,和蓝色的是0.45。ETS, ECMWF达到0.27。EM的ETS是0.28,上交所是0.18,和蓝色的是0.29。偏见ECMWF减少到0.35,0.15,0.05,上交所和蓝色。 Overall SSE and BLUE improved on best model (ECMWF) and ensemble mean (EM) on the metrics skill used in this study for the Indian region. Sometime BLUE does better than superensemble scheme and sometime superensemble scheme does better than BLUE method. It is worth mentioning that the BLUE methodology has the simplicity in computing model weights for constructing the multimodel forecast. So, this method can be explored more for other events as well. One of the challenges is the prediction of rainfall anomalies (e.g., extreme events of floods).

多元回归方案可以应用于提高降雨预测,随着降雨预报GCM的性能很差。在多个回归,一个可以使用风,温度、位势高度,和特定的湿度来预测降雨。一些研究显示另一个变量的使用,例如,SST和OLR降尺度的降雨。不知何故,线性回归是一个粗糙的方法而典型相关分析和逐步模式投影方法被认为是一种先进的降尺度。此外,其他复杂的方法,如统计动力卡尔曼滤波方法(42],hyperensemble方法[43),人工神经网络方法可以用于multimodel合奏下研究降雨的预测。

附录

2×2列联表表达的数据如表所示5

因此,由卡方统计数据 在此之前与1自由度[卡方分布44]。

比较两个不同模型的两个应急表卡方值给出了指导力量的观察和模型预报值之间的关系。大卡方值表示一个更强的关系。这里我们得到不同类别对应不同的降水异常阈值。

如果 公正的独立参数的估计 和方差 然后 会的最佳线性无偏估计量吗 ,如果

证明。 的是公正的 和由于独立 我们考虑 的估计量 这样 很明显, 将无偏 如果 现在, 是独立的,我们正在寻找 的,这样 是最低的。
定义 在哪里 是拉格朗日乘数。
的偏导数 关于 并将其等同于零最小化 受条件(A.7)我们有 这将导致 我们建议估算 从过去的表现模式 和使用 找出 ,multimodel输出组成 模型。 将是一个最佳multimodel输出(29日]。 在这里, 是数量的网格点, 预计在网格点的值 , 是在网格点观测值吗 , 区域活动是预测, 区域活动是观察到, 是地方 重叠,影响区域。基于列联表,表中5高速钢(威尔2012)可以被定义为 在哪里

缩写为模型、机构或其他名称

阿佛洛狄忒: 亚洲Precipitation-Highly解决对水资源评价观测数据集成
蓝色: 最佳线性无偏估计量
CERFACS: 精选的的中心纽约不吸烟者形成Avancee计算科学化,法国
前苏联: 佛罗里达州立大学
ECMWF: 英国欧洲中期天气预报中心
新兴市场: 整体的意思
美国教育考试服务中心: 公平的得分威胁
注: 全球降水测量
环流: 六月、七月、八月、九月
侯尔: 前苏联耦合模型,郭对流辐射(emissivity-absorptivity模型)和旧方案
MAXP: 德国大毛皮Meteorologie研究所
摘要: 美国国家环境预报中心的
RMSE: 均方根误差
中华民国: 相对运行特性
上交所: 合成superensemble
TRMM: 热带降雨测量任务。

的利益冲突

作者宣称没有利益冲突。

确认

作者t·n·克里希那穆提教授表示衷心的感谢,感谢他的鼓励和有价值的讨论在此工作。作者希望承认" / CliPAS提供耦合模型的数据集。