文摘

印度季风气候现象,是一个重要的全球气候标志。印度季风统计和数值预测方案被广泛研究文学。统计方案主要是基于回归和神经网络。然而,多年来季风的变化是显著的和单个模型往往是不够的。气象学家修改他们的模型在不同年基于流行的全球气候事件像埃尔-尼诺海流。这些指标通常有不同的关联程度的严重性。摘要集群季风年基于模糊程度的结合性这些气候事件模式。接下来,我们开发单个预测模型的集群。这些个体模型的加权合奏用于获得最终的预测。该方法执行竞争与现有的预测模型。

1。介绍

季风气候系统是一个复杂的现象。它是由多个气候参数和海洋大气相互作用的影响。季风预测挑战是因为大变化出现在它的模式。印度气象部门(洛桑国际管理发展学院)执行印度夏季风降水的预测(ISMR自1886年以来)。印度季风预测是由布兰福德(1早在1882年。成功的预测在1882 - 1885年鼓励布兰福德张成的空间设计操作在1886年季风的长期预测模型。随后,沃克(2)开发模型研究降雨和不同的全球气候参数之间的统计相关性。Thapliyal和Kulshrestha3]介绍了回归模型在预测印度西南季风降雨。Gowariker et al。4]提出权力为季风的长期预测回归模型,提供准确的长期预测,但未能预测2002年的极端条件。2004年,Rajeevan et al。5)评估不同气候参数,引入四个新参数为发行远程设计统计模型预测印度季风。在2007年成功,Rajeevan et al。6)构建模型使用合奏多元回归和追求投影回归预测印度降雨和被证明是优于过去洛桑国际管理发展学院模型。Schewe和莱韦尔曼[7]解释印度降雨和分布的变化也解释季风在某些年的失败背后的原因。吴et al。8)提出一个线性马尔可夫模型来预测短期东亚季风气候变化。风扇等。9)制定季节性预测的两个统计预测方案东亚夏季季风。计划采取的直接输出已存在的模型和提供更好的预测夏季季风。

人工神经网络()[10)广泛应用于模型中的非线性季风过程。Sahai et al。11)使用技术与误差反向传播预测印度夏季风降水。香港(12]利用递归神经网络预测印度夏季风也展示了成功就业的支持向量机在解决非线性回归和时间序列问题。三个不同的反向传播神经学习规则,即动力学习,共轭梯度下降学习、使用和Levenberg-Marquardt学习,美国将和g .将13)进行比较研究不同的神经网络方法预测降雨时间序列。

存在大的可变性季风模式很难一个模型来预测其分布。许多不确定性包括边界条件、参数和结构不确定性都参与了这些模型的建设。因此,它仍然是根本性的挑战有一个单一的预测模型。Multimodel乐团为了克服单一模型的缺点,提出了不同的模型的结果结合,产生有效的结果(14,15]。此外,季风多年来显示不同的特征。存在组年气候参数的变化和降雨模式是相似的。我们一起使用模糊聚类集群相似年分别和模型。使用模糊聚类的动机是,每年体现物理气候事件的混合物。我们不能硬集群一年一个特定群体;年每个集群成员的归属感。模糊聚类是用来将不同事件的特点与一年的研究。我们使用相同的气候参数预测为每个集群但是框架为每个集群不同的模型。

许多预测模型,即多元回归(先生),多层感知器(中长期规划递归神经网络(),RNN)和广义回归神经网络(GRNN印度季风)模型,用于预测今年的集群。使用神经网络存在的原因中长期规划,RNN,GRNN造型:(i)印度季风是一个复杂的过程,不能充分模拟线性模型,(2)非线性时间序列的模式可以捕捉到神经网络学习,(3)年附近气候事件更密切相关的参数扰动比遥远的年,和神经网络使附加重量参数在适当的方式。

在这工作,强烈与印度季风气候参数识别开始,其次是模糊聚类的年组与程度的归属感每年的集群。然后我们模型每个集群与四种模型,即先生,中长期规划,RNN,GRNN预测降雨。加权合奏各自的预测模型为每个集群被认为是最终的预测降雨。分析和比较是进行总印度降雨和最后,获得的气象解释集群。

本文以以下的方式组织。我们讨论了数据和预测气候参数的细节部分23。提出了基于聚类的方法、预测模型和整体技术提出了部分4在部分实验结果5。气象意义讨论部分6最后,结论部分提供了7

2。使用数据集

我们认为年度印度夏季风降水(ISMR),发生在4个月,6月,7月,8月和9月。年度ISMR是1948 - 2013年期间对我们的研究。长期平均水平(LPA)(1948 - 2013)ISMR是891.8毫米。ISMR百分数表示的吗LPA价值。从印度热带气象研究所获得的数据,浦那(http://www.imdpune.gov.in/research/ncc/longrange/data/data.html)[16]。

预测参数海平面气压(方案得到)(http://www.esrl.noaa.gov/psd/gcos_wgsp/Gridded/data.noaa.erslp.html)和海洋表面温度(风场)(http://www.esrl.noaa.gov/psd/data/gridded/data.noaa.ersst.html)所提供的数据是NOAA /桨/ ESRL / PSD的空间分辨率 (17]。表面压力(SP)和纬向风速(西弗吉尼亚州)收集的数据摘要再分析导出数据提供的NOAA /桨/ ESRL PSD (http://www.esrl.noaa.gov/psd/data/gridded/data.ncep.reanalysis.derived.surface.html)[18),可以在解决 。最后,尼诺3.4数据,海面温度异常的空间范围 在太平洋地区获得来自国家大气研究中心(http://www.cpc.ncep.noaa.gov/products/analysis_monitoring/ensostuff/ensoyears.shtml)[19]。上述所有月度数据被认为是1948 - 2013年期间在我们的研究和分析。

3所示。全球气候参数影响印度季风

印度季风强烈影响几个全球气候参数,发生地点远离印度次大陆。预测参数的识别依赖于物理的理解季风事件和风力流模式。我们选择了气候参数基于印度气象部门所使用的参数模型(5,6),研究其相关性与印度夏季季风降水(ISMR)在我们的研究(1948 - 2013)时期。在数据预处理阶段,气候异常数据评估的计算参数值的偏差参数的长期平均值专门为每个月,紧随其后的是相关研究ISMR和气候参数为0到12个月的滞后。我们认为最好的滞后指标月有高度的相关性ISMR。的预测与印度季风气候参数及其关联值如表所示1。图1显示了印度季风气候参数的地理位置影响。

预测的气候参数集。根据与印度季风的关系,我们建立了五个预测集的预测。不同组合的确定气候参数(表1)形式的预测集。预测集如表所示2

4所示。方法

我们提出的模糊聚类季风年组其次是建立模型分别对每组最后预测印度夏季风降水(ISMR)作为加权合奏集群提供的预测模型。提出了模糊的框图clustering-based预测方法ISMR如图2。在接下来的部分将描述详细步骤。

4.1。动机:季风模式的可变性

季风变化的趋势和分布在很大程度上多年来。因此需要集团的年集群类似模式的预测影响季风气候参数。集群多年来是有效的方法,我们可以为每个集群构建独立的模型。这些集群模型将更准确的变化在集群更少。最后,这些集群模型的预测结果的整体更好的预测印度季风。作为一个例子,考虑两年簇对应于强大的埃尔-尼诺海流和北大西洋涛动,分别。干旱年相关事件和因此可能有归属感的重要度两个集群。

4.2。模糊聚类季风年

模糊 聚类则用于分组相似年在一起。模糊 ——(FCM)是一种聚类方法,允许一个实例输入属于多个集群成员的归属感。FCM分区的一组 元素 为一组 模糊集群 和一个分区矩阵 , , ,在那里 给元素的程度的归属感 与中心集群

FCM目标是最小化的目标函数(1)。分区矩阵的更新和中心按照发生(2)和(3),分别为: 在哪里 表示集群模糊性的水平。

4.3。预测模型

多元回归和人工神经网络三种模式(),即多层感知器、复发性神经网络和广义回归神经网络,用于为每个集群专门设计预测模型。预测的年度ISMR分别是由每个集群模型和整体所有的集群模型的预测。下面我们描述所使用的模型。

4.3.1。多元回归(先生)

多元回归模型是用来学习一些独立预测变量之间的关系( 年代)和因变量( )。多元回归模型有 独立变量所示 在哪里 th的观察 th独立变量,第一个独立变量的值 对所有 代表了剩余。

4.3.2。多层感知器神经网络中长期规划)

多层感知器神经网络是一类没有神经细胞间的联系形成一个周期。在这个网络中传播的信息只有一个方向,从输入节点,通过隐藏节点,节点的输出。独立和依赖的变量构成的输入和输出层,分别。相应的隐藏层节点数必须为每个预测经验确定的任务。四个不同的参数集被认为是经验设计预测模型ISMR,如表所示3

4.3.3。递归神经网络(RNN)

递归神经网络是一类创建一个内部状态的网络表现出动态的时间行为。气候变化或事件发生在接近或同一时期是高度相关的。同样,降雨模式更相关影响因素在不久的年比遥远的年。这种现象了RNN赋予权重递减顺序的值在靠近遥远的年在训练网络。因此,它有助于造型系统动力学在更自然的方式。相同的气候参数中长期规划网络(表3)被认为是延迟的2单位。

4.3.4。广义回归神经网络(GRNN)

广义回归神经网络是一个径向基函数网络的变体。GRNN人工神经元的三层:输入、隐藏和输出。隐藏层径向基神经元,而输出层的神经元线性传递函数。径向基神经元的输出是输入相应的传播因素。鉴于 输入输出对 , , 输入变量和 代表每个隐藏单元的输出。的GRNN输出一个测试点, 是所描述的 在哪里 造型背后的原因GRNN(我)只有一个可调设计参数(扩散系数),(2)一次通过的算法(少耗时),和(3)从稀疏数据准确的近似函数。

最优训练是确定的先生GRNN模型通过改变训练从5到30年和验证对最小绝对误差预测验证期间(1984 - 1993)。一个培训 年指定,预测 年降雨量,前可用 数年 出现在一个特定的集群被认为是进行训练。

4.4。的预测因素

季风过程的复杂性使得单个模型很难准确预测降雨。我们为每个集群设计单独的模型使用四年通过模糊聚类预测中所描述的部分4.3。最后,每年ISMR提出了加权的预测模型为每个集群设计的。重量是作为模糊成员归属感的测试在不同的集群: 在哪里 代表集群的预测模型 , 模糊的会员吗 每年测试集群 , 集群的总数。

4.5。建议的方法的验证

这项研究在数据上执行1948 - 2013年期间。模糊聚类在此期间执行到集群三个组。基于集群的集群的数量决定质量。独立预测模型设计为所有三个集群和合奏的预测模型作为预测提供印度夏季风降水。测试2001 - 2013年被认为是对我们建议的方法的预测能力进行评估。

年度的预测模型ISMR主要是评估的平均绝对误差。其他错误统计,即均方根误差,预测产量,皮尔逊相关性,和威尔默特协议,指数也评价来判断我们建议的方法预测的效果。他们在下面描述。(我)平均绝对误差(美)。平均绝对误差预测的年度ISMR按以下方式计算: 在哪里 实际和预测吗ISMR为测试周期和系列 表示测试的总数。(2)均方根误差(RMSE)。均方根误差计算模型预测输出和实际值之间的差异。他们是一个很好的测量比较各种模型预测的错误: (3)预测产量(PY)。预测收益率评估在三个不同的错误分类错误(5%,10%,和15%)来评估整体预测结果通过判断预测年的百分比在每个允许的误差范围。(iv)皮尔森相关系数(电脑)。皮尔逊相关系数的措施的强度线性实际值和预测值之间的联系,在1的值意味着一个完美的正相关和−1意味着一个完美的价值负相关: 在哪里 实际和预测吗ISMR为测试周期和系列 是相应的意思。(v)威尔默特指数协议(WI)。威尔默特协议是一个标准化的衡量指数模型预测误差的程度。它在0和1之间变化值越高表明一个更好的适合的预测模型:

5。实验结果和分析

在这一部分中,我们将提出模糊clustering-based的评价方法。我们首先介绍模糊聚类的结果不同季风年的预测集。预测技能评估所有集群和整体模型的平均绝对误差为测试期间2001 - 2013。此外,其他一些措施,例如在预测均方根误差,预测和实际降雨量之间的相关性,预测产量,和协议指数之间的实际和预测降雨也估计建立我们建议的方法的效率预测印度夏季风降水。

5.1。集群的季风年

模糊聚类在执行时期1948 - 2013集群数据三个集群。我们已经完成一个 切,价值 分配的数据实例集群。经验值是确定这样集群内元素的分布是均匀的。一个数据实例可以同时指派给一个以上的集群。集群大小如表所示4同时考虑各种预测集。

5.2。预测精度

我们预测所有五年降雨量考虑预测集(表2)分别使用四种模式,即先生,中长期规划,RNN,GRNN。测试时间从2001年到2013年。

5.2.1。多元回归模型(先生)

多元回归模型的建立对于每个集群通过确定最优训练阶段为每个预测集。最佳的培训周期是评估通过改变训练年预测和验证他们的最小绝对误差验证期间(1984 - 1993)。基于单个集群以及加权对整体模型的预测。表5给个人基于集群的平均绝对误差和整体模型试验期间2001 - 2013。模型提供的平均绝对误差为6.2%PredSet4(表2)。可以看出整体模型优于所有单独的集群模型为每个预测集。图3显示实际和整体预测降水的年际变化的长期平均水平(LPA)。

5.2.2。多层感知器神经网络模型(中长期规划)

多层感知器神经网络模型设计有四个不同的参数表中描述2。所有集群和整体模型的平均绝对误差如表所示6中长期规划4.0%的模型报告一个错误PredSet4(表2),中长期规划参数ParSet1(表3)。实际的模型建立和预测降雨的集群和整体模型如图4。整体预测降雨密切遵循实际降雨。

5.2.3。递归神经网络模型(RNN)

平均绝对误差预测年降雨量的递归神经网络模型中给出的测试期2001 - 2013表7PredSet3(表2),RNN参数ParSet1(表3给了错误的5.1%。RNN赋予权重降序排列的距离测试一年培训年。实际的模式和整体预测降雨的百分比LPA如图5

5.2.4。广义回归神经网络模型(GRNN)

广义回归神经网络集成的集群和单个模型的错误的平均绝对误差提出了表8。6.1%的模型报告一个错误PredSet3(表2)。图6显示了集合预报降水的年际变化GRNN整体模型与实际降雨模式的比例LPA2001 - 2013年。可以看出预计值接近实际的降雨模式。预测模型设计的集群是由不同的符号显示。

5.3。统计验证提出方法的措施

接下来,我们验证模型的其他除了平均绝对误差精度的措施。表9显示不同的预测验证统计系综模型测试期间2001 - 2013。下面我们总结观察。(我)均方根误差(RMSE)中长期规划整体模型给RMSE的5.3%,紧随其后RNN整体模型的6.4%。GRNN先生模型给RMSE分别为7.4%和8.4%。(2)预测产量(PY)PY5%错误的范畴先生,中长期规划,RNN,GRNN整体模型是46%,69%,53%,和46%,分别。他们给预测收益率为76%,92%,92%,和84%的允许误差为10%的范畴。最后在错误类别的15%,先生,中长期规划,RNN,GRNN整体模型给收益率为92%,100%,92%,和100%,分别。因此,没有预计的年显示相应突然偏离实际的降雨模式。(3)皮尔森相关(PC)个人电脑0.61,0.81,0.71,0.49是观察到的预测先生,中长期规划,RNN,GRNN整体模型,分别。它是注意到预测降雨中长期规划整体模型是高度相关的实际值,而相关性GRNN预测最小。(iv)威尔默特指数协议(WI)WI先生,中长期规划,RNN,GRNN整体模型是0.71,0.89,0.81,和0.62,分别。该指数显示,实际和预测降雨之间的协议是高的中长期规划RNN整体模型。所有提到的统计措施(表9(表)以及平均绝对错误6在季风预测确定中长期规划提出模型是最好的在所有四个模型。

5.4。比较的结果
5.4.1之前。比较先进的方法

提出了模糊clustering-based合奏预测模型比较与印度气象部门所使用的模型(洛桑国际管理发展学院)。相比之下,现有16-parameter权力回归模型(4)和Rajeevan et al。5)8 -和10-parameter模型。测试期间,从1996年到2002年被认为是七年。洛桑国际管理发展学院模型给均方根误差为10.8%,7.6%,和6.4%,分别。的先生,中长期规划,RNN,GRNN整体模型给6.0%,3.4%,4.4%,和5.5%的均方根误差,分别优于所有三个洛桑国际管理发展学院模型。结果作为一个条形图,如图所示7

5.4.2。基于集群的模型与传统模型的改进

整体模型误差通过结合所有集群的模型输出与误差得到相同的模型(参数),对整个训练数据集没有集群。各种型号的平均绝对误差和预测集组合如表所示10。结果清楚地描述了集群和整体改善预测法在非聚集的常规方法。

5.5。预测的2014年

2014年年度印度夏季季风降水是781.7毫米,这是87.8%的LPA价值。提出clustering-based合奏先生,中长期规划,RNN,GRNN模型预测2014年降雨量为96.1%,80.3%,80.0%,95.3%LPA,分别。因此,提出的模型显示预测的绝对误差为7.0% 2014年的降雨量。

6。气象分析

接下来,我们试图想象每个集群的物理气候事件。集群通过模糊聚类物理解释是一些全球气候事件的特征。气候事件考虑和研究时间期间1948年至2013年(我们的工作时间考虑集群)厄尔尼诺、拉尼娜现象(http://ggweather.com/enso/oni.htm),积极的和消极的印度洋偶极子(http://bom.gov.au/climate/IOD)、干旱、洪水、表所示11

8表明厄尔尼诺和拉尼娜年干旱,正常,过多的降雨年期间1948 - 2013。年降雨量的10%以上LPA下面多余的降雨年和年降雨量10%LPA干旱年。厄尔尼诺和拉尼娜年所示颜色代码(亮绿色和绿色图)。图表有助于形象化的共存与四肢的厄尔尼诺和拉尼娜事件ISMR

6.1。测量气候事件和之间的联系ISMR

支持和信心措施被认为与物理气候事件模糊聚类生成的簇。他们定义如下。(我)支持。支持定义为集群中的百分比总数年对应气候事件: 在哪里 表示的年数与集群中的一个特定的气候事件 集群的总计数年。(2)信心。信任被定义为与气候相关事件的百分比年集群事件的总数年: 在哪里 的年数与气候相关事件期间1948 - 2013。

我们与集群物理气候事件中所描述的表11,如果两个支持和信心措施达到相应的阈值。的阈值选择的方式,50%的年的研究正在考虑中。低阈值的妥协的重要性气候事件与一个特定的集群;另一方面,如果更少数量的年,那么应该高阈值,进而将省去大部分集群。因此,作为一个最优之间的极端,是50%的年。图9显示柱状图与信任和支持垃圾箱year-count情况下阈值前后过程,分别预测PredSet1(表2)。获得的阈值对预测集展示在表12。对于每个预测集,我们将集群与物理气候事件,如果他们满足阈值都支持和信心。相对应的气候事件集群如表所示13。结果建立共存的事件拉尼娜现象洪水。它还将发生概率高埃尔-尼诺海流,干旱,积极IOD同时事件。

7所示。结论

季风是一个重要的农业用地,如印度经济发展的现象。大变化的季风多年降雨使预测一个具有挑战性的任务。本文试图解决这个问题通过集群年类似的团体和最后,multimodel集合预报提供印度夏季风降水。

不同的气候参数最佳相关的月值确定和五种不同的预测集的预测是建立印度季风。四种不同的模型,即先生,中长期规划,RNN,GRNN专门设计用于每个集群。提供的最终预测加权预测每个集群的整体模型,在重量被认为是模糊在每个集群成员的归属感。多层感知机整体模型提供了预测的平均绝对误差为4.0%的年降雨量,季风显著预测复杂的过程。提出了模糊clustering-based合奏方法超越传统的方法。提出clustering-based合奏模型的性能优于现有的洛桑国际管理发展学院的模型(4,5]。误差统计也确定了多层感知器模型要优于其他三提出的模型。最后,在气象背景下集群与全球气候事件有关。

在未来,大量的气候参数影响印度季风可以探索和不同的预测集可用于不同集群的年提供更好的预测精度。

利益冲突

作者宣称没有利益冲突有关的出版。

承认

这项工作是由RBU项目通过响应计划通过KCSTC ISRO, IIT Kharagpur。