文摘
本文的目的是比较混合模型与传统模型的结合在天气预报中减少错误。SMO除了简单的模型和RBF模型,模型,和LibSVM模型,不同的混合结合模型已被用于预测不同方案下。这些模型的预测的基础上,进一步比较误差计算和时间的混合模型和简单的模型来预测天气参数。本文结合模型在对流的模型用于预测天气参数减少错误。印度是一个热带国家,天气条件的变化。目标是建立一个联合模型参数以更少的错误预测天气。混合分析模型相结合的不同气象参数对不同城市的印度。气象参数的性能测量分析。可以看出,误差比较和时间的基础上采取的模型,混合wavelet-neuro-RBF模型给出更好的结果比其他模型由于低价值的错误决定,更好的性能,较小的时间。研究变得重要天气预报精度是一项复杂的任务以及减少预测误差由应用程序不同的模型和方案。 It is concluded that the proposed hybrid model is helpful for forecasting and making policies in advance for the betterment of the human being, farmers, tourists, and so on as in all these activities, weather forecast plays an important role.
1。介绍
天气预报的预测是一个重要的任务作为一个国家的经济,尤其是,哪个更agriculture-based取决于农业产量,进一步依赖于天气参数。有天气预报领域的不断努力提高预测精度。
应用程序的简单和混合模型的基本原理是通过流程图图解释1。
在最近的过去,研究工作已经明显天气参数进行时间序列分析。Bhardwaj和Duhoon1)研究时间序列的持久性行为月降雨量和温度对印度通过应用分散分析天气数据集从1901年到2015年。同样,像偷猎野生动物生态数据,研究了时间序列的持久性行为评估利用色散分析(2]。此外,在[3)使用时间序列分析,可预测性的变化研究了温度的因素,可能会导致时间序列预测或antipersistent行为导致死亡率增加由于随机温度波动在中暑现象。Antipersistence行为观察作者的研究数据,这不是一个好的指示器的方向温度下降的水平,尽管全球倡议像巴黎气候协议2015被3]。
不同的软计算技术来预测天气参数研究了(4]。在[5),它已经表明,集成简称ANFIS(自适应神经模糊推理系统)Sugeno模型和应用合成ANFIS-Sugeno模型日常温度等气象时间序列数据,输出的误差得到减少。进一步在6),单NARX(非线性自回归外生)模型,并结合模型W-NARX (Wavelet-NARX)研究了Bhardwaj Duhoon温度数据时间序列,比较输出结果,得出W-NARX显示更好的效率学习行为从输入参数与最小均方误差(均方误差)的训练,验证和测试8.12376e−1,4.86326e4.79787 - 1,e分别为- 1。的R值训练、验证和测试9.88728e−1,9.26185e9.94526 - 1,e分别为- 1。
对温度预测各种机器学习策略研究了Cifuentes et al。7),机器学习技术被证明是更好的准确预测。与传统的人工神经网络相比,学习策略报告小错误。聚类和分类技术研究了使用气象参数。朴素贝叶斯提供了更好的结果比其他Kappa统计数据和统计结果的基础上估计错误。在[8),k - means聚类、EM聚类、层次聚类被用作聚类方法,偏见花费最少的时间,这是得出的结论是,k - means聚类是一种有效的集群技术(8]。
每月一次的降水预报,Kalteh [9]研究人工神经网络ANN(人工神经网络)的结合和奇异谱分析模型。结合模型所以形成比单一ANN模型误差估计的基础上,通过计算RMSE(均方根误差)和系数效率。结果表明,结合模型执行方式优于单一的ANN模型。进一步结合小波模型和SVM(支持向量机)研究了基西人和试件10]预测每日降水离散小波变换和支持向量机结合起来形成一个结合模型。单个支持向量机相比,结合模型观察给最好的结果的基础上计算错误。
另一方面,Oana和Spataru11]研究了应用遗传算法结合WRF数值天气预报系统,使用遗传算法优化和预测。观察到,结合模型是有效和显示更少的错误。比较ARIMA(自回归综合移动平均)指数平滑模型,Holt-Winters模型和ETS模型(即。、错误、趋势和季节性模型),是由Guizzi et al。12)为了预测天气参数:温度、压力和湿度对意大利一个月。Holts-Winters模型给出更好的结果比其他两个模型。沙特阿拉伯的气候参数数据,个人中长期规划(多层感知器)和RBF(径向基函数)模型研究了萨巴et al。13]。他们比较结果与混合神经模型的结果,这是一个延时和RBF的组合,为了提高预测。均方根误差、相关系数和散射指数比较为了看哪个模型进行更好的误差较小。是观察到的混合模型显示更好的结果比个人中长期规划和RBF模型。Sepideh et al。14]讨论了去噪和小波去噪模型结合短期和长期预测的空气温度。简称ANFIS和WANFIS的比较表明,模型表现得比平常简称ANFIS模型。比较是由比较决心和RMSE系数。
Reddy和荣格预测负载使用小波和安15]。Shrimohammadi等人wavelet-ANFIS模型适用于预测干旱(16]。Turgay等人应用小波神经网络预测降水(17]。使用小波安[Piasecki等人预测水位18]。汗等人研究了小波安和ANN模型之间的比较(19]。Karami等人研究和应用ANN模型预测数据(20.]。Kanna等人采用一种自适应神经网络预测风力发电(21]。Adamowski等人使用小波和神经网络预测河流流22]。Araghi等人研究了小波混合模型(23]。刘等人分析了降雨预测小波和安(24]。
基于上述研究[25),在本文中,我们试图组建一个新的模型,该模型可以预测天气参数和花较少时间预测。气象参数的每日数据,即最高温度、最低温度、降水、风速、德里和孟买从2017年1月1日到5月30日,2018年,被认为是,钦奈,每日数据从2020年,1月1日到2月28日,2021年,研究了以研究日常天气参数的独立的数据集。这项研究的目的是研究不同城市在不同的位置在地图上的国家。印度首都新德里,面临着各种各样的季节。孟买是在海边,有很多水分存在,它有有限的季节。钦奈一起在不同的方面,面临着有限的季节。这些国家是人口密集的尽可能多的人从农村和城市地区生活。因此,为了研究天气每天独立数据集参数,这些国家已经采取了。
考虑数据平原,LibSVM(库支持向量机),RBF, SMO(序列最小优化)方法应用。接下来,不同的混合结合模型研究了不同方案下的时间序列气候参数使用Haar小波去噪和训练使用NARX之前获得的预测预报。研究包括(1)wavelet-RBF、wavelet-SMO wavelet-LibSVM, (2) Neuro-RBF, Neuro-SMO, Neuro-LibSVM,和(3)wavelet-neuro-RBF wavelet-neuro-SMO, wavelet-neuro-LibSVM。输出比较,在此基础上的错误和时间在秒的模型中,选择最合适的模型。Weka软件已被用于这项研究。
2。数据集
的气候在德里是一个结合monsoon-influenced潮湿的亚热带草原气候,夏季和冬季的气温和降水之间有差异。夏天从4月初开始,进一步高峰在5月底6月初,显示平均温度在38˚C,有时它可以上升到45˚C。冬天另一方面开始在11月和1月达到顶峰,显示平均温度6 - 7˚C。德里的接近喜马拉雅山结果在寒冷的波导致较低的温度。极端温度范围从2.2−48.4˚C。
孟买是一个热带的气候,潮湿和干燥的气候。孟买是适度热的气候条件与高水平的湿度。其沿海性质和热带位置确保温度波动不通过。孟买经历三个不同的季节:(1)冬天(October-February)温度:15到20˚C,(2)夏天(高于3)温度:观众˚C,和(3)季风(6)温度:24-29˚C。极端温度范围从14到30˚C。
钦奈的气候是热带湿和干燥的气候。钦奈位于赤道的热,也是沿海,防止极端季节温度的变化。钦奈的天气是炎热和潮湿的。今年最热的一个部分,是五月和六月初的时候,最高温度的38-42˚C。最酷的部分今年1月,最低温度18 - 20˚C。极端温度范围从13.9到45˚C。
根据表中的数据1研究中的模型进行了验证,上述数据点。
3所示。方法
3.1。小波方法
小波变换用于信号去噪,这意味着再生或重建一个信号从噪声。小波变换适用于相互依存分析为了匹配输出与输入信号。现在,如果信号是在一个小的电荷小波维度,其系数将相比相对较大的干扰;因此,能源息差大量系数。此外,减少小波变换将消除低振幅扰动或信号在小波域不需要。
Haar小波的妈妈小波函数可以写成
它的扩展功能可以写成
去噪方案的步骤如下:第一步:输入时间序列信号分解利用DWT(离散小波变换)选择小波。在这项研究中,使用Haar小波的函数给出了方程(1)和(2)。步骤2:通过作用于小波细节系数,阈值函数是用来减少噪声信号处理在步骤1。扩展或收缩系数取决于选择的阈值函数。在这项研究中,一个软阈值技术已被用于它的函数如下: 在哪里年代和Th表示小波系数和阈值。步骤3:提取逆小波变换去噪时间序列的步骤2的输出信号。
3.2。NARX方法
NARX是复发性神经网络反馈连接分布在几层的网络。它主要用于时间序列建模和基于线性ARX模型(自回归外生)。它是由以下方程: 在过去的输出信号值吗Y(t)和外源性独立的输入信号,下一个值的输出信号是退化。通过使用一个前馈神经网络近似f,NARX模型实现的。除了用作预测,NARX用于非线性滤波、目标信号输出是输入的无噪声的版本。
NARX计划的步骤如下:步骤1:负荷分解输出时间序列信号去噪使用DWT(离散小波变换)。步骤2:选择时间延迟和隐藏的神经元的数目。然后,使用Levenberg-Marquardt方法训练时间序列。第三步:培训时间序列和获得的输出。
在NARX,使用Levenberg-Marquardt反向传播方法,训练数据。它减少了误差最小。时间序列算法用于训练为目的的错误减少使用小波去噪后。
3.3。软计算技术
在这项研究中,基于软计算方法已被用于预测和描述如下。
3.3.1。RBF(径向基函数)的方法
RBF内核是最广泛使用的内核,因为相似的高斯分布。RBF内核计算两个数据点之间的相似性或亲密,可以在数学上被提出 在哪里方差和hyperparameter吗是欧几里得(l2规范)的两个数据点之间的距离y1和y2。
现在应用线性回归RBF转换数据如上所提到的,然后我们得到 在哪里N数据点的总数。小波去噪和NARX训练数据,回归RBF模型应用于获得预测结合RBF数据Yn。
RBF计划的步骤如下:步骤1:负荷分解输出时间序列信号去噪使用DWT(离散小波变换),然后使用NARX火车时间序列。步骤2:选择机器学习method-RBF培训使用算法的时间序列。第三步:获得所需的输出。
3.3.2。LibSVM方法
作为一种优化算法,介绍了SVM(支持向量机)由Shirmohammadi [16]找到超平面之间的最大差别保证金两类数据。评估一个输入数据样本 ,使用的决策函数的一般形式如下: 在哪里是训练样本, 输入样本数据样本吗我的大小d,有两个可能的值1或−1。核函数 估计之间的相似性我和t样本在特征空间b阈值函数的常数。系数值对应的拉格朗日乘子二次规划(QP)问题,这是通过最小化目标函数如下: 之间的妥协交易错误最小化和利润最大化是常数C和一个大C包括高错误处罚。下的QP问题分为QP子问题分块技术,QP子问题使用非零的一个子集的和训练样本(米)违反Karush-Kuhn-Tucker(马)条件。有几个像看到下面成了一个支持向量机SVM技术,nu-SVM, R-SVM。为SV LibSVM是一个集成的软件分类、回归,和分布估计,包括不同的支持向量机配方。
LibSVM计划的步骤如下:步骤1:负荷分解输出时间序列信号去噪使用DWT(离散小波变换),然后使用NARX火车时间序列。步骤2:选择机器学习method-LibSVM培训使用算法的时间序列。第三步:获得所需的输出。
LibSVM支持多级分类提供一个简单的接口,用户可以很容易地把它与自己的项目。Weka软件已被用于这项研究。Weka图书馆对支持向量机使用。
3.3.3。SMO(序列最小优化)的方法
在每个迭代中,利用拉格朗日乘数法,只有两个SMO算法将分块方法尽可能最小的表达式。确定最优值的乘数,更新和支持向量机框架直到QP问题已经解决了。分析,优化子问题可以解决两个拉格朗日乘数法使SMO有利。的方法,该算法选择两个训练样本 和 ,相关的拉格朗日乘数法是什么和 。优化目标函数的方程(8)为变量和现在变成
主程序初始化两个分类问题的支持向量机算法和评估所有的样品和相关的拉格朗日乘数法 。在整个迭代,拉格朗日乘数的值不会改变了,然后程序完成。过程的输出偏差和乘数的列表和任何输入数据时间序列可以用方程(评估和预测7)的支持向量机。
SMO计划的步骤如下:步骤1:负荷分解输出时间序列信号去噪使用DWT(离散小波变换),然后使用NARX火车时间序列。步骤2:选择机器学习method-SMO培训使用算法的时间序列。第三步:获得所需的输出。
生成方法后,结果被小波去噪,训练神经网络,使用基于技术和预测的软计算RBF LibSVM, SMO连同他们的结合模式。之间的误差预测时间序列(FTS)和原始时间序列(OTS)计算如下:
性能错误(一)平均绝对误差(MAE):美是用来测量的平均大小错误预测的值的集合。它措施效率连续变量。梅的平均观测值和实际值之间的差异。美计算实际值和预期值的区别: 在哪里是预测价值;是实际的价值;的数量条款。(b)相对绝对误差(RAE):雷是一样的RMSE但略小,也比较是计算模型具有更好的性能。 在哪里预测的值;是先前的目标价值;是实际的价值。(c)均方误差(RMSE):它测量的平均大小错误。之前错误的平方平均值,RMSE是相对较高的体重大错误。 在哪里X是实际的价值;X我预测的值;N是观测的数量。(d)根相对平方误差(RRSE):它是一个工具来计算错误,错误是规范化的平方根。 在哪里预测的值;是先前的目标价值;是实际的价值;是观测的数量。
4所示。结果与讨论
数据已经被训练、测试和验证为70%,15%,和15%的所有数据在使用NARX方法来研究时间序列的模式。参数研究是最高温度、最低温度和风速。这是观察到信号去噪+训练至少偏离了原始数据的轨迹。预测期间的2018年6月1日,6月7日,2018年,德里和孟买和3月1日,2021年,3月7日,2021年,钦奈,原始数据signaled-noised数据信号,训练数据信号,和去噪以及训练RBF数据信号是美联储,SMO,和LibSVM模型的简单的模型预测下方案1和混合模型预测结合方案2、3和4分别。情节比较简单的和混合的预测与原始数据预测期数据所示2(一个)- - - - - -2(左)。对于不同的简单小波结合混合模型,误差和时间比较表1- - - - - -7为城市和数字来选择最有效的模型。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
(j)
(k)
(左)
上面的错误估计和时间由简单,结合模型显示效率的混合模型,因此,它可以从数据得出结论6- - - - - -8和表1- - - - - -8小波+神经+ RBF模型显示了天气的预测参数的最佳效果。RBF方法具有设计简单,更好的推广,和强大的宽容输入噪声,及其学习能力使得它非常适合设计灵活的控制系统,而SMO是解决问题的迭代算法。SMO打破这个问题为一系列尽可能最小的子问题,然后分析解决。尽管LibSVM逐步工作,首先通过训练数据来获取模型,然后利用模型预测信息的测试数据集,RBF是一个更好的方法相比,它作为RBF工作更快通过计算数据值之间的距离,然后研究数据的模式做出相应的预测。SMO和LibSVM的方法需要更多时间来研究时间序列的模式。在SMO的情况下,需要更多的时间来的数据集分解成越来越小的集,由于一些点离开,因此,错误几率增加。同样,LibSVM,它包括多个算法,它需要时间去理解模式,然后选择正确的模型。因此RBF的预测更准确的观察比LibSVM和SMO方法。LibSVM的SMO,混合模型的预测和错误是没多大区别传统的模型预测和错误,虽然花费的时间(TT)显著降低使用混合动力方案。但应用小波和NARX然后喂去噪+训练的RBF产生更好的预测数据来预测时期相比,RBF直接喂数据获得的预测。 It is observed that when the data input signal is first denoised using the Haar wavelet and then trained using the neural networks (NARX), the double processing of data reduces the error in the forecasts obtained after feeding the denoised plus trained data signal to plain RBF model. The hybrid or conjunction model of Wavelet + Neuro + RBF provides better predictions with the least error and time taken to build the model [15,24考虑天气参数数据的时间序列。
时间是在几秒钟内,在百分比RRSE和雷,梅和RMSE作为单位。
图3显示了一个比较实际的和预测的时间序列值的德里。
数据3- - - - - -5时序图是新德里、钦奈和孟买的原始和去噪训练时间序列。
(一)
(b)
(c)
(d)
(一)
(b)
(c)
(一)
(b)
(c)
图6显示了错误块的统计计算表2- - - - - -5比较的模型。时序图的最大温度、最低温度、风速德里、孟买、钦奈如下。
(一)
(b)
(c)
(d)
(e)
为了验证基于最初的观察研究气象参数对日常数据集对德里地区从1月1日到5月30日,2018年,2017年,获得IARI(印度农业研究所,德里),这项研究进一步应用于独立数据集的每日最高温度、最低温度、风速和孟买地区从1月1日到5月30日,2018年,2017年和钦奈地区从2020年1月1日到2月28日,2021年,获得可用meteoblue天气记录在线。结果列在下表中6−8早些时候,确认我们的观察RBF生产预测比LibSVM SMO和小波+神经+ RBF最有效方法相比其他混合动力和传统的计划。
数据7和8显示错误的情节比较的模型。原文的偏见和预测价值最高,最低温度和风速计算德里、孟买、钦奈。偏见的直方图如图9。
(一)
(b)
(c)
(d)
(e)
(一)
(b)
(c)
(d)
(e)
5。结论
摘要德里(最高温度、最低温度、蒸发和风速)和孟买(最高温度、最低温度和风速)从1月1日到5月30日,2018年,2017年《每日气象参数的数据被认为是,和钦奈(最高温度、最低温度和风速)从1月1日,2020年,到2月28日,2021年,《每日气象参数的数据被认为是在第一阶段的研究。在第二个阶段,wavelet-neuroconjunction模型进行了研究。使用小波变换,气象参数的时间序列去噪,然后使用NARX训练数据时间序列信号去噪,最后,去噪+自由SVM训练时间序列是美联储,RBF, SMO获得新颖的混合预测预报。这些预测输出时间的模型相比,和错误,即美,RMSE,雷,和RRSE计算。LibSVM的SMO,混合模型的预测和错误是没多大区别传统的模型预测和错误虽然花费的时间(TT)显著降低使用混合动力方案。RBF预测观察到比LibSVM和SMO方法更准确。基于误差计算和花费的时间,混合动力方案使用wavelet-neuroconjunction模型能更好的输出比传统的RBF方法的简单应用程序。由于适当的混合模型,时间序列信号的去噪和培训使用小波和NARX,分别产生更好的结果比预期获得的直接把数据传输到RBF模型,从而验证研究的独立数据集孟买天气参数从1月1日到5月30日,2018年,2017年和钦奈从2020年1月1日到2021年2月28日。得出小波+神经+ RBF模型显示了更好的结果在气象参数的预测相比,所有其他混合动力和传统模型。最后可以得出结论,小波+神经+ RBF模型显示了更好的结果在不同时期的不同的数据值和。 The study will help the concerned authorities for future planning and take preventive steps for future coming calamities if any. It will also help the government to make effective policies.
数据可用性
支持本研究使用的数据来自IARI气象数据库系统物理农业分工,IARI新德里(https://www.iari.res.in/index.php?option=com_content∼∼∼∼∼∼∼∼∼^∼^∼^∼^∼∼∼∼∼∼∼∼∼∼∼amp;文章观点=∼∼∼∼∼∼∼∼∼^∼^∼^∼^∼∼∼∼∼∼∼∼∼∼∼amp; id = 450∼∼∼∼∼∼∼∼∼^∼^∼^∼^∼∼∼∼∼∼∼∼∼∼∼amp; Itemid = 224)。
的利益冲突
作者宣称没有利益冲突。
确认
作者感谢大师高宾德辛格Indraprastha大学研究机构和财政支持。