研究文章|开放访问
Salwa Waeto, Khanchit Chuarkham, Arthit Intarasit, "用混合方法预测时间序列运动方向",概率与统计杂志, 卷。2017, 文章的ID3174305., 8 页面, 2017. https://doi.org/10.1155/2017/3174305
用混合方法预测时间序列运动方向
摘要
预测时间趋势序列是一个充满挑战的任务,其赋予了更好的理解。本文的目的是介绍与归类集成移动平均相关的支持向量回归的混合模型,其由混合方法制定。拟议的模型更方便实际使用。泰国南叛乱时间序列的趋势建模对该研究制品感兴趣。The empirical results using the time series of monthly number of deaths, injuries, and incidents for Thailand’s south insurgency indicate that the proposed hybrid model is an effective way to construct an estimated hybrid model which is better than the classical time series model or support vector regression. The best forecast accuracy is performed by using mean square error.
1.介绍
时间序列建模和预测是描述时间序列的动态现象和模式行为的挑战。近年来,准确泰国南叛乱趋势的问题得到了更多的关注。有许多研究论文研究了泰国南部的骚动。根据深南观察数据库[1]、Jitpiromsri和Mccargo [2]和jitpiromsri [3.]报告了泰国南叛乱的趋势,使用图表进行了比较骚乱事件的月度数量。通过应用多项式最小二乘回归,它们提供了用于描述泰国南部的动乱事件的预测模型。这种多项式并不确切地拟合月令的骚乱事件的数量。
在本研究中,我们希望确定模式和趋势的泰国南部叛乱,并评估模型的准确性建模和预测。为此,我们使用了传统的回归模型,如自回归(AR)、移动平均(MA)、自回归移动平均(ARMA)和自回归综合移动平均(ARIMA)。这些模型也被称为Box-Jenkins模型。
一般来说,泰国南部叛乱的时间序列数据可以用Box-Jenkins方法分类为非平稳时间。然后利用支持向量回归(SVR)方法得到泰国南部叛乱事件时间序列数据的估计模型。我们的目标是将ARIMA和SVR相结合,形成一个充分估计的模型,以预测泰国南部叛乱的时间序列。
本文组织如下。部分2提供与时间序列建模和预测和SVR相关的数学理论的一些背景。提出的混合模型的细节在一节中解释3..部分4给出了实验结果,得到了该混合模型在泰国南部叛乱时间序列上的一阶差分。最后,本节总结了本文的主要结论5.
背景和数学理论
2.1.自回归综合移动平均模型
时间序列预测的三种基本方法是naïve模型、指数平滑模型和ARIMA模型。前两个模型与作为模型的公式的随机漫步有关。本节将回顾ARIMA模型。
顺序的自回归模型缩写为AR ()模型 在哪里是静止的, 是常数 , 和是均值和方差为零的白噪声序列吗.ar()模型(1)预测当前值由过去的函数 这就解释了作为线性组合 .
移动平均订单模型缩写为硕士()模型 在哪里是静止的, 是常数 , 和为均值为零的高斯白噪声序列。硕士()模型(2)解释当前价值通过线性组合白噪声 .
自动增加移动平均模型作为ARMA( )模型,由Box和Jenkins开发[4]由组合的自回归和移动平均模型定义。它具有表单
根据原始盒子詹金斯方法,综合过程是通过差异而获得的静止过程。静止的arma(,)的过程次数用ARIMA表示( ): 在哪里表示时间差时间序列[5].这些模型是时间序列预测的基础模型。
2.2.Box-Jenkins方法
自相关函数(ACF)和部分自相关函数(PACF)的曲线是主要工具,以识别AR,MA,ARMA和ARIMA模型的参数。ar()用来获得时间序列的估计模型,当acf表现出快速衰减的趋势时,无论是指数衰减还是衰减的正弦波,而pacf表现出滞后到的尖峰(显著自相关)的趋势然后会立即消失。
与AR相反(),硕士()被用来获得一个估计的时间序列模型,当acf表现出快速衰减的趋势时,无论是指数衰减或衰减的正弦波,而pacf表现出尖峰(显著的自相关)的滞后到然后会立即消失。
混合过程ARMA( ),当acf或pacf退出时,分别表现为滞后尖峰和然后通过指数衰减或通过阻尼正弦波快速消亡。继续诊断检查以识别和的混合过程ARMA( )能够适应时间系列是最好的性能[6].
如本节所述的这种识别对于诊断我们的研究模型非常重要。
2.3.混合模型
近年来,文献中使用的预测模型可以分为三类:统计模型,人工智能模型(AI)和混合模型。
统计模型称为时间序列模型,包括天花型模型,AR模型,MA模型,ARIMA模型,指数平滑,以及旨在利用时间序列分析来识别时间序列模式并提供的术语挥发性基于所获得的模式的未来价值。
ARIMA模型被称为Box-Jenkins模型[4其中包括Box-Jenkins方法论确定的AR和MA模型。这些模型是基于假设所研究的时间序列是平稳的和线性的,这意味着输入和输出序列之间的关系是线性的。
人工智能模型是预测时间序列的第二类模型,实际应用有人工神经网络(ann)、遗传算法(GA)和支持向量机(SVM)。人工智能模型可以捕捉非线性模式,提高预测性能。
许多文献都引入了混合模型来捕捉时间序列的线性和非线性特性。Wang等[7]报告说,单独使用统计模型或单独使用人工智能模型不足以对股票价格时间序列进行预测。
2.4.混合的方法
用混合方法的模型组合描述了混合模型。许多文献建议时间序列由线性组成和非线性如表格所示
估计的模型(5)的公式如下:利用线性统计模型得到线性分量的估计模型表示然后对残差进行建模 其中仅包含非线性关系以获得估计的非线性组件模型表示.
张(8通过引入估计的模型来利用混合动力模型(5)的形式 ,在那里是由ARIMA模型规定的由前馈神经网络模型规定。修改了张的混合方法估计通过支持向量机(SVM)模型可以在许多文献中找到,例如,de Oliveira和Ludermir [9],而Aladag等人。[10.]估计将Elman递归神经网络(ERNN)模型应用于加拿大猞猁数据。
2.5.支持向量回归
让DOT产品速度是我们的数据宇宙与矢量 作为对象。让是一个样本设置 .让 是目标功能。让 成为训练集。
回归问题是找到最好的近似模型 对于真正的基础函数映射输入输出通过使用这样 .
回归问题被分类为线性或非线性类型。对于线性回归模型,最好的近似模型可以从具有以下一组规格的可能函数集中获得: 在哪里权向量和是一个常数。
通常,为了描述输入和输出之间的非线性关系,SVR Allize 将非线性回归问题转化为低维输入空间在高尺寸特征空间中进入线性回归问题.在新的空间,线性模型被制定,表示原始空间中的非线性模型: 在哪里 表示点产品.线性SVR模型在(6)从(7)通过使用身份函数 .
执行SVR以适应线性回归通过估计来培训数据和在(7)为以下正则化函数的最小值: 两者俩和用户给出的参数和 是二次-不敏感损失函数定义为
以下两个命题与估算模型的形成有关。这些命题由[11.,12.]为了我们的研究。
命题1。给定一个回归训练集 由最佳支持向量回归模型计算 ,参数在其中和解决了以下优化问题: 保持与 .
常数被称为惩罚常数,它是在边际最大化和松弛变量最小化之间的权衡。
命题2。给定一个回归训练集 由最佳支持向量回归模型计算 ,在那里 和是以下双二次优化问题解决的参数:
参数是由和哪个满意的优化(11.).参数解如下:获得 从 (11.)和替代品 和 在约束 ;然后解决.定义的平均值.
通过代入得到最优回归模型进入到 我们有下面的引理。
引理3。最佳回归模型是 的系数 是非零作为支持向量。最佳回归模型仅取决于支持向量。
3.拟议模型的制定
在本节中,我们希望制定所提出的模型。我们首先使用结合多种型号的混合模型来降低使用不适当模型的风险,从而获得比前一个更准确的结果,并提高整体预测性能。
假使,假设是基于线性和静止时间序列的假设的研究时间序列。然后,我们使用Box-Jenkins方法来检查行为.在这一步之后,我们可以得到一个合适的AR模型()或硕士()或ARIMA ( )以便估算.用(2) 要么 (3.) 要么 (4),我们可以得到在表单中 .根据引理3.,对待研究时间序列进行SVR以进行评估从 (12.).这个模型是它过去的一个功能表单中的值 与 .
考虑设定时间 与 和 .只有一个单时间点(必然来自时间时间)准时地 满意 对所有 和 满意 对所有 .提出的混合模型是由设置定义的估计模型 对所有 并否则消失和设置 对所有 否则,消失。该混合模型可以扩展为包含两个或两个以上的时间间隔。
替代研究时间序列采用本文提出的混合模型初步建模如下: 在哪里是时间序列模型的残差从(13.), 在哪里和正在研究的时间序列模型的残差是否在时间内估计模型分别为.
4.混合模型在泰国南部叛乱运动方向预测中的应用
4.1.数据集
在这项研究中,我们感兴趣的是研究泰国南部四省的动乱,特别是北大年、雅拉、那拉提瓦和松克拉的部分地区。我们考虑了这些省份每月的死亡、受伤和事件数量。在进行工作研究时,我们可从深南观察(DSW)获得最新数据[1]深南方协调中心(DSCC)[13.].通过使用提出的混合模型,我们的目的是建立一个估计模型的死亡,受伤和事件的趋势,在这些地区。
数字1图示从2005年到2015年,南方四省发生的骚乱事件数量。这个图提出了一种高频小波动的骚乱事件的数量在第一时期(2005年至2008年),减少频率骚乱事件的数量在中间时期(2009年至2012年),和一个越来越频繁动荡事件的数量从2013年到2014年,2015年的最低频率。
我们研究的数据系列包括从2012年9月到2015年12月泰国南部四省40个月的死亡、伤害和事件。
数字2提供三个图表,描述了死亡,伤害和事件的三个数据系列的三个数据系列。它表明,死亡的图表是所有时间的底部,而伤害的图表在几乎所有时间几次的死亡和事件的图表之间。此外,事件的图形几乎在所有时间段内都在顶部。
从图中2,我们可以看到,事件的数量不一定等于伤亡人数的总和。有时,会有动荡的事件发生;没有发生死亡或受伤。或者在一些事件中有大量的伤亡。
每月的受伤人数和事故数量显然没有变化。通过绘制acf和pacf,可以确定两个数据序列月数的候选模型。但是,每月死亡人数的平均值呈线性趋势,因为它有明显的下降趋势。
数字3.显示月度死亡人数与月度死亡人数(a)的第一个差分序列的比较,以及acf (b)和pacf (c)的绘图。伤害数据序列与第一个差分序列的对比如图所示4并且数据系列的事件符合其第一个差异系列如图所示5.
(一种)
(b)
(C)
(一种)
(b)
(C)
(一种)
(b)
(C)
绘制第一个差分系列(图3.,4, 和5)表明,它看起来像一个平稳的过程,尽管绘制一系列死亡、伤害和事件的acf和pacf不能清楚地识别参数,以构建由ARIMA模型构建的估计模型。
每个月死亡人数的第一个差异的acf趋向于迅速下降,而pacf趋向于显示延迟到1的尖峰,这忽略了当它超出限制时每个地块上的显著尖峰。这表明,每月死亡人数的第一个差异可以作为AR模型.
类似地,第一组不同的伤害和事件可以作为AR模型.经诊断阶段残差检查,提示ARMA是一个候选模型,用于制定每月伤亡人数第一个差异的估计模型。马也是每月次数的第一个差异的候选模型。符合阿里马( ), ARIMA 是每月伤亡人数和ARIMA的估计模型吗 为每月事件数。
表格1报告由Arima,SVR和杂种制定的每月死亡人数,伤害和事件的三种估计模型的均值方差(MSE)。通过选择最佳轨迹来计算正式模型的均方误差: Arima为每个系列模拟的轨迹。
|
|||||||||||||||||||||||||||||||
| 请注意.每月死亡和受伤人数为ARIMA(2,1,3),每月事故人数为ARIMA(0,1,1)。 |
|||||||||||||||||||||||||||||||
绘制均方误差的收敛点是从每月的数字和一个估计模型2500,5000 每月死亡人数,伤害和图中所示事件的轨迹6.
(一种)
(b)
(C)
设置= 0.0025,= 150000,= 3.25,和SVR模型和使用Arima的2.75 为了从模型中选择出最佳的轨迹 试验轨迹,然后两种型号都是组合的,以便为每月死亡人数制定估计的模型: ,在那里 , 和 在哪里 , , 和 ,其中指定了一个值。
SVR-Arima的预测性能 用于每月死亡和伤害的混合模型,如图所示7.
以同样的方式,为每月的受伤次数,设置= 0.025,= 350000,= 2.755,和SVR模型和使用Arima = 0.00125 为了从模型中选择出最佳的轨迹 试验轨迹,这两个模型结合起来,以形成一个估计的模型,每月受伤人数: ,在那里 , 和 ,在那里 , , 和 ,其中指定了一个值。
SVR-Arima的预测性能差异月度损伤的混合模型如图所示8.
对于每月事件数,设置= 0.025,= 200000,= 1.555,SVR模型= 0.725,使用Arima 从模型中选择最好的轨迹 试验轨迹。然后将这两个模型结合起来,形成每月事件数量的估计模型: ,在那里 , 和 ,在那里 , , 和 ,其中指定了一个值。
SVR-Arima的预测性能 月事件数的混合模型如图所示9.
5。结论
本研究采用SVR-ARIMA混合模型,建立泰国南部叛乱月数量的时间序列模型。特别是,我们考虑到2012年9月至2015年12月40个月来北大尼省、雅拉省、那拉提瓦省和松克拉省每月死亡、受伤和事件数量的首次差异。根据混合方法,SVR-ARIMA( )模型结合ARIMA( )和SVR模型。绘制自相关和偏自相关图表明,每月死亡、受伤和事件数量的第一差异是线性和平稳的。
估计模型的测试结果是从所提出的混合模型获得的,并与估计的AR估计模型相比(),硕士()、ARIMA ( )和支持向量机模型。这表明所提出的混合模型比其他模型性能更好。泰国南部叛乱的时间序列,SVR-ARIMA 是每月死亡和伤害和伤害的估计模型和SVR-Arima 是每月次数的估计模型。特别是SVR-Arima 由两个组件组成:第一个组件使用SVR模型,以制定历史数据的估计模型,第二个组件使用ARIMA模型,以制定短期内未见价值的估计模型。
的利益冲突
提交人声明有关本文的出版物没有利益冲突。
致谢
作者感谢深南协调中心(DSCC)和深南观察(DSW)提供的数据。这项研究得到了泰国高等教育委员会卓越数学中心的资助。
参考文献
- 深南观察(DSW)。泰国深南事件数据库。http://www.deepsouthwatch.org/dsid.
- S. Jitpiromsri和D. Mccargo,《六年的泰国南部冲突:叛乱,不仅仅是犯罪》当代东南亚,第32卷,第2期2,页156-183,2010。查看在:出版商网站|谷歌学者
- s . Jitpiromsri关于深度南部暴力冲突的不方便真相:混乱,约束的现实和不确定的决议十年,冲突研究中心和文化多样性(CSCD),深南观察(DSW),宋卡大学,2010年。
- G. E. P. Box和G. M. Jenkins,时间序列分析:预测与控制, holden day,旧金山,加利福尼亚,美国,1976。查看在:MathSciNet
- G. E. P. Box G. M. Jenkins和G. C. Reinsel,时间序列分析:预测与控制,Prentice Hall,Englewood Cliffs,NJ,美国,第3版,1994年。查看在:MathSciNet
- D.阿斯特里欧和S. G.霍尔,应用计量经济学,帕尔格雷夫·麦克米伦,中国,第二版。
- j j。王,J.-Z。王,Z.-G。张,S.-P。基于混合模型的股指预测欧米茄,第40卷,第5期。6, pp. 758-766, 2012。查看在:出版商网站|谷歌学者
- G. P. Zhang,“使用混合Arima和神经网络模型的时间序列预测”Neurocomputing,第50卷,第159 - 175,2003年。查看在:出版商网站|谷歌学者
- J.F.L. de Oliveira和T. L. Ludermir,“时间序列预测中的参数优化和滞后选择的混合进化系统”第三届巴西智能系统会议论文集,BRACIS 2014,第73-78页,巴西圣保罗,2014年10月。查看在:出版商网站|谷歌学者
- C. H.Aladag,E. eGrioglu和C. Kadilar,“预测杂交方法的非线性时间序列”,应用数学的信第22卷第2期9, pp. 1467-1470, 2009。查看在:出版商网站|谷歌学者
- L.仓鼠,知识支持向量机的发现,John Wiley & Sons,霍博肯,新泽西州,美国,2009。
- N. Cristianini和J. Shawe-Taylor,支持向量机简介,剑桥大学出版社,剑桥,英国,2000。查看在:出版商网站
- 深南协调中心(DSCC)。泰国南部暴力事件和受害者数据库。http://dsrd.pn.psu.ac.th/webnew/index.php/database.html.
版权
版权所有©2017 Salwa Waeto等。这是分布下的开放式访问文章知识共享署名许可协议如果正确引用了原始工作,则允许在任何媒体中的不受限制使用,分发和再现。