研究文章|开放获取
Chun-xue聂,薛博金, ”间隔斜率方法长期股票价格趋势的预测”,数学物理的发展, 卷。2016年, 文章的ID8045656, 7 页面, 2016年。 https://doi.org/10.1155/2016/8045656
间隔斜率方法长期股票价格趋势的预测
文摘
股票价格是一个典型的但是时间序列数据的复杂类型。我们使用了有效的长期预测时间序列数据安排投资战略和获得更高的利润。由于经济、环境和其他因素,很难获得精确的长期股票价格预测。介绍了指数分段模式(ESP),用来预测不同股票数据的波动在五未来的预测区间。股票定价的新特性在子区间,命名为间隔斜率,可以描述股票价格的波动在特定的时期。均方误差的累积分布函数(CDF)相比MMSE-BC和SVR。我们的结论是,这里开发的间隔斜率可以捕获更复杂的股票价格趋势的动力学。平均股票价格可以相对准确地预测在特定的时间间隔,使用多个意味着值随着时间间隔的表达时间序列从长远来看。这样,长期股票价格的预测更准确,防止累计误差的发展。
1。介绍
股票价格是一个典型的和复杂的时间序列数据类型。股票价格的预测一直是一个活跃的研究领域在计量经济学、信号处理、模式识别、机器学习一段时间。股票交易员和投资者股市预测非常感兴趣,因为可以获得可观的利润,交易股票。传统上,金融时间序列的基本方法统计方法,如自回归移动平均(ARMA)模型,集成自回归移动平均模型(ARIMA)和广义自回归条件异方差性(GARCH),要求线性变化在股票价格保持平稳。一般来说,统计模型不能适应变化的过程。因此,传统统计方法无法预测股市表现很好当跟踪股票市场的复杂性1]。
最近,许多机器学习系统被用来预测股票价格。这些包括人工神经网络(ANN) [2,3),贝叶斯网络(4),遗传规划(5),支持向量回归(SVR) [6[]、用户分析7,情绪分析8),和混合网络(9- - - - - -15]。因此,机器学习方法可以用来跟踪的复杂性和非平稳的股市短期预测。这些方法预测长期趋势只有很大的困难。现有方法的长期股票预测主要包括以下:使用递归迭代预测获得长期预测的趋势(12];然而,这种方法涉及到累积误差和累积误差随预测过程中的步骤的数量。通过使用滑动窗口算法删除旧数据,新数据,可以更新预测模型在序列6]。移动窗口的长度也有相当大的影响力在建模过程的准确性。这个系统只能显示在预测区间意味着股票价格和股票不能显示的细节变化趋势在这个区间。此外,目前的方法直接使用均值作为特征的股票趋势预测。关于波动较大的时间序列,均值的区间值削弱时间序列的波动特征,减少长期天气预报的准确性。由于这些原因,对股票价格的预测仍然是一个有价值的问题。
长期时间序列预测其他应用程序,如主机负载预测。负荷预测是至关重要的在动态的云计算环境中高效的资源利用率。迪等人使用指数分段模式(ESP) (16)来预测主机负载在云中。他们提议使用9不同的特性描述最近的证据子区间负荷波动。他们能够预测平均负载超过连续时间间隔。
摘要指数分段模式(ESP)是用来预测股票价格的波动连续未来的时间间隔。当我们给子区间股票价格的一个新特性,即间隔斜率的股票价格在规定的时间内波动。间隔斜率可用于确定的子区间的股票。支持向量回归和贝叶斯分类器是用来预测股票价格趋势和验证的有效性间隔坡子区间的股票价格。
本文以下贡献:(我)指数分段模式(ESP)是用来预测波动在不同的长期股票数据,不仅可以准确地预测意味着股票价格在未来的时间间隔也意味着股票价格连续在未来的时间间隔。通过这种方式,长期股票价格的预测可以更精确的和累积的生成错误是可以预防的。(2)新功能的使用股票定价的子区间,即间隔斜率,在这里提出更好地描述股票价格波动时期。
剩下的纸是组织如下。节2介绍了长期的股票价格预测模型。节3,实验和比较不同的模型。结论给出了部分4。
2。基于模型预测股票价格的长期趋势
预测目标是长期预测开盘价格的波动。多个精确值随着时间的间隔是用来表达时间序列的长期趋势。
该股票价格趋势预测模型包括以下三个步骤:首先,使用ESP原则,估计数据段分为一组连续的段,其长度成倍增加。间隔斜率是用来描述每个区间的特点。然后,机器学习方法,SVR和MMSE-BC用于生产数据的转换模型用于预测平均股票价格在接下来的时间间隔。多个精确值随着时间的间隔是用来表达时间序列的长期趋势。这样,预测股票价格在长期内可以执行精确而不产生累积误差。
2.1。指数分段模式(ESP)和转换的部分
当前工作的目标是预测趋势模式的连续波动的股票价格未来的时间间隔。最重要的步骤提出了股票价格趋势模式的预测,估计数据段分为一组连续段由ESP原理,其长度成倍增加。ESP如图的一个例子1。在当前时间点,估计数据段分为一组连续段的长度呈指数增加。每个后段的长度,在那里。连续每一部分在未来的时间间隔,用平均值,在那里。
然而,意味着股票价格在连续时间间隔很难预测,股票价格在一个未来的时间间隔是容易预测。每个后段的长度,在那里。的平均预测股票价格每一段时间都是在这里,在那里。
一组意味着股票价格的一个时间间隔是可用的。当前工作的目的是为了预测未来平均股价在连续时间间隔()。事实上,这个向量可以从向量转换根据以前的工作(通过下面的感应16]。
假设当前的时刻,用户已经预测两意味着股票价格(如图所示和固体红色线段)在两个不同的时间间隔(和)。然后,两个阴影区域,相同的大小,意味着股票价格可以导出。转换了 在这里,是预测股票价格在新段意味着什么黑色对应线段图1。
考虑到和,(1)可以进一步简化,生产
2.2。股票价格的波动的特性
当前工作的目的是预测的平均股价在未来的时间间隔(从当前时间开始。在这里,每一个未来的时间间隔称为子区间。基于股票价格趋势的特点,股票价格的一个新特性提出了子区间。这个特性称为间隔斜坡,它可以用来描述波动的股票价格波动在一个特定的时期。时间序列的子区间来标示,在那里,子区间的样本股票价格。例如,小音程是4天(即,),其特性对股票价格波动图所示2。
时间间隔平均价格。 是指股票价格的条件子区间等于多少:
去年的价格区间。最后价格是最近价格值的子区间。
间隔斜率( )。间隔斜率线性方程的斜率条件的子区间=。
首先,过去价格和子区间的平均价格计算。然后,线性方程被用来适应子区间的样本;也就是说,
这将生成以下: 间隔斜率可以转化为意思(5)。
例如,的价值可以设置如下:。基于股票价格波动的特性、历史数据和预测数据如图2。
接下来,未来数据特性预测(区间均值和间隔的斜率)通过学习历史数据功能。在下一节中给出的预测方法。
2.3。长期预测基于区间的斜率
来验证开发功能的有效性和评估股票价格的区间坡子区间,支持向量回归和贝叶斯分类器被用于长期预测。两种机器学习方法,SVR和MMSE-BC用于生产的变换模型数据和股票价格是用来预测下一区间的斜率。
(1)支持向量回归(SVR)。SVR算法的目的是最小化ε敏感的错误数据的子集,称为支持向量。SVR算法使用非线性核函数以项目初始数据的高维空间和项目线性分类器更高的原始空间。SVR的公式表示如下: 在这里,是一个用于确定权向量的最大边界超平面,这个词吗被称为正则化项,它应该尽可能平坦。第二项是实证以Vapnik的错误ε不敏感损失函数。是正规化常数。
以下常用的核函数包括:线性:。多项式:。乙状结肠:。径向基函数:。
(2)贝叶斯分类器。MMSE-BC被认为是最好的策略,使用贝叶斯方法与单一特性意味着基于评价类型负载一分之一以前的工作(16]。这里使用的MMSE-BC是最小均方误差(MMSE)基于贝叶斯分类器。这是一个经典的监督学习分类器应用于数据挖掘。制定MMSE-BC表示
重要的是贝叶斯分类器计算先验概率分布为目标状态基于样本和计算联合概率分布对于每个国家。然后,后验概率根据计算公式(7)。
2.4。趋势预测模型
这里提出以下趋势预测模型作为一种防止代的累积误差。该股票价格趋势预测模型有以下三个步骤:首先,使用ESP原则,估计数据段分为一组连续段的长度成倍增加。间隔斜率是用来描述每个区间的特点。然后,机器学习方法,SVR和MMSE-BC用于生产的变换模型的数据和股票价格是预测未来的预测区间。
首先,选择股票开盘价格数据。第二,时间序列(股票开盘价数据)被分成一组未来的时间间隔段(),其长度成倍增加。下面的子区间的长度,在那里。第三,意思是和区间斜率计算每个子区间,特征数据集分为训练数据集和预测集。接下来,MMSE-BC和SVR训练为了产生模型参数。例如,它可以计算先验概率和条件概率(在(8))和生产边界导致最大的利润从两组点SVR预测意味着股票价格和在预测区间间隔坡一个区间。间隔坡必须转变成的均值区间根据(5),因为连续平均值在未来的时间间隔是用来表示时间序列的长期趋势。然后,连续平均值在未来的时间间隔可以从向量转换基于(2)。最后,这个数据集可以计算的均方误差。
为了评估的性能MMSE-BC SVR,整个数据集的预测均方误差计算。例如,前1000个交易日的价格被选为培训和价格预测未来选择32天。整个过程之前提到的趋势预测模型的过程。然后,第一个1040个交易日的价格可以学到和32天的价格可以预测。接下来,每个流程是找到预测均方误差的过程。更高的价格预测的过程性能继续预测未来股票价格。的方法设置窗口如图3。
算法1使股票价格趋势预测模型的伪代码。
|
||||||||||||||||||||||||||
3所示。实验和比较
本节介绍实验的趋势预测模型在股票价格预测开放。趋势预测模型在这里所能捕捉的动态高度非线性,非平稳的时间序列。
3.1。评价指标
评估这些预测的准确性,总体均方误差(MSE)之间的预测股票价格预测区间中值和真实值可以计算如下: 在这里,,测试数据集的预测均值,测试数据集的真正意思,的总数是在预测区间段。
3.2。培训和评估的方法
八开股票价格对这些实验数据样本随机选择:IBM、可口可乐、微软、亚马逊、索尼、金佰利、美国银行和1999.1.1-2014.10.30沃尔格林。
SVR和MMSE-BC用来预测趋势开放股票价格,和一些关键参数表中列出1。
|
|||||||||||||||
3.3。实验结果
MMSE-BC和SVR的结果比经典的均值和间隔的斜率。八个股票开盘价数据样本、IBM、可口可乐、微软、亚马逊、索尼、金佰利、美国银行、1999.1.1-2014.10.30沃尔格林,比较MSE。数据4和5显示MSE的累积分布函数(CDF)不同的预测方法,SVR的内核是乙状结肠。
如数据所示4和5,上面的间隔斜率曲线区间均值曲线。这表明间隔斜率的累积概率大于间隔的意思是当MSE的价值低于某个阈值。例如,IBM间隔斜率的累积概率大于区间均值曲线时,均方误差值小于100。这意味着88%的使用间隔斜率均方误差值低于100年,只有52%的均方误差值使用间隔意味着低于100。
很明显,间隔斜率的性能比MMSE-BC和SVR方法表示的意思。这样,间隔斜率可以显示更复杂的动态,如变化趋势。相比之下,意味着可以消除动态股票价格的波动。
作为预测结果的一个例子,图6显示了IBM股票价格趋势预测,= 3440 - 3972,由SVR基于区间斜率,SVR的内核是一个径向基函数。
同时意味着股票价格在未来的时间间隔和平均股价连续未来时间间隔可以准确预测。这表明长期股票价格的预测可以精确地执行产生累积误差。平均股票价格在连续时间间隔可以表达未来的趋势,如大幅下挫,轻微下降,脑震荡,轻微的增加,大幅增加,其次是增加,并增加了瀑布。根据开盘价格变动的预测在长期期间,基金分配模型和交易策略可以开发。
4所示。结论和未来的工作
摘要ESP,不产生累积误差,介绍了和用于预测波动在长期不同股票的价格。股票价格的新功能的使用证据子区间,区间斜率,提出了描述股票价格波动时期。它可以得出的结论是,间隔的斜率可以捕获复杂的动力学,如股票价格的变化趋势。
这种趋势预测的方法的前提是,未来市场将逐渐改变而不是突然。股票价格变化的复杂性可以大大增加预测的难度。未来的工作应该评估不同的学习方法,甚至结合不同的学习方法。一些新的评价方法应该被用来评估间隔斜率,经典的均值方法,和回报率。
利益冲突
作者宣称没有利益冲突有关的出版。
确认
这部分工作由国家自然科学基金委批准号下61273002,高素质人才的引进和开发项目北京市机构没有。CIT&TCD201304025,北京市教育委员会重点科技项目中国没有。KZ201510011012。
引用
- r s -蔡金融时间序列的分析新泽西州霍博肯市约翰·威利& Sons,美国,2005年。
- g . Sermpinis c . Dunis j .法律和c . Stasinakis”预测和交易欧元/美元汇率与随机神经网络组合和时变杠杆,”决策支持系统,54卷,不。1,第329 - 316页,2012。视图:出版商的网站|谷歌学术搜索
- P.-C。Chang D.-D。王,C.-L。周”,小说发展的部分连接的神经网络模型的股票价格趋势预测,“专家系统与应用程序,39卷,不。1,第620 - 611页,2012。视图:出版商的网站|谷歌学术搜索
- 大肠北城,m .原田,t .美津浓,“贝叶斯网络在股票价格预测中的应用。”人工智能的研究,1卷,不。2、2012。视图:出版商的网站|谷歌学术搜索
- z Er-bo、m .欢和h . Zhan-Gang”运用遗传规划分析移动平均线和长期和中期趋势的股票价格,”计算机应用研究,27卷,不。6、2010。视图:谷歌学术搜索
- p . Meesad和r . i Rasel”,使用支持向量回归预测股票市场价格”第二届国际会议信息、电子和视觉(ICIEV 13),页1 - 6,IEEE,达卡,孟加拉国,2013年5月。视图:出版商的网站|谷歌学术搜索
- p . Dondio”,没有情绪分析股票市场预测:使用一个基于有所分类器和用户级分析,”学报》第46届夏威夷国际会议系统科学(HICSS 13)IEEE,页3137 - 3146年,Wailea,夏威夷,美国,2013年1月。视图:出版商的网站|谷歌学术搜索
- m . Hagenau m·豪泽Liebmann m, d·诺伊曼”同时阅读所有的消息:预测股价中期发展基于新闻势头,”学报》第46届夏威夷国际会议系统科学(HICSS 13)Wailea,页1279 - 1288年,夏威夷,美国,2013年1月。视图:出版商的网站|谷歌学术搜索
- D.-Y。徐,S.-L。杨,R.-P。刘:“嗯,GA, Elman网络负载预测云计算数据中心,“浙江大学学报:自然科学C,14卷,不。11日,第858 - 845页,2013年。视图:出版商的网站|谷歌学术搜索
- r . Bisoi p . k .破折号,“混合进化动态神经网络股市趋势分析和预测使用无味卡尔曼滤波,”应用软计算杂志卷。19日,41-56,2014页。视图:出版商的网站|谷歌学术搜索
- b . Bican和y Yaslan混合时间序列预测方法利用EMD和SVR,”学报第六届国际研讨会通信、控制和信号处理(ISCCSP 14),页566 - 569年,雅典,希腊,2014年5月。视图:出版商的网站|谷歌学术搜索
- 黄z >。害羞的,来说“基于事例的回归模型框架为长期时间序列预测,”《IEEE国际会议信息重用和集成(IRI的10)IEEE,页69 - 74年,拉斯维加斯,内华达州,美国,2010年8月。视图:出版商的网站|谷歌学术搜索
- j .风扇和y唐“EMD-SVR非平稳时间序列预测的方法,”学报》国际会议质量、可靠性风险,维护和安全工程(QR2MSE 13)IEEE,页1765 - 1770年,成都,中国,2013年7月。视图:出版商的网站|谷歌学术搜索
- t·弗莱彻和j . Shawe-Taylor“多个内核学习与费舍尔内核高频汇率预测,“计算经济学,42卷,不。2、217 - 240年,2013页。视图:出版商的网站|谷歌学术搜索
- 问:杨,c .彭y Yu et al .,“主机负载预测基于PSR和EA-GMDH云计算系统”学报》第三届云计算和绿色计算IEEE国际会议(公司治理文化的13),9 - 15页,IEEE,卡尔斯鲁厄,德国,2013年10月。视图:出版商的网站|谷歌学术搜索
- 美国迪、d .近藤和w·Cirne“谷歌hostload预测基于贝叶斯模型优化的特征组合,”杂志的并行和分布式计算,卷74,不。1,第1832 - 1820页,2014。视图:出版商的网站|谷歌学术搜索
版权
版权©2016 Chun-xue Nie,薛博金。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。