复杂性

在这一页上

文摘介绍相关的工作预赛结论数据可用性的利益冲突作者的贡献确认引用版权相关文章

特殊的问题

深入学习方法应用于复杂的大数据分析

把这个特殊的问题

研究文章|开放获取

体积2020年| 文章的ID6431712| https://doi.org/10.1155/2020/6431712

混合股票价格预测方法使用LSTM和合奏EMD

杨Yujun ,^1、2、3 杨Yimei ,^1、2 和肖Jianhua^1、2

学术编辑器: 程陆

收到了 2020年7月24日

修改后的 2020年9月13日

接受 2020年11月21日

发表 2020年12月04

文摘

股票市场是混乱的,复杂的,动态的金融市场。未来股票价格的预测是研究人员的关注和争议的研究问题。越来越多的研究人员提出的分析和预测方法。我们提出了一个混合的方法预测未来股价的使用LSTM和合奏EMD。我们用全面的EMD分解复杂的原始股票价格时间序列分成几个子序列平滑,定期和稳定比原始时间序列。然后,我们使用LSTM方法训练和预测每个子序列。最后,我们获得了最初的股票价格时间序列的预测价值,融合了几个子序列的预测价值。在实验中,我们选择了5个数据完全测试性能的方法。与其他四种预测方法的比较结果表明,预测值显示精度高。我们提出的混合预测方法是有效和准确的在未来的股票价格预测。 Hence, the hybrid prediction method has practical application and reference value.

1。介绍

根据中国证券登记结算公司的数据,截至2020年3月,有1.633亿个在中国证券投资者。股票价格预测是困难的对金融机构和私人投资者和有意义的任务。为了有效地降低投资风险,获得稳定的投资回报,许多学者提出了大量的预测模型(1- - - - - -9]。大数据应用技术的快速发展,特别是机器学习的应用和深度学习在金融领域,它有一个对投资者产生深远影响。研究方向包括低频和高频数据(10]。以前的研究主要分为两种方法:基本分析和技术分析11]。

一方面,在技术分析中,人们广泛使用数理统计技术来分析历史股票价格趋势和预测最近的股票价格。近年来,许多研究人员应用多种机器学习算法来分析和预测股票价格,如神经网络、多核学习(12),逐步回归分析(13),和深度学习14,15]。虽然很多算法在某些方面取得了良好的效果,有许多参数配置和数据选择的使用机器学习问题,这仍然是一个重要的研究领域。另一方面,在基本面分析16- - - - - -18),人们主要使用自然语言处理来分析公司的财经新闻和财务报表预测未来股价的趋势。

多空项内存(LSTM)是一个非常好的方法在处理时间序列。股票价格数据属于时间序列数据。因此,许多研究人员使用LSTM [19- - - - - -26)来分析和预测股票价格。许多研究分析了时间序列数据之间的相关性(27- - - - - -30.,结果表明,LSTM在时间序列数据的优势。在文献[31日),研究人员使用LSTM预测编码单元分割,和实验结果证明LSTM在效率方面的优势。时序数据趋势的研究也是一种新的时间序列数据预测,所以LSTM是一个自然的选择。

经验模态分解(EMD)技术通常应用的非平稳、非线性信号。EMD可以将非线性信号分解成多个固有模态函数(IMF)自适应。EMD可以有效地抑制连续噪声,如高斯噪声(32]。然而,EMD不能抑制间歇性噪音和混合噪声。集成经验模态分解(EEMD)技术可以解决noise-mode混合的问题33]。EEMD算法中,一群白噪声是第一个添加到原始信号,然后分解为多个国际货币基金组织(IMF)。相应的国际货币基金组织(IMF)集的平均值被认为是正确的结果。EEMD噪声在不同的国际货币基金组织(IMF)将原始信号组件(34),从而消除noise-mode混合现象。近年来,应用EEMD吸引了许多研究人员和学者的关注27,35- - - - - -44]。为了解决这个问题,噪音在实际应用干涉项检索困难,Zhang et al。35)提出了一个基于EEMD技术和EMD实现自动从光谱域low-coherence干涉干涉项检索。该算法使用EEMD技术使耦合强度的相对误差小于2%。为了解决这个问题,高斯噪声和非高斯噪声严重影响滚动轴承缺陷检测的传统方法,江et al。36)提出了一种新的滚动轴承检验方法,结合了双频谱分析和改进集成EMD。该方法使用集成经验模态分解技术在减少多重背景噪音性能优越,可以更有效地检测滚动轴承缺陷。解决问题的影响局部放电信号的真实性评价准确性的变压器绝缘性能,王et al。37)提出了一个方法来抑制白噪声在PD信号基于EMD的集成和高阶统计的结合。这种方法使用EEMD分解阈值并重建国际货币基金组织每个在每个组件抑制白噪声。为了解决这个问题,大多数现有的测量方法只关注数学价值观和受测量误差的影响,干扰和不确定性,魏等。38)提出了一种新的车辆时程比较安全分析的集成经验模态分解方法。这种方法使用EEMD分解的信号来反映整体变化趋势和不受高频干扰的影响。解决难题的风速预测,杨,杨39)提出了一个混合BRR-EEMD短期风速预测方法基于EMD和贝叶斯岭回归(BRR)。该混合方法使用贝叶斯回归方法和EEMD进行回归预测在每个子序列分解EEMD和获得良好的风速预测结果。为了找到潜在利润套利机会当股指期货合约的收益和股票指数期货合约继续偏离公平价格非理性和nonefficiently操作市场,太阳和盛40基于集成EMD)提出了一种时间序列分析方法。这种方法使用EEMD分析股指期货基础序列和从序列中提取单调下降趋势发现商机。改善问题,单一的复杂和非线性的股票价格预测方法不能取得良好的成果,Al-Hnaity和Abbod41)提出了一种基于集成经验模态分解的混合集成模型和反向传播神经网络来预测股票指数的收盘价。研究人员(41)提出了五个混合预测模型:合奏EMD-NN,合奏EMD-Bagging-NN,合奏EMD-Crossvalidation-NN,合奏EMD-CV-Bagging-NN,合奏EMD-NN。实验结果表明,整体的性能EMD-CV-Bagging-NN,合奏EMD-Crossvalidation-NN和合奏EMD-Bagging-NN模型基于合奏EMD合奏的所有成绩高于EMD-NN模型和明显高于单一神经网络模型。

典型的预测计划是基于时间序列数据的预测本身,不处理时间序列数据本身。它已成为一个挑战,如何结合现有的预测方法,提高预测效果通过分解时间序列数据。上面的方法使用EEMD分解时间序列数据来提高算法的性能。如何有效地分解复杂和非线性预测股票时间序列数据已经被许多研究者感到困惑。由于股票的不确定性和非线性时间序列,一个方法来预测股票价格的偏差通常是相对较大。上述混合法确实显著改善算法。因此,它可以大胆猜测混合方法通常可以得到更好的预测结果比单一的特定方法。此外,最初的复杂时间序列是EEMD方法分解成几个相对稳定的子序列的时间序列。通过有效地结合几个当前有效的预测方法,预测结果的相对稳定的子序列时间序列理论上更好。结合EEMD方法的特点的基础上,改进了经验模态分解方法和LSTM机器学习算法,提出了一种混合LSTM-EEMD股票指数价格预测的方法。

本文的其余部分组织如下。三个相关的术语如EMD EEMD,即提出了部分2,而第三节简要介绍了我们提出的流程图LSTM-EEMD方法和我们提出的混合LSTM-EEMD方法的结构。在第四节,我们将描述实验数据收集,实验数据预处理,建模处理。在第五节,我们描述我们提出混合LSTM-EEMD方法的实验结果和分析仿真实验的结果我们提出了预测混合LSTM-EEMD方法。最后,本文的结论和将来作品中描述的部分8。

多年来,金融领域的许多研究都集中在股票价格预测的问题。这些研究主要集中于三个重要的研究方向:(1)基于机器学习的方法;(2)基于时间序列分析方法;和(3)基于混合方法。下面,我们首先简要介绍相关的术语。然后,我们介绍了LSTM和EEMD相关研究。

2.1。股票价格预测

股票价格是一个高度动荡的时间序列。股票价格受到各种因素的影响,如国家政策,利率,汇率,行业新闻,通货膨胀,货币政策,临时事件,投资者情绪和人工干预。预测股票价格在表面上需要建立一个模型的股票价格与这些因素之间的关系。虽然这些因素会暂时改变股票价格,从本质上说,这些因素将反映在股票价格和股票价格的长期趋势不会改变。因此,股票价格可以通过历史数据预测简单。

本文认为,有许多研究使用单一分析方法来预测股票市场的趋势,但是结果并不好。需要考虑各种各样的因素或使用各种技术来建立一个混合模型来进一步探讨股票价格的预测。深入系统的研究需要回答下列问题:RQ1因素或组合因素最影响股票的趋势?RQ2什么样的分析技术组合是最适合股票趋势预测吗?RQ3我们需要使用深度学习方法来挖掘数据,以便更好地发现内部股票市场和影响因素之间的关系?RQ4是否可预测性分析模型取决于特定的股票公司的特点,如域、股东背景、和政策?RQ5在股市预测的背景下,我们开发了一些有效的预测方法吗?RQ6我们应该关注的具体性质的分析股票价格本身,而不是解决一般问题的关系。是否价格分析的影响因素可以更有效?

2.2。LSTM

多空项记忆神经网络通常被称为LSTM。提出了LSTM[的Hochreiter和。施密德胡贝尔表示271997年)。LSTM是一种特殊类型的递归神经网络(RNN)。RNN的最大的特点,改进和推广了亚历克斯的坟墓是长期依赖可以获得的数据信息。LSTM已广泛应用于许多领域,在许多问题取得了很大的成功。因为LSTM记得长期信息的数据,设计LSTM可以避免长期依赖的问题。目前,LSTM是一个非常受欢迎的时序预测模型。下面,我们首先介绍RNN网络,其次是LSTM神经网络。

3所示。预赛

3.1。递归神经网络

当我们处理问题事件的时间表,如语音识别、序列数据,机器翻译和自然语言处理,传统的神经网络是无能为力的。RNN特别提出来解决这些问题。因为文本的上下文之间的关系需要考虑在字(词)处理技术中,连续几天的天气状况和气象条件之间的关系,过去的日子时需要考虑预测天气。

RNN的连锁形式的重复神经网络模块。RNN的标准,这个重复的结构模块只有一个非常简单的结构,例如双曲正切层。递归神经网络的简单结构如图1。

RNN的设计意图是解决非线性问题的时间表。递归神经网络的内部连接的方法通常只提要的数据,但在双向递归神经网络,它允许向前和向后的方向来反馈数据。RNN已经设计了一个反馈机制,所以RNN可以很容易地更新前一步的重量或剩余价值。反馈机制的设计非常适合时间序列预测。RNN可以从历史数据中提取规则,然后用这些规则来预测时间序列。图1显示RNN的结构简单,人物2显示了展开图RNN的基本结构。左边的箭头标签展开图2递归神经网络的基本结构。右边的箭头标签图展开2是一个持续的三级扩张的递归神经网络的基本结构。一个输入数据x_t输入模块hRNN的。的y_t是一个模块的输出hRNN值的时间t。与其他神经网络一样,股票递归神经网络的每一层的所有参数,如W_hx,W_hh,W_本产品在图2。如图2两个输入参数,RNN股票W_hx和W_hh,和一个输出参数W_本产品。我们都知道,每一层的参数的数量一般多层神经网络是不同的。查看图2,我们认为递归神经网络的每一步的操作都是一样的。事实上,输出y_t和输入x_t是不同的。递归神经网络的参数的数量将会大大减少在训练。多级扩张后,变成了一个递归神经网络的多层神经网络。仔细观察图2,我们发现W_hh层之间h_t1和h_t是一样的W_hh层之间h_t和h_{t +1}在形式。的价值和意义,W_hh层之间h_{t -1}和h_t不同的是W_hh层之间h_t和h_{t +1}。同样的,W_hx和W_本产品有类似的情况。

尽管RNN的每一层神经网络输出和输入模块,一些层的输出和输入模块在特定的应用程序场景中可以省略。例如,在语言翻译中,我们只需要整体语言符号输出后语言符号输入和不需要知道每个语言符号是语言符号输出后输入。self-expanding RNN的主要特征,与多个隐藏层。

我们都知道,在网络训练,递归神经网络模型容易梯度消失。一旦模型的梯度完全消失,算法进入一个死循环,和网络训练不会结束,最终导致RNN瘫痪。因此,简单RNNs容易梯度消失问题,不适合长期的预测。

LSTM设计的目的是为了避免或减少问题的出现消失的梯度在处理长期通过简单RNN相关时间序列。基于简单RNN LSTM输出盖茨补充说,盖茨的输入,忘了盖茨。在图3,所有三个盖茨所取代σ,它可以有效地防止梯度被消除。因此,LSTM可以解决长期依赖问题。记忆的神经元设计的目的是为状态信息存储一些LSTM重要信息。此外,一般来说,每个门都有一个激活函数。这个函数执行非线性转换或交换数据。通常,忘记门f_t可以过滤一些状态信息。方程(1)- (6)fd6神经网络与LSTM如下所示。他们忘记门,输入门,逆的存储单元,存储单元,输出,和输出,分别为:

3.2。EMD

经验模态分解(EMD)黄等人提出的1998年(42)是一种广泛使用的自适应时频分析方法。经验模式分解是一种有效的分解时间序列数据的方法。由于时间序列数据的共同地方特色,EMD方法提取所需的数据从他们在应用领域,取得了很好的结果。因此,许多学者运用EMD方法在许多领域成功。EMD分解的先决条件是以下三个假设的存在(43]:

以下简要介绍了分解过程:(1)假设有一个信号年代(我)图中黑线4。信号的极值红色和蓝色圆点所示。表单上包装线穿过所有的蓝点,形成较低的包装线穿过所有的红点。(2)计算的平均值上下平均包装线形成紫红色线米(我)。这里定义的差异d(我), (3)判断的差异d(我)是一个国际货币基金组织根据国际货币基金组织(IMF)的判断规则。如果差异行d(我)符合国际货币基金组织(IMF)的判断规则,这种差异d(我)是我届国际货币基金组织f(我)。否则,这种差异d(我)被认为是信号年代(我),并重复以上两个步骤,直到d(我)符合国际货币基金组织(IMF)的判断规则。在这之后,国际货币基金组织被定义为 (4)计算并得到国际货币基金组织通过在哪里被认为是残余信号。(5)重复执行上面的四个步骤N次直到运行状态满足停止条件。获得N首先,会见

(1)下一个级别的信号必须包含以上两种极端值:一个是最小值,另一个是最大的价值(2)确定信号的时间尺度特征基于两个极端值的时差(3)如果数据只有一个转折点,没有极值,多次判断需要揭示了极值

最后,下列方程(11)表示原始信号的构成年代(我):

3.3。EEMD

一个经典的EMD分解复杂的振动信号时混合模式问题。为了解决上述问题,吴和黄44)在2009年提出了EEMD方法。EEMD方法是集成经验模态分解方法的简称。EEMD通常用于非平稳的信号分解。然而,EEMD方法明显不同于WT变换和FFT变换。这里,WT是小波变换和快速傅里叶变换FFT。不需要基函数,EEMD方法可以分解任何复杂的信号。同时,EEMD方法可以将任何信号分解成许多货币基金。在这里,国际货币基金组织的固有模态函数。IMF分解组件包含本地不同特性的信号。EEMD可以为多个稳定subdata分解非平稳的数据,然后使用希尔伯特变换时间谱,这具有重要的物理意义。 Comparative analysis with FFT and WT decomposition, the EEMD has the characteristics of intuitive, direct, posterior, and adaptive. The EEMD method has adaptive characteristics because of the local features of the time-series signal. The following briefly introduces the process of EEMD decomposing data.

假设EEMD将分解序列X。根据EEMD分解的步骤,n子序列分解后获得。这些n子序列包括n−1货币基金和一个剩余的子序列R_n。在这里,这些n−1货币基金n−1组件子序列C_我(我= 1,2,…,n−1)的原始序列X。这些n−1货币命名为国际货币基金组织(IMF)_我(我= 1,2,…,n−1)。剩下的子序列R_n有时叫剩余子序列。使用EEMD分解序列的详细步骤介绍如下:(1)假设有一个信号年代(我)图中黑线4。信号的极值红色和蓝色圆点所示。表单上包装线穿过所有的蓝点,形成较低的包装线穿过所有的红点。较低的包装线红线图所示4。和上包装线是蓝线在图4。(2)计算的平均值上下包装线的意思行米(我)紫红色线如图所示4。(3)国际货币基金组织(IMF)获得第一个组件₁信号的年代(我)。国际货币基金组织₁通过计算公式吗d(我)=年代(我)−米(我)。这个公式意味着原始信号的差异年代(我)-线米(我上下的包装线。(4)国际货币基金组织第一个组件₁d(我)作为一种新的信号年代(我)和重复执行上面的三个步骤,直到满足停止条件运行状态。以下将详细描述停止条件:(一)平均米(我)大约是0(b)信号线路的数量d(我)通过零分大于或等于极端点的数量(c)的迭代次数达到最大(5)将子序列d(我)作为我th IMF fi (我= 1,2,…n−1)。获得剩余R通过计算公式r(我)=年代(我)−d(我)。(6)把剩余的r(我)作为新的信号年代(我)计算(我+ 1)国际货币基金组织(IMF),和重复执行上面的五个步骤直到运行状态满足停止条件。以下将详细描述停止条件:(一)信号年代(我)已经完全分解并获得所有国际货币基金组织(IMF)(b)分解的数量水平达到最大

最后,下列方程(12原始序列的构成和表达nEEMD子序列分解: 的数量n的子序列取决于原始序列的复杂性。图5显示了罪时间序列由方程(13),国际货币基金组织图EEMD分解: 在哪里。

4所示。方法

我们的混合预测方法的原则LSTM-EEMD股票价格基于LSTM和EEMD本节详细介绍。这些理论形成的理论预测方法。下面首先介绍了流程图,基本结构,LSTM-EEMD混合指数预测方法的过程基于集成经验模态分解和多空项记忆神经网络。我们提出了混合LSTM-EEMD预测方法首先使用EEMD股指序列分解成几个简单稳定的子序列。然后,每个子序列的预测结果是LSTM预测的方法。最后,LSTM-EEMD得到最终的预测结果的原始股票指数序列融合所有LSTM几个股指子序列的预测结果。

图6显示了LSTM-EEMD方法的结构和过程。LSTM-EEMD预测方法的基本结构和过程包括三个模块。EEMD分解模块三个模块,LSTM预测模块,并融合模块。我们建议LSTM-EEMD预测方法包括三个阶段,八个步骤。图7显示我们提出的方法的三个阶段,八个步骤。的三个阶段提出了混合LSTM-EEMD预测方法是输入数据,模型预测和评估模型。模型评价阶段和数据输入阶段每个包括4步,和模型预测阶段包括3个步骤。混合LSTM-EEMD预测方法详细介绍如下:(1)仿真数据生成。和现实世界股指时间序列数据收集。然后,原股指时间序列数据预处理使股指时间序列的数据格式满足格式要求EEMD的分解。最后,输入数据XLSTM-EEMD混合预测方法的形成。(2)输入数据X分解为几个EEMD序列的方法。如果n子序列了,然后有一个剩余子序列R_n和n−1子序列。这些n子序列表示为R_n,国际货币基金组织₁,国际货币基金组织₂,国际货币基金组织₃…,国际货币基金组织_n−1,分别。(3)任何子序列的预测过程不受其他子序列的预测过程的影响。LSTM模型建立和训练有素的每个子序列。因此,我们需要建立和培训nLSTM为n独立的子序列。这些n独立LSTM模型LSTM命名_k(k= 1,2,…n−1n),分别。我们使用nLSTM模型来预测n独立的子序列,n股指时间序列的预测价值。这些n名叫SubP预报值_k(k= 1,2,…n−1n),分别。(4)融合函数混合法的核心。目前,有很多融合功能,比如sum,加权和加权产品等等。这些融合函数的功能是将一些结果为最终结果。本文提出的混合股票预测方法选择的加权和作为融合功能。所有子序列的加权结果累积形成原始股票指数数据的最终预测结果。这里的重量可以根据实际应用预设。在本文中,我们使用同样重量的每个子序列,每个子序列的重量是1。(5)最后,我们比较预测值与实际值的股指时间序列数据序列,计算的RMSE值,美,R²。我们使用三个评估标准的RMSE,美R²评估LSTM-EEMD混合预测方法。根据这些评估值,可以判断方法的利弊。

图7显示了预测提出LSTM-EEMD方法的进步和数据流程图。在图的预测进展7可以介绍3个阶段。三个阶段的输入数据,模型预测和评估模型。输入数据的阶段分为四步。四个步骤是收集数据,预处理数据,由EEMD分解数据,并生成n序列。有nLSTM模型阶段的模型预测。LSTM模型的输入数据n序列产生在前一阶段。这些LSTM模型分别预测n序列获取n预测的结果。评估模型的阶段也分为4个步骤。第一步是保险丝n预计值和权重。在本文中,我们选择加权融合函数。加权融合函数总结n预测与一定的权重值。的输出结果加权加法融合函数是股指时间序列数据的预测结果。最后,我们需要计算的价值R²、美和RMSE的预测结果在评估该混合预测模型。的质量提出了混合预测模型可以直接评估的价值R²、美和RMSE。

5。实验数据

本文的实验数据在我们的研究中详细介绍了这部分。我们选择两种类型的实验数据来测试本文为了更好地评价这种方法的预测效果。第一种实验数据是人为模拟数据由计算机自动生成。我们的方法的正确性和有效性进行了验证,这些人为的模拟数据。第二种类型的实验数据是真实的股指数据。只有社会的实际数据可以测试质量的方法。模型通过社会实际测试数据是最基本的要求,我们提出的方法应用到一些现实世界的领域。

5.1。人工模拟实验数据

我们使用人工模拟实验数据来验证我们方法的有效性和正确性。得到有效和精确的实验结果,人工生成的仿真实验数据应该足够长的时间。因此,在实验中,我们选择人工模拟实验数据的长度是10000。人工模拟实验数据是由计算机根据赎罪的函数公式(13)。

5.2。真实的实验数据

为了实证研究提出了预测方法的效果,我们收集的股指数据真实的股票从雅虎财经领域作为实验数据。获得更客观的实验结果,我们选择4股指来自不同国家或地区。这些股票指数都是非常重要的在世界金融领域股票指数。

这四个股票指数在这个实验中澳交所,DAX指数、恒生指数和成份公司。成份公司用作标准普尔500的缩写。是一个美国股票市场指数的成份公司。这个指数是一个综合的股指在纳斯达克和纽约证券交易所上市的500家公司。恒生指数是香港恒生指数的简称。恒生指数是一个重要的股票指数在中国香港。德国DAX指数作为缩写的德国Aktienindex在德国在欧洲。DAX股指在法兰克福证券交易所编制的。达克斯公司由30大型德国公司,所以这是一个蓝筹股市场指数。澳交所作为澳大利亚证券交易所的缩写,是一个股票指数编制的澳大利亚。

每一个股票指数的数据集包括每天五个属性。这五个属性是交易量,最高价格,最低价格,收盘价,开盘价。每个股票指数的数据时间间隔从股票的开幕日期是5月18日,2020年。

5.3。数据预处理

为了获得良好的实验结果,我们尽力处理实验数据中的所有错误的或不正确的数据。当然,更多的实验数据也获得良好的实验结果的一个重要条件。不正确的数据主要包括记录与零交易量和记录两个完全相同的数据和连续多天。从原始数据删除错误的或不正确的噪声数据后,我们将展示收盘价格的趋势图的四个主要股指8。

在实验中,我们通常首先规范实验数据。让X_我= {x_我(t)}是我股票时间序列指数在时间t,在那里t= 1、2、3、…T和我= 1、2、3、…N。我们定义每日返回对数公式所示G_我(t)=日志(x_我(t)−日志(x_我(t−1))。我们定义每日返回标准化公式所示 ,在哪里每日返回对数的平均值吗G_我(t),δ的标准偏差是日常对数回归G_我(t): 在哪里。

6。其他方法的实验结果

为了比较其他预测方法的性能,我们相对其他三种预测方法的结果进行了研究和分析在实验相同的数据。表1显示了五个预测方法的实验结果。自从LSTM上面介绍,这里将不会重复。首先,SVR、BARDR KNR简要介绍。然后,这三种方法的实验结果进行了详细分析。

6.1。SVR

SVR用作支持向量回归的缩写。SVR是广泛使用的回归方法。指的是手动的libsvm工具箱、损失和罚函数控制机器学习的训练过程。的libsvm工具箱是支持向量机工具箱软件,这个工具箱主要用于支持向量机模式识别和回归软件包。在实验中,SVR使用一个线性内核,实现liblinear而不是libsvm。SVR应该扩展到大量的样本。SVR可以选择各种各样的惩罚函数或损失函数。SVR有10个参数,这些参数的设置如表所示2。

6.2。BARDR

BARDR是贝叶斯ARD回归用于健康体重的回归模型。该方法假设回归模型的重量符合高斯分布。为了更好的符合回归模型的权重,BARDR使用ARD之前技术。我们假设回归模型权重的分布符合高斯分布。BARDR参数α和参数λ的噪声分布的精度和精度的权重分布,分别。BARDR有12个参数。表3显示了这些参数的设置。

6.3。KNR

KNR用作的缩写K最近的邻居回归。的K最近的邻居回归模型也是一个无参数模型。的K最近的邻居回归只使用目标的价值K最近的训练样本做出决定回归价值的样本进行测试。即预测回归价值基于样本的相似性。表4显示了KNR 8参数,这些参数的设置。

其他四种方法的实验结果,我们提出两种方法五罪的序列,成份公司,恒生指数,DAX指数,ASX如表所示1。在实验中,我们五个序列预处理的方法。表5显示了实验数据的长度。表1显示的实验值R²(R方)、美(平均绝对误差),和RMSE(均方根误差)。根据真正的结果和预测结果,我们试着让小美实验值,RMSE,R²。小美或RMSE的结果,更好的实验值的方法。然而,更大的结果R²是,预测方法的效果就越好。

相比之下,我们以粗体显示每个序列的前两个结果,如表所示1。在上述四种传统方法(SVR, BARDR KNR, LSTM)预测罪人工序列数据,BARDR和LSTM被发现是最好的方法。当预测成份公司、铸铁和DAX真正的时间序列数据,BARDR法和LSTM法有最好的结果。然而,BARDR方法和SVR方法最好的结果,预测ASX真正的时间序列数据。因此,在上述四种传统方法中,BARDR方法和LSTM五个序列数据的方法是最好的方法。

仔细观察表1,我们发现剩下的五个方法,除了KNR,都有很好的预测对罪序列的影响。的R²评价指标的SVR、BARDR LSTM LSTM-EMD和LSTM-EEMD方法都大于0.96。BARDR、LSTM LSTM-EMD有最好的预测效果,和他们的R²评价指标都大于0.99。其中,BARDR的预测效果最好,其R²评估值大于0.9999。这些值表明,该方法具有更好的预测效果时间序列的变化规律和稳定,尤其是BARDR方法。这里,选择六个方法之一的结果显示在图预测的影响9。使生成的地图明确和清晰,图的结果图9只显示最后一个90年的预测结果。

观察SVR实验结果表1,我们发现这种方法的预测价值达克斯,澳交所,罪是优于成份公司和恒生指数时间序列数据。图10显示了ASX SVR的预测结果,这对澳交所股票数据有更好的预测效果。因为罪的变化序列具有良好的规律性和稳定性,SVR方法更适合预测序列具有良好的规律性和稳定性。可以推测的是DAX指数和ASX时间序列数据具有良好的规律性和稳定性。然而,SVR方法预测成份公司和恒生指数序列数据。预测效果很差。这表明成份公司和恒生指数序列数据变化的规律性和稳定性差。

观察实验结果KNR的表1,我们发现这种方法有相似的性能SVR方法。预测结果DAX指数、澳交所和罪恶序列比成份公司和HSI序列。特别是对于股票成份公司和恒生指数序列,预测效果差。股票时间序列是极大地影响人们的活动,所以股票序列的变化是复杂的,不规则的,不稳定的。可以推断,KNR不适合预测股票序列,所以KNR不适合预测序列的预测不稳定和不规则变化。

在表1,观察实验结果的BARDR LSTM,我们发现BARDR和LSTM方法的性能相对较好。这两种方法不仅有更好的预测影响DAX指数,澳交所,罪也有更重要的预测时间序列数据对成份公司和恒生指数序列的影响。特别是,股票成份公司和恒生指数序列的预测价值比KNR和SVR方法。股票序列数据的变化是不规则的,复杂的,和不稳定的,但是预测的影响BARDR和LSTM仍然非常好。可以得出结论,BARDR和LSTM方法可以预测股票时间序列,因此,BARDR和LSTM更适合预测序列的预测不稳定和不规则变化。图11显示的BARDR DAX指数时间序列数据的预测结果,具有更好的预测效果DAX股票时间序列数据。

在表1,观察实验结果的BARDR LSTM,我们发现这两种方法具有良好的预测效果提供的五个不同的时间序列数据的实验。通过比较他们的实验结果,很容易发现BARDR的性能比LSTM方法。除了LSTM有点比BARDR时间序列预测效果,在成份公司的BARDR LSTM比其他四个时间序列预测效果。虽然BARDR比LSTM在预测性能,BARDR方法多次超过LSTM方法在实验时间。此外,尽管在我们的实验中,预测的值LSTM比BARDR方法,实验时间短和训练参数使用仍然很少。在未来的工作中,我们可能会提高性能提出的方法通过增加神经元的数量和培训LSTM方法的迭代的数量。原理分析的基础上,我们认为的预测效果LSTM将超过BARDR的方法通过合理增加神经元的数量和训练的迭代的数量。

7所示。实验

我们选择两种类型的实验数据来测试本文为了更好地评价这种方法的预测效果。第一种实验数据是人为模拟数据由计算机自动生成。第二种类型的实验数据是真实的股指数据。模型通过社会实际测试数据是最基本的要求,我们提出的方法应用到一些现实世界的领域。本节进行详细研究和分析两方面的实验结果。

7.1。分析基于人工仿真数据的实验结果

我们使用人工模拟实验数据来验证我们方法的有效性和正确性。得到有效和精确的实验结果,人工生成的仿真实验数据应该足够长的时间。因此,在实验中,我们选择人工模拟实验数据的长度是10000,如表所示5。

分析真实世界股票指数的实验结果数据之前,我们首先使用该LSTM-EMD罪和LSTM-EEMD方法预测模拟序列。仿真实验可以验证提出的两种方法的有效性和正确性。

观察犯罪数据列的表1的三个指标,我们发现LSTM方法,LSTM-EMD方法,LSTM-EEMD方法基本上是相当于在相同数量的神经元和迭代。三个结果表明,这三种方法预测效果类似于罪仿真时间序列数据。其中,LSTM-EMD方法的预测效果最好,表明我们提出的方法是有效的,可以提高预测效果的实验。观察犯罪数据列在表中1的实验结果,我们发现比LSTM-EEMD LSTM稍有好转,但差距非常小,几乎可以忽略。经过深入分析,这是罪时间序列数据本身很正常。通过添加噪声数据,然后使用EEMD分解,subtime级数分解的数量变得越来越复杂,因此,预测效果稍差。总之,两本文提出的预测方法和LSTM-EEMD LSTM-EMD有更好的综合效果比原来LSTM方法,表明提出的两个预测方法是正确和有效的。

7.2。分析基于真实数据的实验结果

为了验证提出的实用性LSTM-EMD和LSTM-EEMD预测方法,我们使用两种方法提出了预测四个现实世界股指时间序列在金融市场。澳交所,四个时间序列是DAX指数成份公司,恒生指数。股指时间序列产生在人类社会中,反映社会现象。股指时间序列的金融市场严重受到人为因素的影响,所以它是复杂和不稳定。这四种时间序列非常代表。他们来自四个不同的国家或地区,可以更好地反映了世界上不同国家的金融市场的变化。

通过比较这三个评价指标的RMSE,美,R²的LSTM、LSTM-EMD LSTM-EEMD预测方法在表1,我们发现LSTM-EEMD预测方法的预测结果的四个序列数据比LSTM-EMD预测方法。实验结果表明,LSTM-EEMD预测方法比LSTM-EMD预测方法。图12显示的预测结果LSTM-EMD方法和LSTM-EEMD恒生指数时间序列的方法。

(一)

(b)

通过观察表1,很容易发现的结果提出LSTM-EMD和LSTM-EEMD方法在HSI的三个序列,DAX指数和ASX比传统LSTM方法。我们认为有两个主要原因获得这么好的实验结果。一方面,本文提出的方法分解溪,DAX指数,和ASX系列通过EMD或EEMD这样复杂的原始溪,DAX指数和ASX时间序列分解为多个更正常和稳定subtime系列。多个subtime系列更容易比复杂的原始时间序列预测。因此,多个subtime系列更准确的预测结果比直接预测复杂的原始时间序列的预测结果。另一方面,尽管恒生指数的变化,DAX指数,和ASX系列是复杂的,他们可以分解为更多的固定和稳定的时间序列。为了清楚地了解恒生指数的变化,DAX指数,和ASX系列和EMD EEMD分解,数据13和14显示所有EMD变化或EEMD DAX指数时间序列分解,分别。图8是原始DAX指数时间序列的变化,和所有子图的数据吗13和14EMD或EEMD DAX指数时间序列的分解子图。很容易看到,降低EMD或EEMD分解子图是温和的,更规范、更稳定、更可预测,和有更好的预测效果。

仔细观察的数据LSTM方法,LSTM-EMD方法,LSTM-EEMD方法表1三个序列的HSI、DAX指数和澳交所。它可以发现提出LSTM-EEMD方法有更好的实验效果比该LSTM-EMD方法,提出LSTM-EMD方法有更好的实验效果比传统的LSTM方法。这三个指标RMSE、美和R²实验中使用的所有例证上述关系。RMSE越小或美实验值的方法,该方法的预测效果越好。然而,越大R²价值的一种方法,其预测效果越好。

在本文中,我们提出了一个基于EMD或EEMD混合预测方法。实验结果表明,该融合预测结果更优于传统方法直接预测复杂的原始时间序列在大多数情况下。虽然在本文实验比较研究两种混合方法基于EMD或EEMD和其他四个经典方法,如SVR, BARDR KNR, LSTM。两种混合方法基于EMD和EEMD在不同的时间序列有不同的影响,有不同的时间序列方法,反映了不同实验的优点和缺点。在实际应用中,人们可以根据实际情况选择不同的方法应用到具体的实践领域。在实际环境中,如果获得的结果的方法你选择不符合你的期望,你可以选择另一种方法。

8。结论和未来的工作

我们提出了一个混合的短期预测方法LSTM-EMD或基于LSTM LSTM-EEMD和EMD EEMD分解方法。该方法是基于一个复杂的问题划分和征服战略。EMD的优点相结合,EEMD LSTM,我们使用EMD或EEMD方法将复杂的序列分解为多个相对稳定和温和的子序列。使用LSTM神经网络训练和预测每个subtime系列。预测过程很简单,只需要两步才能完成。首先,我们使用LSTM预测每个subtime系列值。然后,多个subtime系列的预测结果融合,形成一个复杂的原始时间序列的预测结果。在实验中,我们选择了5个数据为测试完全的表现方法。与其他四种预测方法的比较结果表明,预测值显示精度高。我们提出的混合预测方法是有效和准确的在未来的股票价格预测。 Hence, the hybrid prediction method has practical application and reference value. However, there are some shortcomings. The proposed method has some unexpected effects on the experimental results of time series with very orderly changes.

分析和预测方法的研究和应用时间序列有很长的历史和快速发展,但传统方法的预测效果不符合特定要求的实际应用在某些领域的某些方面。提高预测效果最直接的研究目标。以本文的研究结果为起点,未来我们还有大量的工作需要进一步研究。在未来,我们将结合EMD方法或EEMD方法与其他方法,或使用LSTM方法结合小波或VMD。

数据可用性

可用的数据是完全没有限制。原始实验数据可以从雅虎财经(免费下载http://finance.yahoo.com)。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

杨Yujun导致这项工作的所有方面。杨Yimei和肖Jianhua进行实验和分析数据。所有作者回顾了手稿。

确认

这项工作的部分支持由湖南省教育科学研究基金资助下17 c1266 19 c1472,怀化大学重点科研项目在格兰特HHUY2019-08武陵山健康重点实验室的大数据智能处理和应用程序在湖南大学,和智能控制技术重点实验室的武陵山格兰特ZNKZ2018-5下湖南省生态农业。资金来源没有作用,研究设计,数据收集、分析或解释,或者写的手稿。

引用

e . Hadavandi h . Shavandi, A . Ghanbari”股票价格预测的遗传模糊专家系统”学报2010年第七次国际会议上模糊系统和知识发现,页41-44、烟台,中国,2010年8月。
视图: 出版商的网站 | 谷歌学术搜索
c .郑和j·朱”,研究股票价格预测基于灰色关联分析和ARMAX模型,”《2017年国际会议上灰色系统和智能服务(GSIS),页145 - 148,斯德哥尔摩,瑞典,2017年8月。
视图: 出版商的网站 | 谷歌学术搜索
a Kulaglic比比Ustundağ,“股票价格预测在多个时间窗口使用小波变换和神经网络,”学报》2018年第3计算机科学与工程国际会议(UBMK)萨拉热窝,页518 - 521年,波斯尼亚,2018年9月。
视图: 出版商的网站 | 谷歌学术搜索
g . Xi”小说股票价格预测方法利用动态神经网络,”《2018年国际会议上机器人与智能系统(珊瑚礁动议)长沙,页242 - 245年,中国,2018年2月。
视图: 出版商的网站 | 谷歌学术搜索
y, s . Wang和l .张“股票价格预测基于BP神经网络模型的网络舆论”学报2017年的第二次国际会议上图像,视觉和计算(ICIVC)成都,页1058 - 1062年,中国,2017年6月。
视图: 出版商的网站 | 谷歌学术搜索
js。周和T.-K。阮:“向前预测股票价格使用滑动窗口metaheuristic-optimized机器学习回归,”IEEE工业信息,14卷,不。7,3132 - 3142年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
郭y,汉族,c .沈x, y . Li和y呗,“高频股票价格预测的自适应SVR。”IEEE访问》第六卷,第11404 - 11397页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
r . j . Lee金、y Koh和j .康”全球股市预测基于股票图表图像,采用深Q-network”IEEE访问7卷,第167277 - 167260页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
j·张,中州。邵,L.-W。黄et al .,“汇率可以用来预测上证综合指数?”IEEE访问,8卷,第2199 - 2188页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
郭y,汉族,c .沈x, y . Li和y呗,“高频股票价格预测的自适应SVR。”IEEE访问》第六卷,第11404 - 11397页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
d .留置权明,a . Sadeghi-Niaraki h . d . Huy k . Min和h的月亮,“深度学习方法短期股票趋势预测基于二束封闭的复发性单元网络,”IEEE访问》第六卷,第55404 - 55392页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
即哈桑,“利用股市预测噪声数据归一化”,工程和应用科学杂志》上,12卷,不。1,第77 - 69页,2017。
视图: 谷歌学术搜索
全,b .香港,常诉”模式图tracking-based股票价格预测使用大数据,”未来一代计算机系统卷,80年,第187 - 171页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
e .庄、c·汉和f . c .公园,“深度学习网络股票市场分析和预测:方法论、数据表示,和案例研究,“专家系统与应用程序卷,83年,第205 - 187页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
张x, y, t·刘,j .段”使用结构化事件预测股票价格运动:一个实证调查,”《EMNLP卡塔尔多哈,页1 - 11,2014年10月。
视图: 谷歌学术搜索
m .党和d Duong改善股票市场预测方法使用金融新闻文章,”2016第三国家科学技术发展基金会会议信息和计算机科学城市岘港,页125 - 129年,越南,2016年9月。
视图: 谷歌学术搜索
b·翁·m·a·艾哈迈德,f . m . Megahed“股市单日领先运动预测使用不同的数据源,”专家系统与应用程序卷,79年,第163 - 153页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
y Yujun、l .建平和y Yimei,”一个高效的基于大订单的股票推荐模型净流入,”数学问题在工程卷,2016篇文章ID 5725143, 15页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
s . o . Ojo p . a . Owolawi m . Mphahlele和j·a . Adisa”股票市场行为预测使用堆叠LSTM网络,”《2019年国际多学科信息技术和工程会议(IMITEC)Vanderbijlpark,页1 - 5,南非,2019年11月。
视图: 出版商的网站 | 谷歌学术搜索
g . s . Liu廖,y叮,“股票交易预测建模和分析基于LSTM,”学报2018年IEEE会议13日工业电子设备和应用程序(ICIEA)武汉,页2787 - 2790年,中国,2018年5月。
视图: 出版商的网站 | 谷歌学术搜索
d,“基于LSTM神经网络预测股票价格,”学报2019年国际会议上人工智能和先进制造业(AIAM),页544 - 547,都柏林,爱尔兰,2019年10月。
视图: 出版商的网站 | 谷歌学术搜索
周k . Chen y, f·戴“LSTM-based方法股票收益预测:一个案例研究中国股票市场”学报2015年IEEE国际会议上大数据(大数据)圣克拉拉,页2823 - 2824年,CA,美国,2015年11月。
视图: 出版商的网站 | 谷歌学术搜索
y, y,“混合方法基于EEMD短期时间序列预测,“IEEE访问,8卷,第61928 - 61915页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
a·h·布哈里m . a . z . Raja m . Sulaiman美国伊斯兰教,m . Shoaib和p . Kumam”部分neuro-sequential ARFIMA-LSTM金融市场预测,“IEEE访问,8卷,p。71326年,2020年。
视图: 出版商的网站 | 谷歌学术搜索
刘马,l .高,x, j .林“深度学习的轨道质量评价高速铁路车身振动预测的基础上,“IEEE访问7卷,第185107 - 185099页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
Nie x y,太阳,x, y,和l .刘”一个增强LSTM时间序列的趋势后,“IEEE访问7卷,第34030 - 34020页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
,的Hochreiter和j。施密德胡贝尔表示“长短期mfemory。”神经计算,9卷,不。8,1735 - 1780年,1997页。
视图: 出版商的网站 | 谷歌学术搜索
j . y . Yang Li,杨y”的互相关分析的多属性基于MM-DFA股市,”自然史答:统计力学及其应用卷。481年,23-33,2017页。
视图: 出版商的网站 | 谷歌学术搜索
y Yujun、l .建平和y Yimei,“多尺度多重分形multiproperty金融时间序列的分析基于Renyi熵,”国际现代物理学杂志》上,28卷,不。2、2017。
视图: 出版商的网站 | 谷歌学术搜索
f . a,的蒙古包和j。施密德胡贝尔表示“网时间和计数,复发”诉讼IEEE-INNS-ENNS国际联合会议上的神经网络。IJCNN 2000,3卷,第194 - 189页,科莫,意大利,2000年7月。
视图: 谷歌学术搜索
徐m . y, z . Wang,乔,”一个LSTM方法预测铜分裂在h . 264 HEVC代码转换,”《IEEE视觉通讯和图像处理(VCIP),1 - 4页,2017年12月美国佛罗里达州圣彼得堡。
视图: 谷歌学术搜索
c . Zhang w . Ren, t .μ,l .傅和c·贾”基于经验模态分解的背景去除和去噪在偏振干涉成像光谱仪,”光学表达,21卷,不。3、2592 - 2605年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
x周、h·赵和t .江“自适应光学分析边缘模式使用集成经验模态分解算法,”光学信,34卷,不。13日,2033 - 2035年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
黄n . e . j . r .叶和j·s . Shieh”集成经验模态分解:noise-assisted数据分析方法,”先进的自适应数据分析,1卷,不。1,1-41,2009页。
视图: 谷歌学术搜索
d·h·张,f . Wang, t . Liu, y,“自动干涉项检索从光谱域使用EEMD-EMD-based low-coherence干涉方法,”IEEE光子学》杂志,8卷,不。第三条ID 6900709 - 2016页。
视图: 出版商的网站 | 谷歌学术搜索
张x, y江,c . Tang w .娇黄和t . g . Li”小说滚动轴承缺陷检测方法基于双频谱分析和云model-improved EEMD,”IEEE访问,8卷,第24333 - 24323页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
m . w . w . Wang Peng田,w·道,“基于EEMD局部放电的白噪声抑制方法和高阶统计,“《华尔街日报》的工程,卷2017,不。13日,2043 - 2047年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
z, k . g . Robbersmyr和h r . Karimi)“EEMD辅助比较的时间历史及其应用在车辆安全,”IEEE访问5卷,第528 - 519页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
y, y,“混合对风速预测方法相结合的集成经验模态分解和贝叶斯岭回归,”IEEE访问,8卷,第71218 - 71206页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
j .太阳和h .盛”应用程序集成经验模态分解的分析,股指期货基础”学报》2010年第2 IEEE国际会议信息和金融工程重庆,页396 - 399年,中国,2010年9月。
视图: 谷歌学术搜索
b . Al-Hnaity和m . Abbod”,一种新颖的混合整体模型来预测FTSE100指数结合神经网络和EEMD”学报2015年欧洲控制会议(ECC)林茨,页3021 - 3028年,奥地利,2015年7月。
视图: 谷歌学术搜索
n . e .黄z沈,s . r .长et al .,“经验模态分解和希尔伯特谱对非线性和非平稳时间序列分析,“英国伦敦皇家学会学报》上。系列一:数学、物理和工程科学,卷454,不。1971年,第995 - 903页,1998年。
视图: 出版商的网站 | 谷歌学术搜索
f .江、朱z和w·李,“一种改进VMD与经验模态分解及其应用在滚动轴承早期故障检测,”IEEE访问》第六卷,第44493 - 44483页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
z h .吴邦国委员长和n . e .黄”集成经验模态分解:noise-assisted数据分析方法,”先进的自适应数据分析,1卷,不。1、1 - 14,2009页。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

4637年

下载

1945年

引用

复杂性