1。介绍作为一个最重要的全球经济力量的能源类型,原油对每个国家都有巨大的影响,每一个企业,甚至每一个人。因此,它是一个关键的任务州长,投资者和研究者准确预测原油价格。然而,现有的研究表明,原油价格受到很多因素的影响,如供给和需求、利率、汇率,投机活动,国际和政治事件、气候等等(
1,
2]gydF4y2Ba。因此,原油价格是不规则的运动。例如,从1998年12月11美元/桶,WTI原油价格逐渐达到145.31美元/桶的高点2008年7月,然后价格大幅下降至30.28美元/桶在接下来的五个月,因为次级抵押贷款危机。之后,价格攀升至2011年4月,超过113美元/桶,再一次,他们大幅跌至2016年2月26美元/桶。原油价格的运动在过去几十年已经表明,预测的任务是非常具有挑战性的,由于原油价格的高非线性和非平稳特征。
gydF4y2Ba许多学者致力于努力试图准确预测原油价格。使用最广泛的方法来预测原油价格大致可以分为两类:统计方法和人工智能(AI)的方法。最近,苗族等人探讨了影响原油价格的因素的基础上,至少绝对收缩和选择算子(套索)模型(
1]gydF4y2Ba。你们等人提出了一个方法整合棘轮效应的线性预测原油价格(
3]gydF4y2Ba。Morana提出半参数广义自回归条件异方差性(GARCH)模型来预测原油价格在不同的延迟时间,即使没有条件的历史平均原油价格(
4]gydF4y2Ba。nas发现使用动态模型平均(DMA)等经验证据比线性模型自回归(AR)模型及其变体
5]gydF4y2Ba。龚和林提出几个新的异构自回归(HAR)模型预测原油价格的好的和坏的不确定性(
6]gydF4y2Ba。温家宝与结构性突变等人也用HAR模型预测原油期货的波动(
7]gydF4y2Ba。
gydF4y2Ba尽管统计方法改善的准确性预测原油价格在某种程度上,线性的假设原油价格无法满足根据最近的研究,因此它限制了准确性。因此,提出了各种人工智能方法捕获的非线性和非平稳原油价格在过去几十年(
8- - - - - -- - - - - -- - - - - -- - - - - - - -- - - - - -- - - - - -- - - - - -- - - - - - -
11]gydF4y2Ba。Chiroma等人回顾了现有的研究与预测原油价格,发现人工智能方法吸引了前所未有的兴趣领域的学者原油价格预测(
8]gydF4y2Ba。王等人提出了一个人工智能系统框架,集成人工神经网络(ANN)和基于规则的专家系统与文本挖掘预测原油价格,和结果表明,该方法显著有效和实际可行的
9]gydF4y2Ba。Barunik Malinska使用神经网络预测原油期货价格的期限结构(
10]gydF4y2Ba。最近,陈等人研究了预测原油价格使用深度学习框架,发现随机漫步深度信念网(RW-DBN)模型优于长期短期记忆(LSTM)和随机漫步LSTM (RW-LSTM)模型的预测的准确性(
11]gydF4y2Ba。其他AI-methodologies,如遗传算法(
12),gydF4y2Ba压缩传感(
13),gydF4y2Ba最小二乘支持向量回归(LSSVR) [
14gydF4y2Ba集群,支持向量机(ClusterSVM) [
15),gydF4y2Ba也适用于预测原油价格。由于极端非线性和非平稳,很难达到令人满意的结果直接由原始时间序列预测。理想的方法是将原始时间序列预测的艰巨的任务分成几个子任务,和每个人都预测一个相对简单的子序列。然后所有子任务是积累的结果作为最终结果。基于这个想法,提出了一种分解和整体框架和广泛应用于时间序列的分析,诸如能源预测(
16,
17),gydF4y2Ba故障诊断
18- - - - - -- - - - - -- - - - - -- - - - - - - -- - - - - -- - - - - -- - - - - -- - - - - - -
20.(],b我osignal分析
21- - - - - -- - - - - -- - - - - -- - - - - - - -- - - - - -- - - - - -- - - - - -- - - - - - -
23]gydF4y2Ba。这个框架由三个阶段组成。在第一阶段,原始的时间序列分解成几个组件。典型的分解方法包括小波分解(WD),独立分量分析(ICA) [
24),gydF4y2Ba变分模态分解(VMD) [
25),gydF4y2Ba经验模态分解(EMD) [
2,
26)gydF4y2Ba及其扩展(合奏EMD (EEMD)) (
27,
28),gydF4y2Ba和补充EEMD (CEEMD) [
29日]gydF4y2Ba。在第二阶段,一些统计或基于ai方法分别应用于预测每个分解组件。从理论上讲,任何回归方法可以用来预测每个组件的结果。在最后阶段,所有组件的预测结果聚合为最终结果。最近,各种研究人员努力致力于预测原油价格后的框架”分解和合奏。“风扇等人提出了一个新颖的方法,集成了独立成分分析(ICA)和支持向量回归(SVR)预测原油价格,和实验结果验证了该方法的有效性(
24]gydF4y2Ba。玉等人使用EMD分解原油价格的序列分成几个固有模态函数(货币),然后使用了一个三层前馈神经网络(FNN)每个国际货币基金组织(IMF)预测模型。最后,作者使用了一个自适应线性神经网络(ALNN)结合所有货币的结果作为最终的预测输出(
2]gydF4y2Ba。玉等人也用EEMD和扩展极端学习机(EELM)预测原油价格,下面的框架分解和合奏。Thee米p我r我cal results demonstrated the effectiveness and efficiency of the proposed approach [
28]gydF4y2Ba。唐等人进一步提出了一种改进的方法整合CEEMD和EELM预测原油价格,和实验结果表明,该方法优于所有上市的基准(
29日]gydF4y2Ba。李等人用EEMD原始原油价格分解为几个组件,然后使用内核和稀疏贝叶斯学习nonkernel (SBL)来预测每个组件,分别是(
30.,
31日]gydF4y2Ba。
gydF4y2Ba从分解的角度来看,尽管EMD和EEMD能够改善的准确性预测原油价格,他们仍然遭受“混合模式”和重建信号,引入新的噪音。为了克服这些缺点,EEMD的延伸,所谓完整EEMD自适应噪声(CEEMDAN),提出了托雷斯et al。
32]gydF4y2Ba。之后,作者提出了一种改进的版本的CEEMDAN获得分解组件用更少的噪音和更多的物理意义
33]gydF4y2Ba。CEEMDAN成功地风速预测(
34),gydF4y2Ba电力负荷预测
35),gydF4y2Ba和故障诊断
36- - - - - -- - - - - -- - - - - -- - - - - - - -- - - - - -- - - - - -- - - - - -- - - - - - -
38]gydF4y2Ba。因此,CEEMDAN可能有潜力预测原油价格。正如上面指出的,任何回归方法可以用来预测每个分解组件。最近提出的机器学习算法,极端的梯度增加(XGBOOST),可用于分类和回归(
39]gydF4y2Ba。现有的研究表明XGBOOST在预测时间序列的优点
40- - - - - -- - - - - -- - - - - -- - - - - - - -- - - - - -- - - - - -- - - - - -- - - - - - -
42]gydF4y2Ba。
gydF4y2Ba可能分解和XGBOOST CEEMDAN的回归,在本文中,我们的目标是提出一个新颖的方法,集成了CEEMDAN XGBOOST,即CEEMDAN-XGBOOST,改善预测原油价格的准确性,在分解和整体框架。具体来说,我们首先分解原始原油价格系列与CEEMDAN几个组件。然后,对于每一个组件,XGBOOST应用于构建一个特定的模型预测组件。最后,每个组件的所有预测结果聚合为最终的预测结果。本文的主要贡献有三点:<我nl我ne- - - - - -formula>
(米米l:米o>
1米米l:米n><米米l:米o stretchy="false">
)米米l:米o>
我们提出一个新颖的方法,所谓CEEMDAN-XGBOOST预测原油价格,遵循“分解和合奏”框架;<我nl我ne- - - - - -formula>
(米米l:米o>
2米米l:米n><米米l:米o stretchy="false">
)米米l:米o>
广泛的实验是在publicly-accessed西德克萨斯中质原油(WTI)来证明该方法的有效性的几个评价指标;<我nl我ne- - - - - -formula>
(米米l:米o>
3米米l:米n><米米l:米o stretchy="false">
)米米l:米o>
我们进一步研究影响的几个参数设置建议的方法。
gydF4y2Ba本文的其余部分组织如下。部分
2gydF4y2Ba描述了CEEMDAN和XGBOOST。部分
3gydF4y2Ba制定该CEEMDAN-XGBOOST详细方法。实验结果和分析报告
4gydF4y2Ba。我们还讨论了参数设置的影响。最后,部分
5gydF4y2Ba本文总结道。
年代ec>
2。预赛<年代ec id="sec2.1">
2.1。EMD, EEMD CEEMDANE米D黄等人1998年提出的,它已经开发并应用于许多学科的科学与工程(
26]gydF4y2Ba。关键特性的EMD分解是一个非线性、非平稳的序列到固有模式函数(货币)的傅里叶级数的精神。与傅里叶级数,他们不是简单的正弦或余弦函数,函数,而是代表了原始数据的本地振荡频率的特征。这些货币基金需要满足两个条件:<我nl我ne- - - - - -formula>
(米米l:米o>
1米米l:米n><米米l:米o stretchy="false">
)米米l:米o>
局部极值的数量和零交叉的数量必须等于或最多,不同<我nl我ne- - - - - -formula>
(米米l:米o>
2米米l:米n><米米l:米o stretchy="false">
)米米l:米o>
“当地的曲线意味着“被定义为零。
gydF4y2Ba起初,EMD发现的上部和下部信封通过寻找局部极值计算的原始序列。之后,当地的最大值(最小值)是联系在一起的两个立方刺构造上(低)信封,分别。这些信封的意思是被认为是“当地的意思。“与此同时,曲线的“当地的意思是“被定义为第一个残渣,原始序列的区别和“当地的意思是“被定义为第一个国际货币基金组织(IMF)。EMD如图的插图
1gydF4y2Ba。