文摘
提出了一种预测方法,探讨不同的稀疏结构的一组向量自回归(VAR)模型使用Ivanov-based至少绝对收缩和选择操作符(套索)框架。变体辅助问题原理方法用于解决各种Ivanov-based LASSO-VAR变异,由并行计算支持简单的封闭迭代和线性收敛速度。一个测试用例与十原油现货价格是用于演示的改善预测技巧从探索中获得稀疏结构。该方法优于传统的向量自回归模型。
1。介绍
原油,作为全球最大的大宗商品交易和最宝贵的能源资源,在全球经济中起着至关重要的作用。众所周知,其广泛的价格波动,对经济有直接的影响。石油价格的上涨可能会导致通货膨胀,最终影响经济的石油进口国,而石油价格的下跌可能导致经济衰退和石油出口国的经济政治不稳定。此外,即使是一个小小的石油价格的波动会导致重大的经济损失和社会后果。能源危机和石油价格的不断波动引起了极大关注的研究(1- - - - - -3]。原油是一种全球影响力的大宗商品,因为它是一次能源的主要来源。原油价格反映市场预期未来宏观经济变量。在当今动荡的世界中,一些冲击,COVID-19流行和乌克兰等战争,也对世界经济产生级联效应。在这种环境下,即使是谣言的原油减产可能导致一个重要的石油涨价。原油预测,提出了许多文学一样,已成为一个重要话题方面的理论和实际意义4- - - - - -6]。然而,预测原油价格是一个非常艰难的在预测文献和具有挑战性的任务。一方面,原油价格从根本上是由供给和需求决定的(7]。另一方面,与其他商品不同,原油价格是由外生因素,如极端事件,全球经济条件下,投机预期,政治不稳定,以及技术趋势(8- - - - - -11]。因为上述因素,预测原油价格是最重要的但具有挑战性的任务之一,吸引了大量的预测文学的关注。
根据现有文献,提出了不同类型的预测方法来预测原油价格。通过使用参数评价方法,现有的方法可以分为三组:(1)传统的统计,和计量经济学模型,(2)人工智能(AI)技术,和(3)混合模型。
原油中使用的传统的统计和计量经济学模型预测的研究包括线性回归、协整分析、自回归移动平均(ARIMA)集成,广义自回归条件异方差(GARCH)家庭模型,天真的随机游走,灰色模型、向量自回归(VAR),和误差修正模型(ECM) (8,11- - - - - -13]。Morana [12)采用半参数GARCH方法预测石油价格在短期的视野。侯和Suardi13)利用非参数GARCH模型估计和预测原油价格回报波动。你们et al。14)合并中低收入和高库存变量单一方程模型来预测短期原油价格。马诺莫尼和李15]VAR-based方法用来做事后的预测美国石油价格波动。兰扎et al。16)提出了一个综合分析原油使用协整和ECM模型和产品价格动态。然而,传统的统计和计量经济学方法是基于线性假设和有良好的预测能力当价格系列线性或几乎线性的。现有文献[为代表的4),传统的统计和计量经济学方法的预测性能可能会很差,因为有一个重要的非线性和原油价格系列的不规则性。
因为传统的局限性、统计和计量经济学技术,价格预测文献提出了一系列非线性和人工智能模型,包括支持向量机(svm)和人工神经网络(ann)。Movagharnejad et al。17)开发了一种神经网络模型来研究各种商业油的价格变化在波斯湾地区。Chiroma et al。18]提出了一种进化神经网络模型,它是基于一个通用的算法和神经网络预测西德克萨斯中质原油(WTI)价格。阿卜杜拉和曾庆红(19]研究机器学习的方法对原油价格预测的人工神经network-quantitative (ANN-Q)模型。艾布拉姆森和Finizza20.)使用信念网络,以知识为基础的模型,预测原油价格。Shambora和Rossiter21)与移动平均线交叉的ANN模型使用输入预测未来原油价格。谢et al。22]预测原油价格使用基于svm方法并比较它们的性能与ARIMA和摘要模型。
大量研究发现,人工智能模型往往会有更好的预测能力比传统的统计和计量经济学模型的价格预测(4,23,24]。然而,人工智能模型也有自己的缺点和局限性。例如,安是敏感参数选择(4]。为了克服单一传统的人工智能工具的局限性,越来越多的混合方法,特别是decomposition-based混合模型,已经应用于原油价格的预测11,25- - - - - -27]。
虽然这些decomposition-based方法比预测和分析,这些混合技术在预测价格有一些限制。例如,一些混合模型与固定基础设计敏感参数设置在去噪28]。此外,混合模型的预测的准确性会受到底层技术,和一些异构混合模型是计算密集型(29日]。
许多文献运用VAR模型来预测大宗商品的价格和收益30.- - - - - -35]。多变量VAR模型,作为最广泛使用的计量经济学技术之一,已被广泛应用于众多的实证研究。然而,VAR模型有两个主要问题:(1)时间序列在VAR模型的数量是有限的,因为参数的数量估计是二次时间序列包含的数量(34];(2)VAR估计过程不考虑厚尾错误,所以忽略极端波动系列的观察36]。
解决上面的担忧中,我们提出一个新的方法,结合VAR和Ivanov-based至少绝对收缩和选择算子(套索)框架来预测多个原油产品价格。此外,我们设计一个变体辅助问题原理(VAPP)算法求解Ivanov-based LASSO-VAR (I-LV)可以并行实现的问题根据他们的特点。工作提出了标准VAR密切相关,并提供以下原始的贡献:首先,我们调查了一组不同的稀疏结构基于VAR框架使用伊万诺夫正规化套索框架。其次,本文应用VAPP适合不同的VAR Ivanov-based套索变体。最后,我们提出一个可伸缩的预测方法,基于并行计算,快速融合优化算法和矩阵计算。
许多新的研究原油价格预测最近出版。江et al。37)结合decomposition-ensemble方法与情绪分析预测原油价格。因为原油期货价格数据是非线性和非平稳的,太阳et al。38)采用“分而治之”的思想来开发一个新的原油期货价格预测方法结合基于分解和重建集成技术。从市场经济模式,一种新颖的动态时滞对能源价格预测灰色模型选择是基于微分方程和差分方程的微分信息,以及数据简化原则(39]。吴et al。40)开发的混合框架Hampel标识符是用来识别和正确的异常值,而完整的集成经验模态分解去除噪声通过分解和重建的数据。提高预测的准确性和稳定性,提出了一种改进的多目标算法水循环。基于多源信息和decomposition-ensemble的预测研究。郭et al。41)提出了一个multiperspective原油价格预测模型新decomposition-ensemble框架。
本文的其余部分收益如下:部分2提出了预测原油价格的方法。部分3描述了VAPP的应用VAR模型拟合的方法,在其不同Ivanov-based套索变体。部分4介绍了预测结果和评估提出了方法的性能。最后,部分5给出了结论。
2。Ivanov-Based LASSO-VAR预测方法
让代表向量和矩阵规范。让 表示一个k维向量时间序列。代表一个滞后相关系数矩阵l。为了得到一个紧凑的矩阵表示法,让Y= 定义 响应矩阵, 的 矩阵的解释或预测变量 ,和p向量自回归过程的顺序。 是 系数矩阵。
为了简化符号,我们考虑 。然后,有两个标准LASSO-VAR配方结合规范(如 )和一个data-fidelity术语 如下:(我)Tikhonov正则化(称为T-LV) 在哪里 是一个标量正规化(或惩罚)参数控制的收缩量。(2)伊万诺夫正规化(称为I-LV)
同样的, 是一个标量正则化参数。
尽管这两个问题是等价的(在温和的条件下),I-LV配方可能在实践中更方便,因为相应的参数更容易调整。然而,I-LV问题不能有效地处理。因此,在这篇文章中,我们将开发一个高效的算法解决I-LV问题。
I-LV模型中可以使用不同的正则化的惩罚来减少的有效尺寸问题,和不同的稀疏模式可以发现基于VAR的固有结构。I-LV框架并不假定所有预测有助于模型;相反,它提取最重要的预测因子。有效地使用适当的惩罚会导致更准确的估计和预测策略。
表1简要介绍以下I-LV结构促进稀疏:标准I-LV (I-sLV) lag-group I-LV (I-lLV) lag-sparse-group I-LV (I-lsLV),自己的/另一组I-LV (I-ooLV)和causality-group (I-cLV)。不同的处罚应用导致不同类型的稀疏,根据选择的目标管理。这些结构的更多信息可以在Cavalcante等所做的研究。42]。
3所示。由VAPP I-LV配件
的Ivanov-based LASSO-VAR问题可以表示为以下非线性凸锥编程(NCCP): 决策变量在哪里吗B,目标函数 , 代表不同的正则化条件,如表所示1,C是一个凸锥。赵和朱43]介绍了一个灵活的一阶非算法VAPP呼吁解决NCCP问题。VAPP类型算法被提出,其主要子问题在每个迭代有封闭解。我们复习三个运营商将帮助我们表达这些封闭VAPP方便的解决方案。
第一个最小化问题如下: 在哪里 和 。它有一个封闭的解,这是由soft-shrinkage算子定义如下: 符号(⋅)是符号功能。
第二个最小化问题如下: 在哪里 和 。它有一个封闭的解是由以下方程:
第三个最小化问题如下: 在哪里 ,和 。它有一个封闭的解由沙特朗和Wohlberg提供44]。
现在我们应用VAPP解决上述五种I-LV模型,和简单的封闭的迭代。L1处罚作为sparsity-inducing任期超过单个条目的系数矩阵B,可以编写和I-sLV问题如下: VAPP的非迭代计划如下: 在哪里 和 。的细节参数的选择和赵所示和朱43]。然后,它遵循从(5)的封闭解B-subproblem是由以下方程:
I-lLV模型考虑了系数按时间滞后和分组查找时间滞后,提高预测精度。
的非B和更新的解决方案可以通过以下方程: 在哪里 。然后,B-subproblem的封闭解是由使用(7)。
然而,它可能过于严格的对原油现货价格预测,因为所有的一些落后的系数没有考虑或有时效率低下,包括整个滞后如果只有少数系数是显著的。因此,I-lsLV模型增加了延迟I-lLV稀疏。
类似于上面的过程,VAPP的非迭代如下: 在哪里 和 。通过使用(9),我们可以得到B-subproblem封闭的解如下:
许多原油现货价格预测更受到自己的影响过去的观察比过去观察其他的现货价格。I-ooLV,系数是按对角线项分组和非对角的条目。
它的非迭代如下: 在哪里 和 。此外,B-subproblem的封闭解如下:
I-cLV模型组系数根据相应的现货价格为了学习一种因果推论的数据。
非迭代如下: 在哪里 ,和B-subproblem封闭的解如下:
4所示。实际实现和结果
在本节中,我们首先描述我们的论文中使用的数据集,紧随其后的是原油价格预测的实验装置。最后,我们详细讨论预测结果。
4.1。数据描述和实验设置
VAPP算法应用于该I-LV变体为了预测原油现货价格值five-steps-ahead视野。摘要原油现货价格数据部署来自美国能源信息管理局。现货价格数据集包括我们WTI原油、欧洲布伦特原油(Brent),纽约港普通常规汽油(NYCG),美国墨西哥湾沿岸普通常规汽油(这样),纽约港2号燃料油(NYHO),纽约港超低硫柴油2号(NYDF),美国墨西哥湾沿岸超低硫柴油2号(USDF),洛杉矶超低硫柴油2号(LADF),美国墨西哥湾沿岸kerosene-type喷气燃料(USJF)和蒙特Belvieu德州丙烷(MB)。样品时间范围从1月2日,2018年到2019年12月31日。我们使用2018年和2019年的样本作为训练和测试数据,分别在我们的研究。
表2列表的时间跨度和观察训练和测试样本。训练和测试样本的观测是246年和249年,分别,因为大宗商品价格不报道,在周末或假期,我们丢弃的观察与错过了价格。
表3给出了描述性统计不同的商品价格。利用两个滞后的模型。访问I-LV结构性能的评估使用根均方误差(RMSE)和平均绝对误差(MAE)计算t+h;h= 1;2,…;5、铅时间与以下表达式: 在哪里代表了即时预测在时间t和是观察到的原油现货价格值。
4.2。预测结果与讨论
的表演I-LV VAR模型通过计算比较改进模型(使用最小平方估计)的RMSE和梅。表4和5显示平均美和平均RMSE所有点对不同I-LV结构。
表4和5表明I-LV模型表现出更显著的预测精度比传统的VAR,除了提前一天I-lLV的预测。此外,I-cLV显然比其他方法更好。可以观察到VAR的性能与提前期迅速下降,然而,I-LV结构相对稳定。图1比较I-cLV与VAR模型,代表了改进VAR模型为每个商品第一交货时间。结果表明,第一交货时间,VAR仅优于I-cLV商品,即“MB。“除了商品,改善对美和VAR范围在5.29%和87.39%之间为RMSE 5.01%和87.47%。
(一)
(b)
通过分析表的每个商品之间的相关性6,我们发现“m”和其他商品之间的相关性并不显著,这就是为什么I-cLV的预测性能很差。最后,图2“这样”展示了一个可视化的原油价格和原油价格预测输出I-cLV模型提供的第一个交货时间在一年的期间。
为了理解这组商品的联合动态行为,稀疏模式(即。,coefficients’ matrix) obtained by the I-LV structures and VAR for the first lead time are depicted in Figure3。蓝色的点代表非零项的系数。图3表明经典VAR和I-lsLV方法产生非零项的100%。之后很快,最佳性能I-cLV产生稀疏的42%。它可以观察到,几乎所有的数据一致,第一个滞后的对角系数非零项,表明变量的第一个滞后更可能提高预测比其他条目。因此,I-cLV稀疏结构可用于确定哪些商品可以促进预测其他商品并获得最好的预测。
表6显示每个原油现货价格不仅密切相关,原油的价格,但其他原油的价格。然而,我们注意到并不是所有的原油价格是密切相关的其他类型的原油价格,如MB。只有I-cL模型同时考虑这些因素,而其他五个模型没有。因此,I-cL模型优于其他五个模型的预测精度。
5。结论
介绍了预测方法,结合VAR和几个变种Ivanov-based套索框架的全面探索原油价格时间序列数据分布在不同的地方。拟议的方法调查竞争稀疏结构VAR系数矩阵和雇佣VAPP优化框架,以确保快速收敛和并行计算。对于一个真实的案例研究十原油斑点,I-LV模型显示的所有不同的稀疏结构比VAR模型更好的表演。I-cLV结构是最佳选择预测原油价格。
数据可用性
使用的数据来支持本研究的结果包括在本文中。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项研究是由中国国家自然科学基金(72073098;71871140;72173087),中国国家社会科学基金(格兰特数量:21 zda094),基础研究基金为中央大学(格兰特号码:2021110834),上海哲学社会科学规划项目(2020 bjb012),以及人文社会科学项目中华人民共和国教育部(20 yja790054)。