文摘
考虑到黄金价格的复杂模式,本文采用decomposition-reconstruction-forecast-mergence计划执行国际黄金价格预测。金价原始数据分解为12个固有模态函数和一个残的完整的集成经验模态分解与自适应噪声(CEEMDAN)方法,然后是13序列重构为一个高频子序列(IMFH),低频子序列(IMFL),剩余(Res)。根据不同特征的子序列,IMFL和Res预测的支持向量回归(SVR)模型。此外,为了进一步提高IMFH的预测精度,我们已经开发出一种新的混合方法基于支持向量回归(SVR)模型和灰太狼优化器(拥有)算法与SVR预测黄金价格的IMFH,即。,CEEMDAN-GWO-SVR模型。这种混合模型结合了复杂系统的方法和机器学习技术,使它更适合分析关系如高频依赖性和解决复杂的非线性问题。最后,最终的结果是通过结合三个子序列的预测结果。实证结果表明,该模型显示的最高预测能力在所有调查模型比较与其他单个模型的预测错误。
1。介绍
作为一种贵金属,黄金作为储备。许多国家的中央银行持有的黄金数量,减轻潜在风险的目的,抵制通货膨胀,经济增长和增加。黄金储备资产中起着重要的作用。特别是在过去的几年里,国际形势发生了复杂而深刻的变化,由于中美贸易战争的不断升级。在这种背景下,具有重要意义,以减轻国际金融风险,保持经济稳定。各国央行对黄金的需求一直在增加。2021年,中央银行增加463吨黄金,比2020年增加了82%,全球央行的黄金储备近30年来的最高水平。
黄金价格的趋势是不同于其他矿物质1),受各种因素的影响,包括供求、通货膨胀,和政治问题等等。在2008年的金融危机,大多数大宗商品和股市下跌约40%,而金价保持在高点和增加约6%2]。不断调整国际模式近年来,黄金正面临更加复杂的市场环境3),其价格受到严重的波动。图1显示了21年黄金价格的运动从2000年到2021年。显然,黄金的价格上下波动,表现出高度的非线性和不确定性。因此,准确预测黄金价格通常被认为是具有挑战性的4,5]。
本研究的主要目的是为准确预测黄金价格和运动。为此,我们采用decomposition-reconstruction-forecast-mergence计划执行国际黄金价格预测,并提出混合CEEMDAD-GWO-SVR模型。我们的实验证明,该方案和混合模型可以显著提高预测的性能。本文的其余部分组织如下:在部分2黄金价格预测上,一系列的近期作品,在部分3CEEMDAN方法、GWO算法和SVR模型召回的完整性、和混合CEEMDAD-GWO-SVR模型的主要步骤,介绍了节4,并给出了实验结果和预测精度比较在不同的模型,并在部分5讨论的结论。
2。文献综述
2.1。预测模型
研究黄金价格预测进行了几十年,并提出了许多方法。常用的方法主要包括多元回归、时间序列分析、神经网络方法和杂交或组合模型。
多元回归模型预测黄金价格与多个影响因素。时间序列方法预测未来黄金价格基于过去的时间序列,包括ARIMA(自回归综合移动平均),ARCH类模型(自回归条件异方差性)和GARCH类模型(广义自回归条件异方差性)。例如,小王和夏6边际分析和联合经济变量对黄金价格的影响,并提供了一个短期的预测黄金价格由多个回归,达到一个令人满意的结果。杨(7利用ARIMA模型,结果表明,模型能反映真实的黄金价格趋势在一定程度上。然而,上述两种方法有一定的局限性:解释变量的多元回归很难选择在实证研究中,有太多的时间序列方法估计参数,和最优滞后阶很难选择。在实践中,这两种方法可能无法描述黄金价格时间序列的非线性和复杂行为和降低预测的准确性。
神经网络方法非常适合于解决非线性和不稳定问题,并已广泛应用于时间序列预测。Parisi et al。8]分析了递归和滚动神经网络模型预测领先一步签署黄金价格的变化,他们发现滚动病房网络表现良好预测黄金价格变化迹象。张和Ci (9]提出了一种深刻的信念网络(DBN)黄金价格预测模型,实证结果表明,该DBN模型优于BP(反向传播)神经网络模型,遗传算法优化的BP模型(GA-BP)和ARIMA模型。然而,神经网络模型有透明度的问题,很难理解的经济影响和影响机制(10]。
近年来,黄金价格预测的研究主要集中在两种类型的混合模型和组合模型,如(1)杂交或组合不同的模型和(2)的杂交或组合模型与metaheuristic算法或先进的智能方法。因为并不是每个模型适用于杂交或结合其他第二种类型的杂交比第一个更多的应用程序。最重要的是,机器学习方法的杂化取得了许多成功,提供了关于黄金价格预测的更有用的结果。翁et al。11)提出了一个新颖的在线极端学习机(OS-ELM)模型基于遗传算法(GA)和正则化预测黄金价格。提出的混合模型解决OS-ELM的奇点问题,优于ARIMA模型,BP,榆树和OS-ELM模型。Alameer et al。12)提出了一个混合模型准确地预测长期月黄金价格波动。模型使用鲸优化算法(WOA)作为教练学习多层感知器神经网络(NN),和他们的实证结果表明混合的优越性WOA-NN典型的神经网络模型,粒子群优化的神经网络(PSO-NN),遗传算法对神经网络(GA-NN)和ARIMA模型。
由于其出色的预测性能和可解释性,支持向量回归(SVR)模型,特别是作为一个混合模型的一部分,已广泛应用于滑坡位移预测(13- - - - - -15),日常交通高峰流量管理(16,17,金融投资18,19)、空气质量预测(20.,21),和黄金价格预测22,23]。与其他机器学习方法相比,SVR显示快速收敛(24和有效地解决了多维函数估计问题25),但SVR的选择惩罚参数和核函数参数对其性能有重要的影响(26]。尤其是SVR会有一个大的预测误差在处理非线性高频时间序列。结果在26]表明,SVR的混合模型和metaheuristic算法可以显著提高单SVR模型的性能。
Metaheuristic算法被研究人员广泛使用的非凡的能力来解决优化问题。古典metaheuristics毕业典礼以来,即基因(27),模拟退火(28),禁忌搜索(29日)和粒子群优化(30.在1990年代末1970年代初,新一代的metaheuristics成倍地增加。在过去的三年里,近20 metaheuristics已经提出,包括黑脉金斑蝶优化(31日),蝴蝶优化算法(32),打乱牧羊人优化算法(33,水黾算法(34]。目前,有超过200 metaheuristic技术文献和调查几个(35- - - - - -37)提供全面的概述。灰太狼优化器(拥有)38)是metaheuristic算法之一,2014年由Mirjalili提出。群智能算法是模仿领导层次和狩猎的灰狼在自然机制。具有收敛速度快,搜索能力强的优点,可以同时优化涉及到内核的参数和重量(39]。最近的研究(38,40,41)已经证明拥有提供竞争结果与一些著名的metaheuristics相比。因此,本文与拥有跟SVR算法(即。,PSO-SVR) to forecast the nonlinear high-frequency part of the gold price time series and the subsequent experimental results verify the satisfactory learning precision and generalization ability with PSO-SVR.
2.2。数据分解
研究[42- - - - - -45)表明,数据分解之前预测可以有效地减少时间序列的非平稳的特点,它可以显著提高预测的性能。目前的分解算法包括经验模态分解(EMD) [42),集成经验模态分解(EEMD) [43),完成集成经验模态分解与自适应噪声(CEEMDAN) [44),和变分模式分解(VMD) [45]。EMD分解是一种自适应方法对非线性和非平稳过程。这种方法可以将复杂的数据集分解成一个有限,经常小数量的固有模式函数(货币)。然而,EMD可能遇到mode-mixing问题引起的间歇信号。EEMD有效解决这个问题通过一个合奏加高斯白噪声的信号。然而,添加高斯白噪声也创造了一些新问题:重构信号包括残余噪声和信号加噪声的不同实现,可能会产生不同数量的货币(44]。为了克服这些问题,提出了CEEMDAN。它执行EEMD高斯白噪声添加在每个阶段的分解,使分解完成。VMD完全nonrecursive变分模态分解模型,与实验结果研究[45]表明VMD更健壮的采样和噪音比EMD和EEMD。然而,VMD的影响参数需要提前设置(46- - - - - -48]。总之,CEEMDAN不仅提供了一个更好的光谱分离的货币比EMD和EEMD还克服了参数选择VMD的限制。此外,CEEMDAN降低计算成本由于其减少筛选迭代。考虑数据分解的重要性和CEEMDAN易于实现的方法,本文利用CEEMDAN预处理之前预测的数据。
2.3。主要贡献
在这项研究中,我们首先采用CEEMDAN进行数据预处理过程,然后使用GWO-SVR模型来预测黄金的价格。名叫CEEMDAN-GWO-SVR,该模型表明,比最先进的基准模型更好的预测能力和性能的数值实验。总之,缩写的列表和变量已经添加在表1在附录中。本文的主要贡献如下:(1)尽管提出了许多方法来预测黄金价格,特别是混合或组合模型进行了几十年,很少有研究基于“分解,然后合并。“本文采用decomposition-reconstruction-forecast-mergence方案预测国际黄金价格,使用CEEMDAN方法将原始数据分解成几个货币基金和剩余,然后使用T以及重建他们分成三个子序列,即高频子序列(IMFH),低频子序列(IMFL)和残余(Res),分别由SVR预测模型,最后三个预测结果结合起来最终结果。(2)考虑到不同的特征的三个子序列和大型SVR在处理高频时间序列的非线性误差,使用不同的SVR模型。具体来说,IMFL和Res,本文利用SVR与线性核函数预测黄金的价格,和IMFH GWO算法和高斯核函数的SVR模型生成GWO-SVR杂化,克服了主观的问题选择的参数来提高预测的准确性。(3)比较表明,CEEMDAN方法可以有效地获取有效信息从原始黄金价格数据,和提出CEEMDAN-GWO-SVR模型基准模型提供了重要的改进。
3所示。材料和方法
3.1。完整的整体经验模态分解与自适应噪声(CEEMDAN)
基于EMD和EEMD, CEEMDAN方法添加高斯白噪声在每个阶段的分解,然后计算独特的残留物获得国际货币基金组织每个原始数据集。可以完全重建原始信号求和imf的由于完成分解的方法。具体算法如下:步骤1。我们添加了高斯白噪声( )原始数据集然后生成新的数据集 在哪里试验和的数量吗信噪比。步骤2。每一个( )通过EMD分解通过让他们的第一个模式和计算的第一个国际货币基金组织(IMF) 步骤3。我们首先计算残余, ,作为 步骤4。我们定义操作符 ,生产 - - - - - -模式通过EMD分解 ( )直到我们得到第二国际货币基金组织(IMF), 第5步。我们计算 - - - - - -th ( )残渣和 ,在方程(5),国际货币基金组织(IMF)的总数吗 步骤6。我们分解 ( )EMD和计算 - - - - - -届国际货币基金组织(IMF)为 步骤7。我们重复步骤4到6直到残留少于两个极值和不能被分解了,所以最后的残留物可以表示为 原数据集分解
3.2。灰太狼优化器(拥有)
拥有metaheuristic算法,这是模仿领导层次和狩猎的灰狼在自然机制。灰狼的四种类型,包括 , , ,和 ,用于模拟社会占主导地位的层次结构。狼是领导人和决策者的包。狼是第二组的层次有所帮助狼在决策和建立一门学科。狼服从和狼,但占主导地位狼。他们扮演的角色童子军,哨兵,长老,猎人和看护人。狼,最低的层次,总是必须遵守所有其他类型的狼。GWO算法数学模型这种社会等级和狩猎过程收集随机首选的解决方案。具体地说, , , ,和被认为是适当的,第二优先,第三优先,分别和其他解决方案。GWO算法包含以下三个步骤:跟踪、包围和攻击猎物。
环绕,灰狼包围在狩猎的猎物,并给出数学公式 在哪里是当前迭代的数量,和的职位是灰太狼的猎物,分别 和 系数向量,组件的从2 0是线性下降,和是随机向量[0,1]。
在狩猎,这是应该的 , ,和有更好的了解潜在的猎物的位置。因此,当前的前三个保存最好的解决方案,和其他搜索代理(包括 )更新他们的位置根据最好的位置搜索代理。公式给出了方程(10)- (13):
灰太狼代理在寻找猎物和收敛发散攻击猎物,可以值的数学模型 。灰太狼代理往往偏离时的猎物 向猎物时,收敛 。最后,拥有算法终止通过最小化的适应度函数,将在3.4节讨论。
3.3。支持向量回归(SVR)
SVR是一个监督机器学习算法。基于结构风险最小化,SVR能够解决小样本维数高、非线性问题。一组训练数据的N观察 ,在哪里 输入向量, 输出向量,SVR函数可以被描述为以下线性回归函数: 在哪里特征映射函数和参数吗和分别的重量和偏见。基于结构风险最小化,和可以计算如下: 在哪里 是一个成本函数,和松弛变量,是一个不敏感损失函数。通过引入拉格朗日乘数法和 ,SVR函数表示为 在哪里 是核函数,它是映射函数的内积特征。
SVR会有一个大的预测误差在处理非线性高频时间序列。因此,不同于线性核函数用于时间序列预测低频、高斯内核, ,用于预测高频时间序列,由于其先进的映射能力和稳定的预测性能。与此同时,SVR惩罚参数的选择和核函数参数对其有重要影响预测的准确性(26]。因此,本文的曲调使用拥有这些SVR参数算法。
3.4。混合CEEMDAD-GWO-SVR模型
混合的细节CEEMDAD-GWO-SVR模型如下,并给出了流程图如图2。应该指出的是,“decomposition-reconstruction-forecast-mergence”计划也显示在图2。步骤1。我们进行CEEMDAN原黄金价格数据分解成几个相对简单的货币基金和剩余使用方程(1)- (8)。这一步对应于“分解”的计划。步骤2。我们重建国际货币和残余分成三个子序列,即IMFH, IMFL,专门研究,由于高频首先受到一些短期的随机因素的影响,可以认为在零均值波动。因此,每一个国际货币基金组织重建为高频子序列(IMFH)和低频子序列(IMFL)T以及为零的意思。剩余被列为第三子序列,即,Res. This step corresponds to the “reconstruction” of the scheme.步骤3。预测IMFH GWO-SVR和预测IMFL Res SVR。最优GWO-SVR模型是由适应度函数最小化。在这篇文章中,均方误差,给出了方程(17),用于计算预测的准确性。这一步是决定性的该模型的预测性能,对应的“预测”计划。 步骤4。这是最后一个方案的一部分。通过总结这三个子序列的预测结果,最终结果。
4所示。实证研究
本研究选择的每日收盘价格从1月3日国际黄金,2000年10月21日,2022年,从世界黄金协会网站(https://www.gold.org),共有5950数据点。图3显示了黄金价格的波动图。我们把第一个5655数据点(从2000年1月3日到9月3日,2021)作为训练集,最后295数据点(从2021年9月5日到2022年10月21日)作为测试集。表2提出了每组的详细信息。
4.1。数据分解和重建
以下4.4.1。数据分解
CEEMDAN,合奏的参数大小和信噪比设置为500和0.2,分别和最大迭代次数为2000,建议在44]。分解结果如图4。黄金价格序列分解为13和12货币基金和一个残余。序列的频率从高到低排名。高频货币波动相对随机但基本上在零附近的意思是,它可以被视为短期随机因素的干扰(例如,心理因素,投机因素,短期政策)。低频首先大致类似的趋势,金价的原始数据,反映重要的影响因素,如市场政策和宏观经济学。剩余显示整体上升趋势,决定黄金价格的长期趋势。
皮尔逊相关系数,与此同时,肯德尔秩相关系数和方差贡献率(VCR)选择测量每个序列和原始的黄金价格之间的关系数据,如表中所示3。从高频的两个相关系数,首先有一个低协会与原黄金价格数据,而低频货币基金和剩余与原有的有高度的相关性。录像机观察到类似的模式和剩余涵盖所有方差的66.6%,表明对原始数据影响最大的,反映了黄金价格的内部轨迹数据。总之,黄金价格的趋势主要是所描述的残余。低频首先有一个很大的影响黄金价格在一定时期内,而高频首先在短时间内只有一个小的影响。
4.1.2。数据重建
高频首先有一个小的在短时间内对黄金价格的影响,所以他们可以合并成一个序列,提高建模的效率,但问题是如何确定哪些序列是高频货币基金。由于高频首先受到一些短期的随机因素的影响,可以认为在零附近波动的意思。因此,首先可以重建T测试每个IMF零均值。结果如表所示3。的的值IMF1∼IMF9大于0.01。
自从九首先不能拒绝零假设t测试,所以他们都是分为高频子序列(IMFH)和 。剩下的序列,IMF10、IMF11 IMF12,拒绝零假设t在1%显著性水平测试,所以我们定义的低频子序列(IMFL) 。剩余被列为第三黄金价格数据的子序列,即,研究表4提出了重建结果。
图5显示了重构子序列趋势,可以发现:(1)IMFH波动相对随机但基本上在零附近的意思是,这主要是由一些短期随机因素干扰;(2)IMFL大致类似的趋势,最初的黄金价格主要受市场政策和宏观经济学;和(3)Res节目整体上升趋势,进行黄金价格的趋势。
4.2。预测结果与讨论
4.2.1。准备评价措施
提出了模型的预测精度和基准模型评估以下三个措施:(日军),平均绝对百分比误差均方根误差(RMSE)和定向精度(DA)。他们给出的公式: 在哪里是预测点的数量,是实际的黄金价格点吗 ,和黄金价格预测点吗 。显然,日军和RMSE值越小,模型的预测精度越高,和DA值越大,模型的方向精度越高。
4.2.2。样本内预测(2016年1月1日- 9月3日,2021)
最初的黄金价格数据分解和重构为三个子序列:IMFH, IMFL, Res,可以表示为 在哪里是实际的黄金价格。三个子序列分别预测,然后结合获得的最终预测黄金价格。考虑到低的SVR预测的准确性在处理非线性高频时间序列,IMFH由GWO-SVR改善预测参数选择、和IMFL Res预测由SVR。
拥有算法的优化范围设定在(0.001,200),人口规模和最大迭代次数设置为20 - 50,分别。IMFH,最优惩罚参数和核函数参数SVR−−132.7510和1.8545,由拥有选择。所有的计算都是在Ryzen r7 - 4800 u CPU、16.0 GB RAM DDR4 3200 mhz, windows 11系统。
图6显示三个子序列的预测结果和原始的黄金价格数据。它可以观察到,蓝线(预测结果)非常接近红线(重建的子序列),这表明该CEEMDAN-GWO-SVR模型达到一个相对较好的预测结果。表5介绍了预测的准确性的措施。IMFL和Res相对较小的错误和定向精度高,实现良好的预测性能。IMFH比其他两个的精度较低,同时也减少了原始的黄金价格数据的预测的准确性。这是因为IMFH受随机因素的影响,这就增加了预测的难度。
表6介绍了预测结果的准确性措施的提出CEEMDAN-GWO-SVR模型,SVR-based模型和non-SVR-based模型。其中,SVR-based模型包括CEEMDAN-SVR GWO-SVR, SVR,和non-SVR-based模型包括ARIMA、GARCH,安,购物车,摘要(反向传播神经网络)。显然,该CEEMDAN-GWO-SVR模型优于替代品。SVR-based模型、CEEMDAN-SVR CEEMDAN-PSO-SVR和CEEMDAN-GA-SVR模型可以提高SVR的性能。虽然混合CEEMDAN-GWO-SVR模型达到最好的预测结果表明,该模型可以从原始数据极度获取有效的信息,它还演示了decomposition-reconstruction-forecast-mergence方案的优越性。图7显示了拥有的收敛情节,反映客观可以最小化的算法在迭代的最大数量。
4.2.3。样本外预测(2021年9月6日- 2022年10月21日)
上述结果证明CEEMDAN-GWO-SVR模型优于基准样本内预测模型。为了进一步测试该模型样本外预测,本文估计黄金价格连续接下来的295天(2021年9月6日- 2021年10月)。CEEMDAN-GWO-SVR模型的参数设置在上面的一样。
样本外预测的准确性比较分别见表索引7。提出的优越性CEEMDAN-GWO-SVR模型也可以证明。三个SVR-based模型中,CEEMDAN-SVR模型获得最佳性能,同时,它也有比non-SVR-based模型预测性能优越。这表明CEEMDAN方法可以改善预测性能。此外,当CEEMDAN-SVR和拥有杂化,金价的预测精度进一步提高,显示的优越性CEEMDAN-GWO-SVR模型提出了。应该注意的是,短期预测,尽管CEEMDAN-GWO-SVR模型具有相对较低的定向精度,它仍然具有较小的预测错误(日军和RMSE)比的选择。因此,提出CEEMDAN-GWO-SVR模型可以被认为是最好的模型。
5。结论
本文提出一种decomposition-reconstruction-forecast-mergence方案国际黄金价格预测。在这个方案中,一个有用的黄金价格预测模型,提出了结合GWO-SVR CEEMDAN方法。实验结果验证CEEMDAN-GWO-SVR黄金价格预测模型的有效性。是得出以下结论:(1)由于黄金价格的复杂模式,数据预处理的早期预测是必要的。CEEMDAN方法添加高斯白噪声在每个阶段的分解和充分降低了原始数据的噪声。同时,实验结果表明,该CEEMDAN方法可以提高SVR的预测性能。(2)虽然CEEMDAN-SVR模型可以提高SVR的性能,可以进一步提高了组合预测的准确性CEEMDAN-SVR和拥有。这是因为拥有的SVR参数优化选择高频时间序列由CEEMDAN来分解,从而最终改善预测性能。(3)CEEMDAN-GWO-SVR模型明显优于其他六个基准模型,也演示了decomposition-reconstruction-forecast-mergence方案的优越性。
然而,本文仍然具有一定的局限性。本文只使用时间序列预测黄金价格。虽然该模型已经取得了良好的预测结果,研究影响黄金价格的主要因素仍然是一个重要的研究问题。
进一步的研究可以从以下几方面进行。GWO算法有一定的人口多样性的问题和开发和探索之间的平衡49]。因此,该算法可以改进进一步提高SVR模型的预测性能。此外,除了拥有,找到一个合适的方法来杂交最近metaheuristic与SVR算法也是一个重要的研究问题。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是由美国国家科学基金会资助下的中国71771187和72163029,中央大学和基础研究基金在中国授予JBK190602。