文摘
本文的目的是预测月度原油价格与分层收缩的方法,利用不仅对预测选择套索,但层次贝叶斯方法确定常系数(CC)或时变参数(利用)预测回归应该用于每个样本外预测步骤。这个新开发的方法具有模型收缩和自动切换CC和利用预测模型;因此,这可以产生更精确的预测原油价格。实证结果表明,该层次收缩模型基准可以胜过许多常用的预测方法,如基于“增大化现实”技术,未被注意的组件随机波动(UCSV)和多元回归模型预测原油价格对各种预测的视野。
1。介绍
原油价格的一个关键指标的全球宏观经济和金融市场1- - - - - -6]。然而,石油价格预测是一个复杂的过程由于各种因素影响石油价格(2),这些因素对石油价格的影响程度随时间变化(7- - - - - -11]。所以,找到一个合适的石油价格预测方法,这不仅仅是能够选择的重要预测因子但也反映了动态预测的影响,是对广泛应用12- - - - - -19]。
大量的文献[2,4,5,11,13,18,20.- - - - - -25]表明,除了之前的石油价格,其他参数等基本的石油供应,需求和石油股票的影响,金融市场力量,市场情绪和不确定性,宏观经济和地缘政治的影响也主要影响因素。如果添加这些解释变量的多元回归或自回归(AR)类框架,它可能导致过度拟合和misspecification问题,从而制约了预测精度(7,26,27]。此外,这些参数的时变效应应该也考虑油价的预测,但吸引时变效应回归模型将使过度拟合的问题变得更糟7,11,28]。
在这项研究中,我们将介绍流行的贝叶斯方法,不仅克服了overparametrization misspecification石油价格预测的问题,还探讨了解释参数的时变特性在短期和长期石油价格预测的视野。本研究文献主要是三个贡献石油价格预测如下。
首先,我们可以估算出大量的解释参数有限的观察。通常,低频数据集更容易访问和过程比高频数据集;投入更多的信息解释变量模型可以帮助宏观经济学家,政治家,和其他市场参与者在原油价格得到更全面的信息。进一步,我们实现至少绝对收缩和选择算子(套索)收缩方法来处理所有认为内生和外生解释因素和自动选择最有力的影响因素。尽管先前的研究[6,29日- - - - - -33)模拟LASSO-based方法显示更好的样本外预测和超越两类AR模型和时变参数模型,目前尚不清楚套索运营商也优于其他常用基准石油价格预测模型。检查套索运营商有效性可能帮助石油市场决策者识别重要的影响力指标有效地抓住投资机会。
此外,为了更好地解释了油价,我们引入了更全面的外生(见表1)和内生变量(例如,从先前的观测时间步骤)回归预测。一方面,引入之前油价回归使与自回归模型(AR)和时变向量自回归(TVP-VAR)模型,常用的和证明在能源价格预测模型可以生成准确的预测(18,34- - - - - -37]。另一方面,我们引入一个更全面的外生因素框架,它可以避免misspecification模型。大部分的石油价格预测研究(3,16,34,38- - - - - -40)只关注几个关键石油价格预测,忽略其余由于有限的变量处理能力;misspecification这导致错误,而使用套索操作符在这项研究可以减少重要解释变量的系数为零,包括所有的模型中的外生变量,而不必担心multi-indicators的处理能力。
其次,众所周知,预测参数的预测能力在原油价格随时间变化7- - - - - -11,18,41]。这促使我们研究回归系数的时变特性。收缩模型中时变参数描述(28和被认为是一种有效的预测方法32]。因此,我们应用套索时变回归模型在石油市场和评估石油价格预测的性能。这个Bayesian-based估计方法可以通过月度预测长期和短期预测的视野信息。分层收缩在石油价格预测,我们可以选择最相关的预测和自动挑选时变参数。值得注意的是,一些调查工作参数动态属性包含大量单个模型的预测。我们的研究提供了实证证据关于最有力的因素在预测油价和法官同时其动态特性。
第三,我们扩展我们的想法使用日志的均值预测可能性(MLPL)检查整个预测分布的鲁棒性,填补空白的常用预测性能测定的均值平方预测误差(MSFE)和预测误差的绝对值的平均值(MAFE) [19,23,27,28)——只能判断点的预测。我们还检查预测性能改变的解释变量,依赖的变量,为鲁棒性检查和滚动窗口评估制度。我们的样本外的证据表明,套索分层收缩模型优于其他竞争模型在大多数情况下;套索可以选择自动、高效地信息变量。
本文的其余部分组织如下:部分2介绍了计量经济学方法和比较模型。第三节介绍了我们的数据。第四节提供了样本外的实证结果与讨论。在第五节,我们现在的鲁棒性检查,第六节总结道。
2。实证模型和计算过程
2.1。实证模型
原油既有商品和金融属性。正如上面提到的,除了前面的油价,我们仍有数百名影响外生变量和季节性调整也应考虑。在这种情况下,合适的完整模型预测原油价格是由 在哪里是我们想要的未来原油价格预测h——未来,是拦截, 误差项。代表外生变量部分的总和,解释变量的数量,是回归参数。包括的总和石油价格的滞后;是th滞后系数。是11月假人的总和是季节性调整。是哑变量系数。总的来说,潜在的独立变量的数量 。
每个部分的模型(拦截 , ,或 )可以排除在模型。简而言之,通过添加不同的术语可以分析模型计算的步骤模型,然后判断时变特性,并有选择地做套索收缩为变量参数恒定方差(homoskedasticity )和随机方差(异方差性 )政权。模型结构是多元化的,以下三个限制性的形式:(1)AR (p)模型 模型指定未来原油价格线性依赖于它的过去值。(2)多元回归模型 模型考虑了几个关键的外生变量的影响但不包括内生变量的影响油价。(3)未被注意的组件(UCSV)随机波动模型 假定未来石油价格包含组件的直接解释不能观察到的。
这三个模型是常用的,证明他们可以生成相对精确的线性回归预测(18,34- - - - - -37,42- - - - - -45]。一样的完整模型(方程(1)),这三个限制模型版本也可以做分层参数收缩和决定哪些变量参数随时间。在4.2节,我们比较完整的模型和三种限制模型预测性能与之前相同的选择和基本模型结构。的具体计量方法计算过程如下。
2.2。判断时变特性和预测预测的力量
简要介绍了计算过程,完整的变量模型(方程(1)可以简化为 感兴趣的变量, ,可以被定义为 。变量矩阵 ,和相应的系数矩阵是 。
在方程(5),我们假设 和 。 可以随机或常数波动。错误的认为是相互独立的和独立的领先和拖后。的维度 ,可大相对于观测的数量。保持模型相对简单,我们假设是一个对角矩阵, 。 介绍了收缩的时间变化然后开关常系数时变系数。如果是零,th ( )系数是常数随着时间的推移,更大的价值意味着更多的时间变化。为了引起 ,Belmonte et al。28单独的模型分为两部分,一部分是常数(由 )另一部分是时变(为代表 )。方程(5)将会改变 在哪里 和 。然后,让 和转换方程(6) 在哪里 为 。
通过实施套索的方程(7),我们就可以判断预测的时变特性和预测能力。计算四种可能的情况下讨论如下:(1) 降至0,但是不是缩小为0;然后,随着时间的推移th可变参数是恒定的(2)这两个和降至0;然后,变量对预测油价无关(3) 不是缩小为0,但降至0;然后,变量参数时变特性(因为小 ,会挥发系数的值为零)(4)这两个和不减少为0;然后,th变量对预测石油价格和相关时变系数是不受限制的在零附近
2.3。分层参数收缩
感兴趣的参数 , ,和 ;我们可以使用贝叶斯套索收缩先验估计这些参数。根据这项研究的28),可以通过从套索收缩正常分层先验和 。
层次结构收缩1:常系数,先天的( )是独立的 和指数混合密度 。 是常系数的收缩参数,我们假设 。所以,第一个层次是有条件的估计然后获得 。
层次结构收缩2:从方程(4),我们可以推断时变参数( )之前的形式 ,在哪里 。层次的先天 ,有条件的独立与 ,也与指数混合密度 。收缩参数位于底部的层次和假设 。第二个层次是有条件的 ;我们可以获得和 ,最后,判断是时变的。
对于上述两个层次结构收缩过程,我们hyperparameters之前设置 ,这意味着适当的但是非常noninformative先知先觉。对于常系数模型,消除了利用模型的一部分,我们集 为了使收缩之前非常接近于零,其方差为0.1。
完成这两个层次收缩计算,28]提供了马尔可夫链蒙特卡罗(密度)算法块和精确的步骤参数后验。在使用非参数核平滑算法参数后验,我们可以得到一个近似的油价预测密度。
套索收缩可以适用于常系数和时变系数,完整的模型和限制模型可以推导出以下几个版本:(1)套索对常系数和时变参数:常数和时变部分都使用套索先知先觉,层次收缩。(2)套索只对常系数:该模型省略了时变部分(在方程(7)套索先知先觉,并使用一个相对noninformative之前并无正常 。(3)套索只在时变参数:这个模型省略了常数部分( )套索先知先觉,并使用一个相对noninformative之前并无正常 。(4)利用回归模型:该模型是传统的时变多变量参数模型,不分层收缩参数。使用noninformative套索的先知先觉和 。(5)常系数模型:该模型消除了时变部分( )通过设置之前hyperparameters ,这意味着一个极其严格之前与之前集中非常接近0。
2.4。评估标准
预测或预测点密度的结果从前面的步骤是有用的定量比较不同模型之间的样本外预测性能。在文献预测测量大会之后,我们使用点预测损失的功能和证明模型预测的排名(17,23,29日,31日]。进一步,因为研究人员和政策制定者关注总分布预测的不确定性不仅仅是一个点预测,我们也采用日志的均值预测可能性( )评估整个预测分布。这三个测量统计的具体配方下面列出:
分别结束日期,开始日期,是预测长度,油价的预测中值是,是相应的实际价值。小和和更大的显示更强的预测能力。
3所示。数据
本文使用了两个流行的代理在原油价格:月布伦特原油现货价格为因变量,西德克萨斯中质原油(WTI)原油期货鲁棒性检查。两个数据集的跨度从2004年1月至2018年12月收益率t= 180观察;样本外评估由过去110年观测。
先前的研究的基础上(3,16,34,38- - - - - -40),我们选择一个相对全面的预测框架来预测原油价格和使用可用的实时数据。外生变量数据集由原油基本面因素(包括原油的供应、需求和库存),资本市场价格(黄金价格、汇率和股票市场价格指数),替代产品价格(天然气价格),市场情绪指数(波动性指数),宏观经济影响因素(工业生产和Kilian索引),和政治变革(全球政策的不确定性和谷歌趋势)。这个变量设置不仅抓住了信息在这两种原油的供应和需求,也包括活动相关金融市场和宏观经济。因此,它们被广泛使用变量对原油价格预测。
ADF和PP测试表2表明没有变量单位根一阶对数差分后,这意味着所有的系列都是平稳时间序列,我们可以使用这些系列进行进一步的计量经济学建模。两个依赖variables-WTI和Brent-are没有多,尖峰的和非正态的分布。在20滞后,问WTI指数和布伦特原油现货价格系列的统计显示显著的自相关,这表明过去油价影响当前的油价,所以它是合理的,包括AR模型中。
检查当前油价是否受到过去的油价,我们进一步包括登录一次差12落后的布伦特原油价格指数模型。此外,拦截和11月假人假1月(省略)是为了区分每月或季节性对原油价格的影响。
所有的解释变量是标准化的均值为0,方差。模型可以灵活地包括一个拦截,不同数量的滞后,11月假人,12上面列出的预测因子。此外,它可以预测石油价格提前一个月(短期),提前一年(长期)。
总之,完整的变量模型包括36系数来估计只有不到15年的数据,这是一个相对较短的数据集。省略12预测和11个假人,模型导致了AR模型或TVP-AR模型。如果落后进一步排除在外,它会导致利用模型和多元回归模型。如果只剩下11个假人模型,模型形式UCSV变化模型。总的来说,对每个样本大小滚动窗口估计,计算20个不同版本的完整模型和100年竞争模型来检查模型的鲁棒性。
4所示。实证结果
4.1。参数时变和收缩的结果
本节着重于时变和收缩系数为代表和 。 接近于零的手段th ( )随着时间的推移系数是常数;更大的值允许更多的时间变化。而小的价值确保更高程度的收缩,大表示之前更分散,收缩更少。为了更好地解释时变和收缩特性,我们发布完整的模型(套索收缩常系数和时变参数)布伦特原油作为一种即时的结果。
这些结果显示适度收缩在大多数系数,但收缩程度不同。表3显示,在未来一个月(h= 1)预测,对原油消费,黄金价格,工业生产指数倾向于收缩超过其他变量的系数,这表明对原油价格的影响这三个变量相对定常。相反,在短期预测,原油生产对石油价格的影响是不同的。的天然气价格、工业生产指数和Kilian指数减少大多数在所有外生变量;这意味着石油替代产品的作用,生产水平和宏观经济因素不会对原油价格产生显著的影响在短期内。相反,三个代表市场不确定性variables-VIX EPU,和谷歌trend-show低级的收缩,因此,政策的不确定性,市场人气,热量和主题有更大的影响在短期内油价。
在长期(h= 12)预测,原油库存,Kilian指数成份公司,显示更大比其他的变量,这就意味着更大的时间这些系数的变化。此外,克里安指数最大了 ,这表明Kilian指数是一个强大的预测对石油价格的长期预测。相反,美元贸易加权指数,天然气价格,生产水平相对不重要的因素。
表4展品,半年以前油价对当前石油价格产生重大影响的短期预测;从影响和季度的开始是温和的。表5描述了原油价格的熊小与季节的循环关系,因为所有的月假人收缩比大多数其他的预测和滞后。
4.2。预测结果评价
在表中,所有相对于相应的完整模型给出的结果(套索常系数和利用);小MAFE MSFE或MLPL比完整模型的统计数据表明,限制模型预测比基准模型。
上层指标表6结果表明,在一个月前预测,有证据表明,套索对常系数优于其他限制模型在随机和常数波动,满足短期预测的期望,大多数系数不随时间变化。表3结果与表相一致6并再次证明了我们的观点。
而言,后者预测metrics-the年度预测horizon-coefficients倾向于表现出更多的时间变化,因此完整的模型具有最好的性能。
值得注意的是,利用回归模型和常系数模型产生最坏的预测根据MLPL在这两种情况下。结果再次验证,新贝叶斯分层套索优于传统的同行和提高了预测精度。此外,套索的糟糕表现表明,时变参数的时变参数模型中石油价格预测是必要的。
总之,所有的结果表现出贝叶斯分层收缩的优点。首先,把一个套索之前决定是否允许数据系数是时变和他们不同,多少限制了利用回归模型系数徘徊太广泛,可以获得更好的预测性能。其次,针对misspecification问题,套索先验可以自动发现缺乏时间变异系数和减少不必要的变量的系数为零,这有效地提高预测精度,解决misspecification。第三,分层收缩时变系列促进研究者的开始与一个非常灵活的模型相对较短的数据集;模型结果允许研究人员和从业人员更有效地识别最有力的预测因子然后做出正确的投资决策。
调查是否预测性能变化随着时间的推移,我们现在的图1使用套索的模型前常系数和时变参数(利用)预测地平线h= 1(类似模式是发现与其他计算结果)。
(一)
(b)
(c)
从(a)和(b)在图1可以看出,常数和随机波动率模型的版本大致预测以及对方;然而,许多冲突发生在2014年页岩油的革命。MAFE、MSFE MLPL将有一个类似的模式,大部分时间,但不一致的石油价格剧烈波动时期。发生了什么是,heteroskedastic版本包含太多的波动性增加页岩油革命开始以来MLPL整个分布预测性能的措施。这没有影响点预测MAFE和MSFE不相差太多常数和随机模型的版本。
5。鲁棒性检查
5.1。鲁棒性不同模型的规范
首先,我们进行鲁棒性检查通过改变变量设置;基于“增大化现实”技术的样本外性能、多元和UCSV模型如下表所示。
表7- - - - - -9表明,完整的模型,小MAFE MSFE和大MLPL也观察到在套索对常系数和常数和利用AR套索,多元,UCSV模型。这些结果表明,分层收缩法也可以超越其他竞争模型即使模型结构的变化。
5.2。靠窗替代估计鲁棒性检查
在本节中,我们改变了从递归估计窗口滚动窗口滚动窗口;结果如表所示10。套索常系数和利用套索只在恒定的结果定性相似的滚动窗口和递归滚动窗口。
此外,我们建议更改样本三个窗口大小(6,46,47)检查分级收缩模型的鲁棒性。在40%、50%、和60%不同样本外评估,结果表明,模型与套索收缩表现出低MAFE MSFE和高MLPL在大多数情况下,表明样本外分层收缩的结果是不同的计算算法健壮和样本大小。
5.3。鲁棒性选择因变量
表11报告的主要样本外预测结果原油价格的另一个流行的代理,西德克萨斯中质原油。结果非常接近布伦特原油,它提供了进一步支持分层收缩法的优越性在替代代理原油价格预测。
6。结论
在本文中,我们基于贝叶斯预测原油价格分层收缩法和相对较短的数据集和综合变量框架。这种方法可以避免过度拟合和misspecification问题所面临的线性回归预测和提高石油价格预测的准确性。它还考虑了参数动态属性。所以,从业人员或决策者可以很容易地识别最强大的指标在不同时期和做适当的策略。
点和分布预测性能统计数据表明,分层收缩模型展览样本外预测性能明显优于其他竞争模型homoskedasticity和异方差性的版本。我们的结果是健壮的一个广泛的模型设置,包括各种模型结构,不同的样本外大小,选择评估滚动窗口,和原油代理。因此,我们的研究提供了证据,看指标信息和强大的石油市场来提高预测的准确性。
数据可用性
布伦特和WTI原油价格数据是网站上的公开可用的环境影响评价https://www.eia.gov/dnav/pet/pet_pri_spt_s1_d.htm。
的利益冲突
作者宣称他们没有利益冲突有关的出版。