研究文章|开放获取
撒母耳Asante Gyamerah,埃德温·莫约, ”使用高斯概率密度预测长期汇率内核和分位数随机森林”,复杂性, 卷。2020年, 文章的ID1972962, 11 页面, 2020年。 https://doi.org/10.1155/2020/1972962
使用高斯概率密度预测长期汇率内核和分位数随机森林
文摘
在宏观经济的不确定性,准确预测长期汇率决策和规划是至关重要的。测量与汇率相关的不确定性和未来汇率的获得更多的信息,基于分位数回归森林和高斯混合模型的内核(GQRF)构造。季度数据集KSh /美元汇率和宏观经济变量的使用从2007年到2016年。预测地平线跨度从2013年到2016年。预测区间覆盖概率和预测区间的平均宽度为95%和29.6493%,所构造的模型有一个非常高的覆盖概率。确定概率预测的方法是非常重要的实现预测正确的报道。汇率的概率密度预测模型给重要的讯息——预测结果的概率分布。通过这种方式,可以评估不确定性预测,因为完整的汇率分布预测。GQRF是有效的,因为它可以支持不确定性方差与每一个点,这对汇率预测是很重要的。使用构造模型,概率超过数,如未来汇率的概率超过了全年平均汇率计算。 This paper also adds to the scarce literature of exchange rate probability density forecasting using machine learning techniques.
1。介绍
汇率预测确实是一个具有挑战性的任务,仍然是一个非常重要的研究领域为金融机构和经济学家,外币套期保值者、投机者,交易员,所有专业人士在外汇市场(外汇)。中央银行,政府,和利益相关者在外汇市场将账户汇率预测关键和重要的经济决策。这些决策对未来的影响一个国家的经济运动。汇率的期望值影响现金流的所有外国事务。因此,预测汇率的运动有利于投资者、贸易、企业和政策制定者。大多数跨国公司(跨国公司)使用汇率预测未来决定是否对冲外币应付账款和应收账款。跨国公司资本预算决策,也使用汇率预估收入评估、短期和长期的融资决策。然而,有重大疑问准确预测的可能性,因为不确定性的主要宏观经济变量用于预测汇率。这导致了外汇市场汇率的不确定性导致显著影响贸易(国际和国内)部门和大多数国家的国内投资。
的(1中期段),汇率不确定性影响贸易流动的大多数工业国家除了美利坚合众国。文献[2]研究了汇率的不确定性的影响公司的利润增长率和得出结论,增加汇率的不确定性导致更大的可变性公司利润的增长速度。使用克罗地亚和塞浦路斯作为案例研究,3]分析了汇率的不确定性对行业出口的影响。作者指出,有重要的汇率不确定性对出口的负面影响。日本企业的之间的关系暴露于汇率的不确定性和风险管理实践是检查(4]。得出公司相当大的依赖在国外市场的销售有明显的外汇风险,是由市场决定的。文献[5]研究汇率对出口的不确定性的影响一些选定的撒哈拉以南非洲国家(冈比亚、加纳、肯尼亚、马达加斯加、毛里求斯、莫桑比克、尼日利亚、塞拉利昂、坦桑尼亚、乌干达和赞比亚)从2013年到2014年。他们的研究表明,汇率不确定性对出口的负面影响短期和长期的积极影响。
不同于上述文献文献,研究汇率波动对国内投资的影响(6- - - - - -8]。汇率不确定性有两个总值对比影响经济和未来前景的投资在一个国家的经济9]。也就是说,成为相对便宜的进口与出口产品的价格。因此,投资一个额外的单位资本的边际利润是肯定的,由于较低的收入所产生的当地和国际国内公司操作。在他们的研究中,(6)发现,汇率波动间接影响国内投资,因为它对国内和国际贸易的影响。文献[7]研究了汇率的不确定性的影响外国直接投资在一些选定的国家在撒哈拉以南非洲。他们观察到一个强大的消极和重大汇率不确定性对外国直接投资的影响。即,当投资者的不确定性的表现一个国家的货币在长期内,他们倾向在他们投资的国家转移到其他稳定的市场。在研究汇率的不确定性的影响在国内投资选择一些新兴市场和发展中经济体(EMDE), (8)发现,有一个积极和重大的影响汇率的不确定性对国内投资这些emd。
上述文献确认汇率对国内投资的不确定性的影响,外国直接投资,交易活动的行业,行业的增长,国际和国内贸易,一个国家的经济作为一个整体。因此必须准确预测汇率的不确定性,帮助在长期和短期决策的关键利益相关者经济和投资者。使用季度汇率和其他宏观经济变量数据肯尼亚作为一个案例研究中,我们提出一个概率密度预测模型能够捕捉与汇率相关的不确定性。所构造的模型是一个混合模型的分位数回归森林和高斯内核(GQRF)。分位数回归森林的面积被用于健康和农业。文献[10)利用分位数回归森林预测药物反应治疗的癌症患者和评估预测的可靠性。使用out-of-bag验证,他们宣称QRF模型达到较高的预测精度的药物反应。最近,(11]应用分位数回归森林和Epanechnikov内核函数的混合模型来捕获在作物产量预报天气的不确定性。他们的模型在预测作物产量表现良好在极端天气条件和不确定。
本文的贡献如下:(1)一个可靠的、高效和准确的概率密度预测模型提出了利用分位数回归森林和高斯内核和实现捕捉汇率的不确定性。汇率的总条件概率密度曲线构造和所有选中的观察在预测汇率值概率密度曲线。(2)使用该模型的概率超过数计算,如未来汇率的概率超过全年平均汇率。我们最好的知识,提出了概率密度预测模型是第一个在文学。
本文结构如下:部分2介绍了论文的理论概念。分位数回归的概述,随机森林,该模型(分位数回归森林和核密度估计)提出了在这一节中。部分3提供了评价指标用来评估点的性能和区间预测。节4,一个案例研究使用美国美元之间的汇率(美元)和肯尼亚先令(KSh)和选择的宏观经济变量。数据分析和评价结果提出了在这一节中。结论提出了部分5。
2。理论概念
2.1。分位数回归
传统的回归方法得出的推论实际价值响应变量之间的关系Y和一个预测变量X。然后找到一个估计有条件的意思 的预测变量 。与传统回归技术,分位数回归(QR)不承担特定的参数分布的响应变量,也不认为一个常数反应变量的方差。因此,采用分位数回归。分位数回归(QR)是统计方法的条件分位数的估计和推断反应变量(12]。
标准的QR问题可以被定义为 在哪里是预测/功能,b分位数是一个向量的参数吗α, 是有条件的分位数的汇率分布 。从方程(1),条件分布函数 是解释为的概率Y小于或等于 ,这是
通过最小化一个特定的损失函数分位数,向量的参数评估, 在哪里n样本数据的总数,指标函数, 是独立的变量。
2.2。随机森林
随机森林(RF)是机器学习的一个例子(ML)整体算法称为装袋(“引导聚合”的缩写)。装袋,学习者由一个不同的基地学习者,每个基地学习者与引导训练样本的每棵树从整个观察。也就是说,装袋米次级样本训练数据训练模型的替换这些次级样本。这将确保每棵树在森林里是建立在大约63%的可用的训练数据,剩下的数据用于测试。因此,射频不需要一个明确的测试样本。剩下的数据被称为out-of-bag (OOB)数据。每个模型的性能OOB数据时平均可以给袋装模型的估计精度。预测使用OOB数据被称为OOB预测。装袋的主要优势是,它整合了正规化,只需要一个适当的选择的参数或基本算法。引导技术,如随机森林适合小样本数据集有可能性overfit [13]。
现在,假设是一组训练数据和技术建立一个预测吗 使用给定的训练数据,是目标变量和预测因素的集合。在装袋,一系列的训练数据集创建平等的大小T通过引导T。P预测是建立的方式预测 取决于引导训练数据。只要这些预测是聚合,合成预测可以比实际的预测更准确14]。
2.3。高斯分位数回归森林(GQRF)
2.3.1。分位数回归森林
分位数回归森林(QRF)是一个一致的算法,提出了一种非参数和明确的评估技术条件分位数高维度预测变量(15]。分位数回归森林是一个机器学习技术,是基于随机森林和分位数回归。随机森林的预测可以比作实际响应变量的加权平均数。类似于随机森林,树木生长在分位数回归森林。使用加权实际响应变量的分布,评估的条件分布。实际响应变量的分配权重类似于随机森林算法。
考虑到实际响应变量的条件分布Y鉴于预测变量基于一个树 。ϑ被定义为随机参数决定树的生长。现在,假设叶子包含x被表示为 。由此可见,重量 被指定为
考虑到T随机森林的树木可以表示为和是平均的 在每一个单一的树。由此可见,
估计 被定义为
条件分位数的估计为可以计算为
2.3.2。核密度估计
主要的核密度估计可以写在一个紧凑的形式(16]: 在哪里它被称为内核扩展。内核的统计分析估计比直方图更基本。通常情况下, 在哪里是带宽或平滑参数。较小的带宽提供了更不稳定分布,大量带宽宽松的更多细节。插件方法、交叉验证规则重击的所有类型的带宽选择器。不同的内核,如三角形、triweight cos,制服,高斯,Epanechnikov等可以用于核密度估计。在这项研究中,我们使用高斯核的核密度估计,因为它可以自动计算带宽由经验法则(16]。生成一个总概率密度,密度估计是重复的不同的值x。
本文构造了一个混合概率密度预测模型。首先,保持out-of-bag预测。我nbag parameter of the QRF model is set to “True” and node size was set to 5. The obtained conditional quantiles are used as the inputs of kernel density estimation. The Gaussian kernel function is combined with the normal reference density (“nrd0”) bandwidth selection method to implement the probability density forecasting. Figure1给出了实现流程图构建了混合模型的概率密度预测。
3所示。评价指标
3.1。评价指标为点预测错误
不同的评价指标被用来估计点预测的准确性和效率。尽管如此,在这篇文章中,我们使用(日军)平均绝对百分比误差,均方根误差(RMSE)和r平方 。的日军和RMSE值越小,更好的预测模型。的价值就越高 ,越高的拟合优度。日军、RMSE和在方程(数学上定义10)- (12)如下, 在哪里我季度汇率数据,n是聚合季度汇率数据在预测期间,和分别是实际和预测汇率。
3.2。评价指标预测区间
可以使用不同的指标来评估预测区间的效率。预测区间覆盖概率和预测区间归一化平均偏差指标将被用来评估的可靠性预测区间。
预测区间覆盖概率(PICP)被定义为在方程(13) 在哪里是一个布尔变量决定 和n预测的总数。PICP比例越高越好。即大PICP意味着更多的实际的值是由预测预测区间。然而,PICP的价值可以通过增加预测区间的宽度增加。预测区间的宽度应该被测量,确保质量的预测区间。一个狭窄的预测区间给出了一个比一个更广泛的事实信息预测区间。预测区间归一化平均宽度(PINAW)定义如下: 在哪里是实际的最小和最大/目标值。
4所示。案例研究
4.1。数据选择和描述
汇率是由不同的经济控制性能的因素,如:股票价格回报,消费者物价指数、利率、供应数量,外国直接投资,国际和国内贸易,实际国内生产总值(gdp),居民消费价格指数。这些因素之间存在着复杂的相互作用,因此准确地预测汇率是非常复杂的。后的工作17),我们选择了宏观经济变量(特征),考虑几个方面的利益像消费者价格指数(cpi),利率,货币供应量,外国直接投资,实际国内生产总值(gdp),居民消费价格指数。表1提出了本研究中使用的变量的定义和模型中的变量的函数。季度货币供应的二手数据,外汇汇率,加权贷款利率来自肯尼亚中央银行。季度外国直接交换的辅助数据,消费者物价指数(通货膨胀),和国内生产总值也从肯尼亚国家统计局。汇总统计数据采样季度时期从2007年到2016年在桌子上2。从表中,平均汇率,CPI,由商业银行贷款利率,货币供应量,示例时期外国直接投资研究 ,和525046.5。从非参数局部估计散点图平滑(黄土)曲线(深灰色线情节)安装到数据图2,有一个上升趋势在所有感兴趣的变量在此期间。
|
||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
(一)
(b)
(c)
(d)
(e)
(f)
Anderson-Darling常态和Shapiro-Wilk测试是用来测试的正常汇率数据的残差。从表3,前剩余工资的价值小于0.05的显著性水平。因此,我们可以拒绝零假设的正常和得出结论,残差分布数据为例从正态分布明显不同。正常的离职前女友直观地显示数据3(一个)和3 (b)密度图,箱线图和正常quantile-quantile (QQ)图(图4提出了)。例如,有离群值的箱线图和残差数据倾斜。使用不恒定误差方差(NCV)和Breusch为残差同质性、寻呼机测试价值被发现小于0.05的显著性水平在两个测试。我们可以因此拒绝零假设的常数误差方差(同质性),并得出结论,方差是异方差的(不恒定方差)。从上面,很明显,一些主要的普通最小二乘(OLS)回归模型的假设是违反了。因此,我们可以使用一个混合模型使用分位数回归技术和随机森林,揭示了异构特性对目标变量的影响(汇率)对不同分位数。
|
|||||||||||||||||||||||||||||
(一)
(b)
4.2。数据归一化
数据集的数值是更改为一个共同的规模没有扭曲的差异值的范围使用min-max正常化。归一化值范围内 ,和计算使用方程(16)。归一化值更改为实际的大小/观测数据使用antinormalization方程(见方程(17))。 在哪里是标准化的输入值,和分别输入的最小和最大值。
R使用统计软件在实现所有的预测方法。
4.3。实验结果和讨论
的效率提出了高斯核分位数回归森林使用季度数据部分中描述4所示。1在本节中决定。肯尼亚的概率密度的汇率预测给定的值从一个场景设置选择的宏观经济指标。
图5介绍了视觉预测结果out-of-bag (OOB)预测。OOB预测的值是通过引导的实现。“quantregForest”包(18的R使用统计软件。为获得最佳性能的分位数回归森林在这篇文章中,我们选择1100棵树(T= 1100)。图6显示了均方误差和r平方的阴谋。从图中,均方误差r平方在他们的最佳值约为0.005和0.92在200棵树。这表明,最优数量的树是200年。特征选择的数量从整个组功能回归树的每个节点2。out-of-bag预测和节点大小参数分别设置为“True”和5。评价指标为点预测使用提出了均值和中值在表4。的日军值预测中值(0.0217)小于的日军价值意味着预测(0.0265)。的RMSE值平均预测是3.119比2.7146中值预测。与一个R平方值为0.9428,预测汇率使用中值符合的数据相对比的意思。从表4,可以得出结论,使用中值点的预测汇率是明显比点预测使用的意思。一般来说,健身的模型数据在所有情况下都是非常高的。这是明显的R记录的0.9248和0.9248平方值由点预测的平均值和中位数。
(一)
(b)
|
|||||||||||||||||||||||||||||||||||||||||
图7显示了示例时期的季度汇率下的研究。对于每个季度期间,红点代表观察到季度汇率。黑线代表预测汇率百分位。这是上面的线的预测汇率会下跌,低于所有的预测汇率将下跌。OOB预测和预测时间间隔根据观察到的汇率显示,中值预测总是属于预测区间。也观察到95%的汇率值落在预测区间内。这表明QRF可以准确预测汇率。
的主要结论可以通过可视化预测区间图8预测的可靠性,预测区间的长度不同。我们可以得出这样的结论:多数的观察,预测比其他人更可靠(只有两个观察)。表5(见附录)介绍了out-of-bag预测结果,相对误差和预测误差百分比的GQRF使用汇率的季度数据。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
评估的性能提出了高斯分位数回归森林,我们计算的值PICP PINAW。表6礼物的价值PICP PINAW。PICP记录高百分比值95%,PINAW 。这表明所构造的预测区间捕获实际汇率值很好。的小价值PINAW也证明所构造的预测区间的效率。出于演示的目的,并给出了概率密度曲线绘制了四年在图9。概率密度曲线给未来汇率的概率分布。对于每个密度图,平均年度季度观测数据的获取与情节的红线。季度的平均汇率总是属于概率密度曲线。因此可以得出结论,提出GQRF模型可以地面描述汇率不确定性。
|
||||||||||||||||||||||||||||||||||||||||||||||
(一)
(b)
(c)
(d)
预测季度密度汇率(见图9)可以用来计算的概率超过数,例如,汇率的概率将超过98.6975美元/ KSh的平均汇率为2015年。这超过数概率密度曲线的计算,它包括所有的汇率高于100美元/ KSh。密度曲线的面积计算,发现密度函数的积分图9。汇率的概率超过了观察到的平均汇率98.6975美元/ KSh在2015年是0.2899。汇率的概率超过101.5美元/ KSh在2015年是2016年的0.1584和0.7530。这意味着它是不太可能的汇率比2016年超过2015年的101.5。
5。结论
考虑一个长期的汇率预测的问题,本研究提出了一种新的预测方法的画总倾向未来汇率的条件概率密度曲线。分位数回归森林用于建立一个非线性分位数回归概率预测模型。直接插件带宽选择器和高斯内核选择器是用来画出概率密度曲线。的意义提出了高斯分位数回归森林技术捕捉信息的能力使用概率密度预测未来汇率的不确定性函数。使用一个案例研究美国美元之间的汇率(美元)和肯尼亚先令(KSh),我们能够表明,该模型准确执行。PICP和PINAW显示性能和精度高的预测区间由高斯分位数回归森林。超过数的概率值对于一个给定的汇率也可以使用该模型计算。
数据可用性
这项工作可从数据通讯作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
第一作者将感谢潘非洲大学研究所基础科学,技术和创新资助这项研究。
引用
- 大肠Peree和a . Steinherr“汇率不确定性和对外贸易,”欧洲经济评论,33卷,不。6,1241 - 1264年,1989页。视图:出版商的网站|谷歌学术搜索
- c·f·鲍姆·m·恰拉扬,j . t . Barkoulas“汇率不确定性和公司的盈利能力,”宏观经济学杂志,23卷,不。4、565 - 576年,2001页。视图:出版商的网站|谷歌学术搜索
- d .塞雷尼和n . Tsounis”汇率波动和对外贸易:塞浦路斯和克罗地亚,“Procedia经济学和金融学5卷,第685 - 677页,2013年。视图:出版商的网站|谷歌学术搜索
- t .伊藤,s . Koibuchi k佐藤,j .清水”汇率风险和风险管理:日本出口公司的情况下,“日本和国际经济杂志》上卷,41岁,17 - 29,2016页。视图:出版商的网站|谷歌学术搜索
- b . Senadza和d·d·迪亚”,汇率波动对贸易的影响在撒哈拉以南非洲,”非洲贸易杂志,4卷,不。1 - 2,20-36,2017页。视图:出版商的网站|谷歌学术搜索
- l·s·戈德堡”,汇率和在美国的投资行业,“经济学和统计学的评审,卷75,不。4、575 - 588年,1993页。视图:出版商的网站|谷歌学术搜索
- e . e . Asmah和f . k . Andoh汇率波动和外国直接投资在撒哈拉以南非洲,”发展中经济体发展》杂志上,卷2,不。2、2013。视图:出版商的网站|谷歌学术搜索
- d·r·范代芬特尔、k Imai和m . Mesler高级金融风险管理:工具和技术综合信用风险和利率风险管理新泽西州霍博肯市约翰·威利& Sons,美国,2013年。
- t . m . Harchaoui f . Tarkhani t .袁et al .,汇率对投资的影响:来自加拿大制造业的证据渥太华,加拿大渥太华,银行,美国,2005年。
- y方,p .徐、杨j .和y秦,“基于分位数回归森林的方法来预测药物反应和评估预测的可靠性,”《公共科学图书馆•综合》文章ID e0205155卷。13日,2018年。视图:出版商的网站|谷歌学术搜索
- s . a . Gyamerah p Ngare, d . Ikpe”作物产量概率密度预测通过分位数随机森林和epanechnikov内核函数,”2019年,https://arxiv.org/abs/1904.10959。视图:谷歌学术搜索
- r . Koenker和g·巴Jr .)“回归分位数,”费雪,46卷,不。1,33-50,1978页。视图:出版商的网站|谷歌学术搜索
- t . Shaikhina d·劳s数据d·布里格斯r·希金斯和n . Khovanova“决策树和随机森林模型预测结果抗体不兼容的肾移植,”生物医学信号处理和控制52卷,第462 - 456页,2019年。视图:出版商的网站|谷歌学术搜索
- l . BreimanOut-of-Bag估计美国加州大学伯克利分校,加州,1996年。
- n Meinshausen”,分位数回归森林,“机器学习研究杂志》上7卷,第999 - 983页,2006年。视图:谷歌学术搜索
- d . w·斯科特,多元密度估计:理论、实践和可视化新泽西州霍博肯市约翰·威利& Sons,美国,2015年。
- m . Muchiri利率和通货膨胀率的影响在肯尼亚对汇率内罗毕,肯尼亚,内罗毕大学2015。
- n . Meinshausen和m . Nicolai-Meinshausen quantreg-Forest包,2007年。
版权
版权©2020年塞缪尔Asante Gyamerah和埃德温·墨哟。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。