文摘

中国的货币,人民币,发展成为国际货币。因此,有效的策略交易人民币汇率对国际投资者的吸引力和决策者。在这篇文章中,我们构建了混合EMD-MLP模型预测人民币汇率和开发了一个基于这些模型的交易策略。实证结果表明,该混合EMD-MLP 基于NMSE和模型总是表现最佳 标准当预测期大于5天。此外,我们比较模型的性能使用不同的视野,发现精度会增加预测的增长视野;然而,NMSE将变得更大。最后,我们采用表现最好的模型预测视野较长的开发交易策略在考虑盈利的交易活动的数量。如果我们考虑交易成本0.3%,发达的策略将年回报率超过10%,以及足够的交易机会。

1。介绍

中国政府仍在人民币国际化的过程中,在个人投资人民币外汇交易变得越来越重要,企业财务决策,政府的经济政策、国际贸易和商业。人民币已经从政策制定者,因此吸引了越来越多的关注全球投资机构和企业家。这是2015年发现的一个反射的全球银行间金融电信协会(迅速),人民币已经取代日元成为世界排名第四的支付货币。第一个里程碑在人民币国际化的过程中是在香港人民币离岸中心的建立于2004年。2008年12月,中国总理宣布人民币跨境贸易结算的试点项目,使离岸人民币在香港正式交付。2010年7月19日,人民币的离岸市场正式开始。最近文献[1- - - - - -4)发现,人民币波动影响地区的货币。

由于人民币的重要性,本研究的目的是创建一个可靠的预测模型,并提供一个可能的应用程序元设计交易策略。两种当前利率交换美元(美元)到中国元将被考虑。如果人民币在岸交易(中国大陆),它被称为元,如果交易海外(主要是在香港),它被指定为人民币。因为在岸和离岸市场可能有不同的反应取决于金融市场变化,人民币和人民币并不总是在同一价格水平。克雷格等。5和凡克等。6)详细研究CNY-CNH定价差异。

能够很好的证明,汇率系列被认为是非线性和非平稳的时间序列,交互式地受到许多因素的影响,这使得准确的预测汇率相当具有挑战性。在过去的几十年里,传统的计量经济学和统计技术,包括自回归移动平均(ARIMA)集成,协整分析、向量自回归(VAR),和误差修正模型(ECM),已经广泛应用于外汇汇率预测。然而,在现实的金融市场中,汇率系列非线性,很少形成纯粹的线性组合(7- - - - - -10]。因此,上述传统模型总是提供不可靠预测如果继续应用这些传统的计量经济学和统计模型。这一缺陷的主要原因是传统的计量经济学和统计模型构建基于线性假设,这将无法捕捉隐藏在汇率系列的非线性特性。

考虑传统计量经济学和统计模型的局限性,许多非线性人工智能(AI)模型,如人工神经网络(ANN) [11,12),前馈神经网络(FNN) [13,14),支持向量回归(SVR) [15- - - - - -17),和遗传编程(GP) (18,19),已应用于调查金融时间序列的预测能力。Yu et al。20.)提供一个完整的评估汇率预测和安也介绍SVR和全科医生。然而,许多基于ai模型也有自己的缺点。安为实例,通常患有过度拟合和局部最小值,而其他模型,包括医生和SVR,敏感的参数估计。最近,由于复杂的汇率系列的特点,一些研究表明,单一模型无法捕获的所有特性和作出准确的预测21]。

为了克服以上缺点,许多研究者开始依赖于混合模型准确地预测汇率系列。组合预测方法使我们能够获得一个方法的动力学相结合的数据从不同的个人技术获得的预测。Alvarez-Diaz和阿尔瓦雷斯22]试图利用非线性结构通过构建遗传编程和神经网络组合方法和应用这个复合方法预测日元/美元和英镑/美元汇率。其他学者也尝试提高汇率的预测的准确性系列运用混合预测模型。例如,赵和杨23和黄等。24使用模糊聚类和安金融时间序列预测。Yu et al。25)提出一个在线数据驱动的大型石油消费预测模型基于谷歌趋势相结合的关系调查和预测的改进。Yu et al。14)设计一种新颖的集成预测方法对于复杂时间序列稀疏表示的耦合(SR)和前馈神经网络(FNN),即,SR-based模糊神经网络方法。

经验模态分解(EMD)技术是首次提出由黄等。26]。从理论的观点,EMD适用于时间序列数据而言,将原始数据分解为组件,可以预测任务分解成更简单的预测子任务。这些分解由一个有限的和经常的固有模式函数(货币)和一个残余。从金融实践的角度来看,各种经济活动可能导致不同的周期性对汇率的影响;例如,该公司的财务报告季度发布,但政府经济指标通常是每年出版一次。EMD可能有助于分解这些影响并导致改进预报工作。有几项研究采用EMD方法混合模型。例如,Yu et al。27]预测原油价格与EMD-based神经网络模型;陈等人。28)也将EMD和ANN方法预测旅游需求,和林等。29日)提出一个混合模型使用EMD和SVR对汇率预测。在这个实证实验中,原来的人民币或人民币价格系列、非线性和非平稳的特点,分为几个独立的子系列的EMD方法,然后部分或所有货币和一个剩余用于预测。唐et al。30.]结合集成经验模态分解(EEMD)与随机向量功能链接(RVFL)网络,找到该EEMD-based RVFL网络执行更好的预测精度比不仅单一算法如RVFL网络,极端学习机(ELM),内核岭回归,随机森林,反向传播神经网络,最小二乘支持向量回归、自回归综合移动平均线,但也各自EEMD-based合奏变体。我们总结表1这些研究对个人的主要特征和混合预测方法在最近的文献。

本研究将集中在使用ANN预测不同预测视野的1元,5、10、20、30天。然而,黄等。32)表明,ANN执行比随机游走,而预测地平线小于5天,但是时间视野,如10和30天,安的一般性能比随机游走模型。在这项研究中,一种前馈人工神经网络模型,采用多层感知器(MLP)。纯延时模型的实证研究不仅包括与EMD也是一种混合模型,提高预测的性能。

在这项研究中,中长期规划相结合的混合预测模型和EMD的工作类似于et al。27]。然而,这项研究进一步考虑货币的影响,不同级别的频率。具体而言,更高的频率首先可以被视为噪声组件,当我们的预测地平线了。基于这一概念,提出了两种混合模型和命名EMD-MLP EMD-MLP 比较这些纯粹的中长期规划,调整前的原始时间序列数据减去更高频率的货币基金,然后使用延时计算一天的提前预测。的EMD-MLP 模型适用于“分治”的原则构建一种新的预测方法,在这部分或全部使用货币和一个残余。根据经验证据在这项研究中,两种类型的混合模型优于纯延时模型,是否与1 - 5 - 10年、20年或者30天预测的视野。此外,提出了交易策略的应用。虽然交易成本可以使利润几乎消失或变得消极,阿尔瓦雷斯Diaz证明(31日甚至],实证分析表明,考虑每个贸易0.3%的交易成本,交易策略基于EMD-MLP,平均年化收益超过10%。

在本文中,我们将研究人民币汇率预测和发展相关的交易策略的基础上,构建模型。的主要贡献来自于三个方面。首先,本研究关注的是人民币,包括在岸人民币汇率(人民币)和离岸人民币汇率(人民币)。我们将使用每日数据预测人民币汇率基于三种类型的模型用不同的视野,即。、延时、EMD-MLP EMD-MLP 第二,我们将考虑不仅延时模型,而且混合EMD-MLP EMD-MLP 预测模型来提高性能。应该注意的是,EMD-MLP 提出的方法不同于et al。27]。我们把一些国际货币基金组织组件作为噪声因素和删除它们减少人民币的波动。最后,我们将选择最佳的预测模型构建交易策略通过引入不同的关键数字,考虑不同的交易成本。

本文的其余部分被组织在以下方式。部分2安和EMD的简要描述。整个预测过程和模型符号的三种预测模型也包含在这部分。节3,两种货币汇率的美元人民币元,人民币,用于测试该方法的有效性,和所选模型应用于交易策略。本研究的结论提出了部分4

2。方法

2.1。人工神经网络(ANN)

本研究认为基于误差反向传播算法的延时。图1显示了一个简单的延时结构有三个输入节点(X1,X2,X3)。一个隐藏层由四个隐藏节点和一个输出节点(Y)。节点组织成层通常由权重完全连接,标明相应的节点的影响。隐层和输出层的每个节点,所有数据都是首先由集成处理函数(也称为求和函数),将所有传入信号,其次由活化处理函数(也称为传递函数),而转换的输出节点。一般来说,隐藏层的数量小于3,由于收敛限制。

特别是延时模型拟合训练数据,然后测试数据和样本外数据集被用来验证其预测性能。通过监督学习算法,参数(权重和节点拦截)调整迭代过程的预测误差函数最小化。在形式上,MLP与输入层n节点,一个隐藏层组成的J隐藏节点和一个输出层和一个输出节点计算下列功能: 在哪里 所有输入变量的向量, 输出节点的拦截, 的拦截jth隐藏节点, 表示重量对应节点开始jth隐藏节点到输出节点 表示重量对应节点开始输入节点j隐藏的节点。因此,所有隐层和输出节点计算函数 ,在哪里 表示集成函数,它被定义为 , 表示激活函数,它通常是一个有界不减少的非线性和可微函数。在这项研究中,物流功能( )用作激活函数。

给定的输入 和目前的重量与标准正态分布随机值,初始化中的延时产生一个输出 然后,一个定义误差函数。本研究选择了均方误差如下: 在哪里N数据样本的数量和吗 是观察到的输出。在迭代训练过程中,重复上述步骤适应所有指定标准重量,直到实现。为了找到一个局部最小值的误差函数,有弹性的反向传播算法修改的重量在相反的方向偏导数。根据Riedmiller和布劳恩(34),调整权重由以下规则: 在哪里tk分别索引迭代步骤和权重。为了加快收敛,学习速度 如果增加相应的偏导数保持相同的迹象;否则,它将减少。

2.2。经验模态分解(EMD)

在这项研究中,我们进一步运用EMD将时间序列分解成几个货币基金和剩余的残留物。这些货币基金通常满足两个条件:第一,极值和零交叉的数量必须相等或不同的不超过一个。其次,信封的平均值,它包括局部极大值和极小值,必须是零分。

由于时间序列数据 ,黄等。26提出一个筛选过程分解 第一步是识别所有局部极大值和局部最小值 然后,上、下信封是由样条线连接所有局部极值。接下来,指着信封,平均值 计算从上部和下部的信封。然后,它遵循计算的第一个国际货币基金组织(IMF) :

如果 不满足上述两个条件,本研究把 作为一个新数据系列和重复过程(4)。因此,我们计算

在这个计算, 的平均值上下信封的

重复同样的步骤,直到会议两种情况下,我们得到了第一个国际货币基金组织的组成部分 , ,这是

信封的停止规则表明,绝对值意味着必须小于指定的宽容度。在这项研究中,公差水平的标准差来标示 乘以0.01。其他有趣的停止规则可以在黄等人的作品。26和黄、吴35]。

提取后的组件 ,我们表示另一个系列 ,除了其中包含所有信息 黄等。36)建议筛选停止准则 成为一个单调函数或不能提取更多的货币。最后,时间序列 可以表示为 在哪里n货币基金的数量和吗 是最后的残渣,代表数据的集中趋势系列 这些货币基金近互相正交,都几乎为零。根据上面的属性,可以预测这些估计预测分解和总结

2.3。整个预测过程和模型符号

考虑到时间序列 , ,我们想要预测l天的时间提前,这是表示 在这项研究中,输入变量(过去的观测)包括 , , , ,代表过去的价格水平60天,20天,10天,分别最后5天。输出是l天的提前预测。形式上,它可以显示如下: 在哪里 是一个函数由神经网络训练和 是一个中长期规划权向量的所有参数。

在这项研究中采用三种预测模型。第一个是纯延时模型与一个和两个隐藏层。第二个是一个EMD-MLP模型,它使用EMD减去一些挥发性首先从原始数据系列,然后使用新数据系列来计算最终的预测中长期科学技术。图2表明EMD的过程(1)延时模型,这意味着第一个国际货币基金组织的组件将被忽略。第三种模式是EMD-MLP命名 ,通常包括以下四个步骤:(1)原始时间序列分解为国际货币基金组织的组件和一个剩余组件通过EMD(2)确定有多少使用国际货币基金组织(IMF)组件,这取决于预测周期的长度(3)每个选择的国际货币基金组织和残余组件的模型作为预测工具,这些组件并做出相应的预测模型(4)所有预测结果添加到一个值,它可以被视为最后的原始时间序列预测结果。

作为一个例子,图3代表上述EMD(1)中长期规划的程序 模型。时间序列数据是通过EMD分解并生成n国际货币基金组织(IMF)的组件, ,和一个残留 除了 ,我们预测每个分解然后和他们作为原始时间序列的预测结果。

3所示。经验的实验

3.1。数据

两种货币汇率美元元被认为是在这个研究。如果人民币在岸交易(中国大陆),它被称为元,如果交易海外(主要是在香港),将它命名为人民币。时间序列数据都从彭博下载。元,日常数据从1月2日,2006年12月21日,2015年,共有2584个观察检查。自从CNH正式开始7月19日,2010年,其样本期从1月3日,2011年12月21日,2015年,共有1304个观测。训练神经网络模型,三分之二的观测随机分配到训练数据集,其余作为测试数据集。此外,需要注意的是,使用时间序列在价格水平在以下的分析中,而不是作为回报水平。

根据描述部分所示3.2,EMD方法用于人民币和人民币价格系列分解成几个独立的货币和一个剩余组件。元的分解结果和CNH代表人物45。比较这两个数据,原始数据系列和分解似乎不同,这是由于不同长度的样品时间。事实上,他们的货币基金有类似的特征。首先,关注样本时期2011 - 2015,剩余组件具有相同的趋势。大约在6.5开始,有些许下降到6.2,然后略微上升到6.5。第二,swing的高频货币基金也短,高频的平均绝对值的货币基金与低频小相比。例如,在一系列的元,绝对的值 , , 分别是0.00298,0.00596和0.02002。在我们的估计模型中,没有必要包含所有的高频货币基金,作为考虑高频首先可以减少预测周期长时预测的准确性。因此,在模型EMD-MLP, IMF高频被运用时间序列。在模型中EMD-MLP ,不仅是所有选择的分解预测汇率,但也考虑使用分解进行预测的一部分,丢弃IMF高频系列。

3.2。实验结果

两个主要标准被认为是在这个实证实验:规范化的均方误差(NMSE)和定向统计( ),评估水平的预测和定向预测,分别。通常情况下,以下(37),NMSE定义的 在哪里 指的是测试数据集包含 观察, l天的提前预测, 是实际值, 的方差 显然,NMSE是最重要的一个标准测量预测模型的有效性,但从业务的角度来看,提高定向精度的预测可以支持决策,以创造更大的利润。此外,Diebold-Mariano (DM)测试38]采用调查添加EMD是否能提高模型的预测性能。具体来说,零假设是EMD-MLP(或EMD-MLP )模型预测精度低于相应的网络模型。例如,对于EMD(1)中长期规划(5,3),相应的中长期规划模型推断(5,3)模型。

除了NMSE评估、定向统计( )应用于测量的能力来预测运动方向(27,39),这可以表示为 在哪里 如果 否则。Pesaran和Timmermann40)提供定向精度(DAC)测试检查预测性能。在这种情况下,DAC测试用于确定 明显大于0.5。我们也采用Anatolyev和Gerko提出的超额盈利能力测试41在每一个相关的实证研究。因为这两个测试产生相同的结果,我们只报告DAC测试的结果在以下实证研究。

2比较了预测性能,NMSE而言,中长期规划,EMD-MLP, EMD-MLP 模型。NMSE报道的比例l天的提前预测, 和30。为每个预测期间,指定的最低NMSE粗体字体。面板的表2显示中的延时模型的实验结果。很明显,在预测期间,增加NMSE变得更大,表明减少预测的准确性对延长预报期。同时,中长期规划更复杂的模型有两个隐藏层不提供更好的预测准确性和更糟的是天提前预测。

实证结果讨论了EMD-MLP面板B表2。EMD(1)延时对IMF最高频率 噪音和减去后应用模型 系列从原始时间序列。实证结果表明,NMSE天提前预测急剧下降;然而,改善提前5天与EMD(1)延时模型预测是有限的。EMD(2)延时模型,扣除这两个最高频率国际货币基金组织(IMF)系列,执行比EMD(1)延时模型预测未来5天的实验。同样,EMD(3)延时模型表现得更好当预测期超过10天。结果EMD-MLP 模型面板表C所示2。虽然计算过程更为复杂,EMD-MLP的预测性能 总是比MLP或EMD-MLP模型。根据NMSE的标准。此外,随机游走模型有或没有,虽无漂移(随机游走模型预测,未来所有的值等于过去观测值。给定一个变量Y,k提前预测的时期tY 随机游走模型和漂移的k提前预测的时期tY ,在哪里 估计的平均变化 在过去的60天)是用来检查相同的数据。面板D表中相关的结果2表明,MLP-EMD MLP-EMD 模型,其性能明显优于随机游走模型在大多数情况下。

3基于上述模型的预测性能 ,这显示了NMSE标准相似的实验结果。表中显示,如果EMD(2)中长期规划(5,3) 应用于预测的方向元系列30天后,打击率可高达86.39%。一般来说,尽管EMD-MLP的计算 更复杂的模型,预测能力似乎是最好的拟议的模型。频率最高的国际货币基金组织因此视为噪音和EMD(1)中长期规划 用于预测。通过这种方式,选择模型的性能相对较好,基于NMSE和 标准。除此之外,值得注意的是,长期预测的性能比短的直觉。NMSE而言,上面的实验结果是一致的观点,即。,NMSE性能预测20到30之前很差。但是, 性能是完全不同的;我们的结果表明,长期预测往往更高 (为了验证鲁棒性,我们也用四分之三的观察作为训练数据集重新审视的结果表23。相关的结果如表所示45。此外,我们认为是一个双曲正切函数作为激活函数和相关报道结果表67)。

除了上面的实验中,元数据集,CNH系列从2011年到2015年被认为是。我们使用相同的方法,将数据划分为训练集和测试集。根据实验结果表23,我们不报告延时模型,只有采取一些EMD-MLP EMD-MLP 模型进行预测。NMSE和统计结果 如表所示89,分别。

89表明EMD-MLP 模型执行比EMD-MLP NMSE和模型 标准。比较的结果和CNH系列,元人民币的NMSE是发现不到的CNH平均而言,无论多长时间的预测。主要原因是原来的元系列的波动小于CNH系列。为 测试部分,预测性能改善预测的增长时期。同时,发现无显著差异的结果,CNH系列基于元 标准。提前预测超过20天,击中率超过89%。即使对于预测未来,以 可以达到79%以上。

3.3。应用交易策略

这部分介绍了一个应用程序设计的交易策略元(自人民币和人民币的情况下,从2011年到2015年,产生类似的结果,我们不报告摘要后者)。结果显示在表中23,NMSE和 ,最好的预测模型l天的时间可以确定。可以训练预测模型基于过去汇率系列和生产l天的提前预测。根据预测结果,交易策略设置如下: 在哪里 l天的提前预测年代τ是一个重要的数字。我们长(短)如果元l天的提前预测更大(小)比现在价格乘以 因此,除非 ,人们总是在时间进行交易年代并保持它l天。例如,考虑这样一种情况 如果 我们使用EMD-MLP模型 ,我们立即长元,拿了10天。相反,如果 ,我们短。

设置的原因τ来自于以下几个方面:第一,当我们设置 ,交易的数量必须是非常大的。因为高频交易有极高的交易成本,侵蚀利润不应该被忽视,它通常使交易策略在现实中失败。因此,让τ大于零的数量可以减少交易。更重要的是,τ可以被视为一个置信水平指标,产生长期和短期交易的阈值,也就是说, 只有当l天的提前预测 大(小)比阈值,我们长(短)元。具体地说,当我们设置 ,表示,如果预测价格超过当前价格1%以上,我们买它;相反,如果价格超过目前的价格预测不到1%,我们短。符合实际情况,实证分析也考虑交易成本的年回报率0.0%,0.1%,0.2%,和0.3%,分别。

10讨论了上述交易策略的性能 ,基于最佳模型,根据表选择23。它显示最佳的性能模型与不同的预测时间。最后四列所示的回报已经调整年回报率使用不同的交易成本。首先,它可以看出越大l是,这意味着预测周期较长,标准差越大。如果没有交易成本,返回随预测期的增加而减小l。例如,在面板,选择预测的1天内 和零交易成本,每年的回报率将达到13.59%,选择最佳性能模型EMD(1)中长期规划(3) 然而,扩展预测期30天,返回与最佳性能模型将成为4.59%。

然而,如果交易成本被认为是,很明显,返回增加随着预测时间变得更长,这是相反的情况不存在交易成本。遭受重大的年回报率下降短期预测期之后考虑到交易成本,因为短时间内的年回报率是重要的高频交易成本所抵消。例如,0.3%的交易费用,提前30天的年度最佳性能的回归模型预测是积极的,只有2.09%,但EMD的年回报率(1)中长期规划(3) ,这是最好的性能预测前方,以达到低−61.41%。增加的年回报率降低交易成本对于每个预测阶段。

面板B和C,分别显示交易策略基于最好的模型时的性能 天预测情况下忽略了在这个实验中,因为天期的预测价值不超过τ。第四列的标准差随预测的增长时期。这两个板的另一个发现是,年回报率降低交易成本变大,相同的预测,这是类似于面板a。然而,同样的交易成本,增长的年回报率降低预测的时期,这是与面板的局势答:这可能是设置的结果τ= 0.5%或τ= 1%;年回报率不会侵蚀了交易成本。

当我们设置τ提前5天预测= 0.5%,尽管不同的交易成本的平均年回报率是至少21.78%,只有32总共832个交易日的交易活动。然而,在选择长期预报,如提前20天,交易活动是220年以8.4%的年平均回报率。在面板C,交易活动是低于面板b .如果0.3%的交易成本τ= 1%,30天的提前预测的年回报率将超过10%,有超过130的交易活动。可以看出,交易活动减少数量增长的关键τ。总之,应用EMD-MLP 预测人民币可能产生一些有用的交易策略,甚至考虑合理的交易成本。

4所示。结论

摘要人民币汇率预测研究和交易策略是基于开发的模型构建。在这项研究中有三个主要贡献。首先,由于人民币的影响力增长在最近几年,我们关注的是人民币,包括在岸人民币汇率(人民币)和离岸人民币汇率(人民币)。我们每天使用的数据预测人民币汇率基于三种类型的模型用不同的视野,即。、延时、EMD-MLP EMD-MLP 我们的实证研究验证这些模型的可行性。其次,为了发展可靠的预测模型,我们认为不仅延时模型,而且混合EMD-MLP EMD-MLP 预测模型来提高性能。在所有选定的模型,EMD-MLP 方面的表现最好,NMSE和 标准。应该注意的是,EMD-MLP 提出的方法不同于et al。27]。我们把一些国际货币基金组织组件作为噪声因素和删除它们减少人民币的波动。实证实验验证上述过程可以明显改善预测性能。例如,表1表明EMD最好的模型(1)中长期规划(3) ,EMD(1)中长期规划(5,3) ,和EMD(2)中长期规划(5,3) 最后,我们选择最佳的预测模型构建交易策略通过引入不同的关键数字,考虑不同的交易成本。因此,我们放弃的交易策略 自年回报率大多是负面的。然而,鉴于 ,所有的年回报率是5%以上,甚至包括交易成本。特别是,通过设置τ交易成本= 1%与0.3%,超过10%的年回报率在不同预测的视野。因此,这个交易策略可以帮助投资者对人民币交易的时间做决定。

随着中国政府继续推动人民币国际化,人民币外汇交易在个人投资变得越来越重要,企业财务决策,政府的经济政策,国际贸易和商业。本研究试图应用神经网络预测金融和贸易领域。在实证分析的基础上,预测的准确性和交易人民币汇率可以增强的性能。考虑此方法的性能,研究应该有吸引力不仅向决策者和投资机构,而且个人投资者对人民币汇率或RMB-related产品感兴趣。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关的出版。

作者的贡献

本文所有作者同样做出了贡献。

确认

这项工作是由中国国家自然科学基金(国家自然科学基金委。71961007,71961007,71561012)。也支持部分由人文社会科学项目在中国的江西省(JJ18207和JD18094)和科技项目的教育部门在中国江西省(GJJ180278, GJJ170327, GJJ180245)。