文摘
在中国FinTech已经迅速的崛起。投资共同基金通过robo-advisor财富管理行业已成为一个新的创新。近年来,机器学习,特别是深度学习,已广泛应用于金融业解决金融问题。本文旨在提高分类的准确性和及时性基金通过使用机器学习算法,即高斯混合聚类算法。同时,深度上优于预测模型来预测实现基金的价格运动类根据分类结果。基金分类使用3625中国共同基金显示准确和有效的结果。基于集群的时空整体深度学习模块显示比基线模型更好的预测精度只有有限的数据样本。本文的主要贡献是提供一种新方法用于分类和价格波动预测支持下一代robo-advisor辅助决策的人工智能。
1。介绍
近年来,机器学习和深度学习已广泛用于金融满足金融需求(1- - - - - -5]。作为这些新技术的应用,robo-advisors被越来越多的基金公司青睐,因此,顾问扮演了重要的角色在全球投资和资产配置。40年前自改革开放开始,中国经济已经显示出快速增长,已成为世界上第二大财富管理市场。为了满足居民的财富管理需求,公共资金已逐渐成为财富管理的主要工具之一,因其丰富的投资目标,专业操作,和开放和透明的信息环境。同时,及时补充技术的金融市场,居民的参与成本实现定制的金融服务已逐渐减少。此外,robo-advisors负担得起的普通投资者,这些顾问已经成为的一个主要工具为金融机构开展财富管理创新几个优势,例如,他们可以长期资产配置管理,运用现代投资组合理论与技术,如大数据、云计算和实施。他们还可以自动通过互联网为客户提供基金投资建议,考虑投资者的风险偏好,财产状况,和财务目标。因此,应用人工智能技术优于传统投资顾问通过优化处理一些实际问题遇到传统顾问,例如,削减成本和客户。
有两个步骤robo-advisors需要经历的过程中生成的投资计划:基金选择和资产配置。基金选择可以进一步分为两个方面:基金分类和基金回归预测。在中国,目前的基金分类通常是基于主要的分类(步骤1)发行的中国证券监督管理委员会(证监会)。主要有两种风格的基金由中国证监会分类:股票基金和债券基金。步骤2的分类,股票基金可以进一步分类给出他们的市值和他们持有的风格,而债券基金可分为基于股票的份额在他们的立场。
基金通过机器学习分类而言,通常有两种方法:分区聚类(由k - means聚类)和网络聚类(SOM)表示。划分聚类方法的优点是简单的原则,更少的参数输入,和更快的收敛速度;然而,圆形的形状聚类可能过于简单,会损害分类结果的准确性。网络聚类方法可以有效地处理多维聚类问题,但是它受到维灾害和网络模型相对敏感参数的选择。基金的运动预测、ARIMA、人工神经网络(ANN)和反向传播神经网络(BP)是经常使用的,而他们的弱点,参数难以估计和模型过度拟合。
为了解决上述问题,我们采用高斯混合聚类方法(GMM)。GMM集群可以有效地解决这个问题,形状是太简单了,当使用一个简单的参数。实证分析中,我们使用来自中国市场的数据。我们继续分析使用两步分类进一步区分股票基金和债券基金的风格和特点,我们收集的数据。基于GMM结果,我们使用时空整体深度学习模型来预测每个类别的基金的短期价格波动。然后,我们充分利用集群的概念和整体学习,目的是有效地提高模型的含义和预测能力,特别是大数据的访问是相当有限的。
比较的性能预测基金资产净值的我们的模型,我们比较它与几个基本模型,即剩余网络(ResNet以后)模型,长期和短期记忆网络(LSTM以后)模型,和一维卷积神经网络(CNN,以后)模型。我们检查他们的表现在预测四个主要分类类别的短期回报我们的结果采用平均绝对误差(MAE)和相关系数R2作为评价指标。
我们的主要研究结果如下。我们两步GMM方法可以生成的概率基金属于某个类别,根据他们的风险和回报,从而超越传统的k - means模型分级基金。我们的模型也提高了预测的能力,减少预测误差,基金价格波动与其他模型相比,即。、ResNet LSTM和CNN模型。
本文的主要贡献如下:(1)提出一种新的两步GMM模型有效区分共同基金在中国使用简单的基金特征,(2)我们构造一个深度学习模型来预测不同类别的基金的短期价格波动。
2。文献综述
2.1。文献基金分类
基金分类是基金评价的基础。不同类型的基金需要不同的分析方法和评价维度由于其独特的风险和回报等特点。因此,基金分类保障基金评价的有效性和可比性。有两个基金的分类方法:事前和事后分类分类。事前分类方法决定了基金类别根据其投资目标和策略,基金发行公告中指定。然而,在实际的操作中,指定的信息经常偏离原来的协议。Dibartolomeo et al。6]回归后发现,基金的净值使用威廉·夏普的归因方法,超过40%的股票基金误分类,他们认为错误分类的主要原因是事前的不精确分类方法和事后偏差操纵基金经理由于来自同辈的压力。罗等。7]分类54基金上市通过因子和聚类分析,在中国,他们发现近40%的资金与他们的招股说明书中描述的投资风格不一致。相比之下,事后分类方法指定基金类型基金操作之后根据他们的表现和他们的特点在发行公告中指定。作为这一分类方法的一个改进,布朗et al。8)使用一个因素模型来捕获基金收益的非线性特征并将它们映射到主流的投资经理人风格对基金进行分类。金等。9选择更多的市场特征,通过主成分分析(PCA),基于这些新发现的变量和分类基金。然而,事后分类方法也有局限性,例如,在多个因素回归的共线性。
幸运的是,机器学习的引入降低了传统基金分类方法的局限性,因为它能够捕捉非线性特性和独立的数据特征,例如,样本大小,在无监督学习。马拉松et al。10)分类基金由k - means聚类发现43%的基金样本不符合描述的基金最初的投资类型。他们还发现,许多基金类别下传统的分类方法显示非常相似的风险和回报的特点,因此建议分类分析的引入降低了基金管理的复杂性。Lajbcygier et al。11)认为,基金的界限不同风格应该是连续的,而不是严格的划分。因此,他们使用一个灵活的模糊c均值聚类方法,发现该方法能获得更好的分类结果。Menardi et al。12采用两步聚类方法,第一步是使用PCA降低24基金特征的维数,第二步是分类1436公共资金在这24使用层次聚类类别的特征。对于非线性特征的提取,莫雷诺et al。13]分类1592资金从西班牙市场利用自组织映射神经网络(SOM)和发现与k - means聚类相比,SOM能有效减少误分类。
2.2。文献基金回归预测
亚瑟et al。(1996)认为,金融时间序列本身是嘈杂的,是一个不稳定的过程,这意味着历史信息并不足以解释过去和未来收益之间的关系。他们还认为,金融市场并非完全不可预测由于价格趋势效应的存在。曹et al。(2001)认为,金融时间序列可以预测的单变量和多变量分析。他们认为输入单变量分析模型的时间序列本身,这是预测的自回归移动平均(ARIMA)模型积分。然而,ARIMA的表现并不满意,主要是因为(1)它需要事前估计参数,(2)它假定时间序列是稳定的和线性的,这违背了现实。关于多变量分析、人工神经网络(ANN)的一个主要预测方法由于其容纳更多的信息和能力卓越的性能在处理非平稳过程。Schneburg [14)使用几种方法,如MADALINE和BP模型,来预测股票收益的三家上市公司在德国市场,表明预测的准确性达到90%。Schneburg [14)还发现,BP模型的表现优于其他方法,证实了神经网络在预测的有效性基金的回报。Kimoto [15)使用一个模块化神经网络开发东京证券交易所的交易策略和发现模块化神经网络可以连接更基本的神经网络,帮助生成一个更准确的预测。改进,Vapnik et al。(1996)提出一种新的基于支持向量机(SVM)方法来提高神经网络的泛化解决非线性回归问题。此外,曹et al。(2001)认为,人工神经网络已过度拟合问题,和额外的护理需要参数估计和训练得到令人满意的结果。Khashei et al。16)认为,产生精确的结果需要大量的历史数据,而金融市场充满了不确定性和变化迅速。因此,一种新的混合方法,结合人工神经网络和模糊回归的优点,提出了克服传统人工神经网络的局限性。他们的实证结果表明,该混合模型是一种有效的提高预测精度的方法。刘等人。17和李et al。18]预测股票收益采用CNN-LSTM模型,发现引入一个注意力机制可以帮助改善CNN-LSTM模型的准确性。
3所示。数据
本文使用的数据主要来自风数据库。收集到的数据是完整的样本股票基金、混合基金和债券基金分类口径下的证监会。QDII基金、封闭式基金、可供选择的基金,货币基金不包括在分析由于其特殊性,我们选择的基金。日期2021年4月30日为截止日期。基金已经成立两年多在截止日期之前,总资产超过5000万元人民币的价值,他们的操作期间,未经类型转换。这个选择过程导致的总数3625资金。
基金费用通常包括每日申购费,日常赎回费,管理费,托管费用。本文中使用的基金费用管理费用和保管费用的总和。的值采用费用截至4月30日,2021年。基金的回报,我们关注他们的滚动的回报率,这被定义为资金的比例的复合那天净值基金的净值N天前,N= 1,5、20、120、和250天滚动窗口。人均基金持有者的数量,股票,股票机构和个人持有者,持有的股票购买和赎回的基金经理和市场价值比率的股票和债券基金的总价值收集季度报告。发表时间以来季度报告在基金不同,我们把1月份最后一个交易日,每年4月、7月和10月为观察日获得在此日期之前公布的最新数据。如果没有新的数据发表在最新的季度,将使用前一个季度的价值。表1总结了本文中使用的数据。
4所示。该模型
在本节中,我们开发的模型框架,包括聚类模型和预测模型,如图1。首先,我们集群基金通过GMM使用基金特性在前一节中所描述的,从基金特征的维数降低使用PCA方法。然后,我们开发一个基于深度学习预测模型来预测该基金趋势根据聚类结果。因此,我们将首先简要介绍PCA和GMM。然后详细介绍基于深度学习模型。
4.1。聚类模型
本文使用两个模型进行分析,也就是说,主成分分析(PCA)和高斯混合模型(GMM)。在本文中,我们采用PCA减少滚动资金收益率数据的维数和不同期限用于分类的第一步。
以下4.4.1。主成分分析
主成分分析(PCA)是一种降维方法,即原始特征空间转移到一个全新的功能空间。通常用于数据预处理。例如,假设n基金样本,每个样本基金包含2000个特性。在这些特性中,存在大量的噪声和无用的信息。因此,主成分分析可以进行减少噪音和节省计算资源。表2显示使用的特征值数量和使用PCA的还原性。人能注意到PCA方法具有高度的还原性,还原能力越高,越滚天选择,保持数量的特征值不变。主成分分析的详细描述附录A所示。
4.1.2。GMM
GMM聚类是主要的分类模型,它可以给样本属于某一类的概率。所谓的高斯混合模型的组合多个高斯分布,和它使用似然函数作为参数估计的目标函数。虽然更大样本量可能有助于提高模型的精度,增加样本容量会增加模型的复杂性,可能导致过度拟合问题。因此,我们依靠Akaike信息标准(AIC)和贝叶斯信息准则(BIC)来评估分类的质量。提出了GMM的详细描述在附录B中。
4.2。深度学习模型
整体学习的想法应用到金融领域的研究中,我们建立一个时空的整体深度学习基金价格预测模型。这个模型的基本原理总结了三个步骤。考虑到布局和文章长度,提出了这个模型的组件的描述在附录c。首先,编码(即使用的数据。历史价值的基金)获得数据的语义信息。第二,将编码的数据插入三种基本模型,即剩余网络(ResNet),长期和短期记忆网络(LSTM)和一维卷积神经网络(CNN),训练模型和获得这三个模型的输出。的详细机制ResNet LSTM, CNN附录所示C.1, C.2和C.3分别。第三,计算最终输出;注意机制模型权重进行优化,附录C.4所示的原理。这三个模型是用来提取复杂非线性相关性(ResNet),捕获时间相关性(LSTM),并计算空间相关性(CNN)。在本文中,我们比较的性能与这三个基准模型,我们的模型和结果部分所示5。详细的时空整体深度学习模型和内部结构如图2。
5。结果
5.1。聚类分析
滚动回报的基金在过去的1、5、20岁,60岁,120,和250天作为输入的GMM的第一步,我们依靠AIC来确定最优数量的类别。如图3,当类别(集群)的数量大于10,AIC值开始增加,这意味着最优数量的分类是10。
我们然后测量分类的结果从多个维度GMM的第一步;结果如表所示3。我们开始通过检查的平均比率的市场价值基金的持有的股票和债券基金的总价值(在2020年的年度报告披露)为每个类别。我们定义为每个基金在其市场价值的股票占不到总额的60%,该基金不属于股票基金。因此,一个可以看到类别1和10并不像股票类别的分类,而另一些则被归类为股票类别。此外,类别的平均股票持有10高于第一类。因此,我们定义类别1纯债券型基金,而类别10债券投资基金。注意基金一级债券基金的平均比率值大于100%;这是一个特殊的债券基金的特点,利用杠杆通过回购协议(回购);类似的现象也出现在桌子上4。由于大量的资金在这两个类别(超过500只基金),我们将进行二次分类这两个类别,将表中所示的结果4。
关于其他八个类别分为股票基金,我们进一步定义他们的风格根据以下标准:基金被定义为一个industry-themed基金如果超过30%的投资是在一个特定的行业或如果其持有的50%以上去不到三个具体行业。如果一个类别的基金包含至少50%的基金在同一行业或50%以上的股票这一类industry-themed基金,这类被定义为一个行业类别。以4级为例,最大的行业投资这类药品,和91%的基金(96 106)在这一类投资逾30%的股份在制药行业。因此,这类被定义为pharmaceuticals-themed(行业)的范畴。类别的分类结果如表所示5。
对于其他类别,类别2,6,8,9,属于股票的类别,但发现不是落入industry-themed的风格的,我们进行一个单独分类。第二类,基金持有相当分散,也就是说,没有代表行业。因此,这一类是归类为市场范畴。类别6包含很大一部分的资金投资于中小企业(SME),和持也相对分散的各个行业。因此,类别6作为中小企业市场的分类类别。大多数基金类别内8大蓝筹投资行业,如银行、非银行金融、食品和饮料。因此,类别8是归类为一个大型的风格。类别9是发现有类似特征的类别,而三大产业投资类别9的基金是制药、电子、和科技产业在中国市场的增长。因此,类别9是归类为中小企业增长方式。这些类别的分类结果表进行了总结6。
我们继续进行第二步的分析分类的类别1到10,在图所示的结果4。根据AIC,每个类别的最优数量的集群超过10,这是在真实的场景中不实用。债券基金很难区别纯定量措施由于其低波动性,因此,我们选择做轻微的调整相结合的分类结果与我们的实践经验。我们可以看到,AIC显著减少当集群数量达到3,参与和债券基金通常是分离的股权资产。因此,我们这两个类别的子类别的数量设置为三个区分纯债券基金,债券和股权融资,和特殊用途的债券基金。
子类别的类别1没有过度的杠杆比率,及其在股票份额不到10%,这意味着子类1属于初级债券范畴。子类别2没有在股票,债券的市场价值比其总价值高于子类别1。因此,子类别2可分为纯债券。子类别3被列为一个institutional-customized债券类作为其长期债券的市场价值占总价值的比例高,其平均数量的持有者在个位数,这意味着这些基金主要是由一些机构投资者持有。
对于类别10,持有的股票的子类别1占20%以上,而且没有过度的杠杆。因此,子类别1是二级债券分类。子类别2分为低红利股票的大部分基金投资于低股息的股票。子类别3有一个非常相似的特性子类1股票和债券持有的股票。然而,进一步的调查表明,平均市场价值基金在子类别3小于10亿元人民币(而子类的图1是19亿元),还有一个相对较高的比例混合基金在这个子类。这表明子类别3主要是由固定收益和新基金建立了一级市场的发行新股。因此,子类别3是归类为新股票类别。类别1到10的二级分类结果如表所示6。
测试我们的分类结果的可信性,我们基金的平均每日收益率在每个类别和雇佣几个行业风格指数(我们选择中信类我行业分类指数随着行业指数和我们雇佣Juchao指数风格指数)作为参考。我们进行测试,计算之间的相关系数计算返回在每个类别和参考指数。结果如表所示7。从表可以看到73级已经与中信食品和饮料指数相关性最高,达到了94%。回报之间的相关性在4级和中信医药指数在97%的高位。5级的收益率之间的相关性和中信电力和新能源指数是94%。类别7的回报率有很高的相关系数与中信电力和新能源、计算机、电子和军事工业指标。
表8总结了基金的回报之间的相关性和Juchao风格指数类别2,6,8,9,不列为industry-themed类别,如表6。(因此,行业指数,如中信索引,不恰当的评估其行业分类的结果,而风格指数,例如,Juchao指数更适合他们的风格分类的评价。)从表8,我们可以看到,我们的分类方法具有较高的精度识别这些类别的样式。具体而言,第二类有更高的相关性与市场风格定义的索引Juchao风格指数;类别6接近中小企业市场;类别8类似于市场价值,和类别9中小企业增长。(近年来,基金经理更关注基金的增长,而不太关注价值投资。因此,类别的分类结果8不太明显的风数据库:https://www.wind.com.cn/en/edb.html。)
5.2。回归预测分析
我们使用四个industry-themed类别(即。,categories 3, 4, 5, and 7) for the fund price prediction analysis. The data used is the cumulative return of all funds in these four categories from February 2019 to July 2021, totaling 604 days. The PyTorch deep learning framework is used to build the model; 80% of the data sets are used to train the model, and 20% are used to test the model. The input data is divided into 10 dimensions through embedding. The ResNet model includes 7 layers of fully connected networks, containing 16, 16, 10, 16, 16, 10, and 1 neuron. The LSTM model is made up of 1 layer and 64 neurons. The CNN model consists of three layers, and the number of filters is 8, 8, and 1, with the size of convolution kernel of 3. The batch size of all basic models is 1. The final output is obtained using the weighted summation of outputs of these three benchmark models (i.e., ResNet, LSTM, and CNN). The loss function curve of the model is shown in Figure5,一个人可以注意到损失函数训练和验证集20后变得稳定th迭代,收敛性好。
然后,我们评估我们的模型和三种基本模型的性能使用四个指标:RMSE,美,R2,WMAPE。结果如表所示9和10和图6。可以看到ResNet相对的预测能力最好的在所有类别的问题(与其他基准模型)相比,基于这些指标。例如,所有类别的平均RMSE值是0.034,这是与其他基准模型相比,最低R2是0.96,这是最高等的基准模型。尽管LSTM是最有效的处理时间序列模型问题,它不执行预期的好,RMSE约0.040和的平均值R2约0.95,由于有限的特性和足够数量的样本。CNN的表现不佳,平均在0.037和RMSE值R2约0.95,部分是由于其无法记录历史信息。正如预期的那样,我们可以看到,一个时空的整体深度学习模型有更好的性能在预测基金价格,这减少了意味着RMSE约0.026和改善R2接近0.98。我们可以得出这样的结论,我们的模型大大提高了可预测性,也就是说,预测准确性,基金价格波动与这些基准模型,我们的模型获得最低的(平均)的RMSE值,梅,WMAPE和最高(平均)的价值R2。的改进在于整体学习的优点,弥补了这三个基准模型的优点。
最后,我们展示这些资金的实际值之间的比较与我们的预测价值。结果如图所示7。我们可以看到,预测值和实际值显示高度的相似性。这意味着我们的时空整体深度学习模型生成一个好的预测基金价格,这说明我们的模型可以提供一个合适的申请robo-advisors预测基金价格波动。
6。结论
介绍了一种新颖的基金价格预测工具,即。,a spatiotemporal ensemble deep learning model, relying on fund classification, to predict the price of our selected funds, in the Chinese market. In this paper, we propose a two-step GMM to classify the mutual funds into different categories to ensure the funds classified in the same category have similar risk and return characteristics. We then employ our proposed model to predict the short-term price movement of each fund category.
总结了本文的主要结论如下。(1)与传统的k - means聚类方法和网络聚类方法,我们的两步GMM方法可以生成的概率基金属于某个类别,(2)本文采用整体学习的想法来提高基金价格波动的其他模型的预测能力,即。、ResNet LSTM和CNN模型。(3)我们基金分类基于他们的风险和回报,可有效减轻巨大的波动和障碍的问题在预测过程中,从而提高我们模型的通用性和应用。
合同附件。
答:主成分分析
主成分分析(PCA)是一种降维方法和原始特征空间转移到一个全新的功能空间。通常用于数据预处理。例如,假设n与2000年基金样本,每个样本基金的特性。在这些特性中,存在大量的噪声和无用的信息。因此,可以进行PCA降维,从而减少噪音和计算资源。
承担基金样本的特征矩阵(n, m)n基金样本数量和吗米是该基金功能的数字。主成分分析可以进行如下。
步骤1。计算每一列的均值和减去平均使用每一列,以确保每一列的均值是零。处理后特征矩阵的维数n×米。
步骤2。计算特征矩阵的协方差矩阵。协方差矩阵的维数米×米。
步骤3。计算协方差矩阵的特征值和特征向量。特征值对应的特征向量的一个。按特征值从大到小排序根据列和秩序特征向量。假设有e特征值,特征向量矩阵的维数米×e。
步骤4。最后的数据处理后的特征矩阵相乘得到的特征向量矩阵。最终数据的维数n×e。
第5步。从所有主要部件选择合适的主成分。假设e特征值是 从大到小。之后,保留相对应的主成分k特征值,保留方差的百分比可以通过以下方程:
b . GMM
高斯混合模型(GMM)是一种概率聚类模型。不同于k - means聚类模型,GMM的概率可以给一个样本属于一个类别。例如,混合基金可能属于消费者范畴和技术范畴。因此,这种聚类方法是实用和解释基金集群。
GMM的组合几个高斯分布。假设有k基金样本的高斯分布。的概率密度函数示例显示如下方程: 在哪里x遵循混合正态分布 , 是向量与手段,协方差矩阵的维度k×k,和的均值和方差是吗我th高斯分布,是一个高斯分布的混合系数, ,和 。一个高斯分布的概率密度函数所示以下方程:
如前所述,GMM参数混合系数,均值向量和协方差矩阵 。采用最大似然估计方法进行参数估计。最大似然函数显示为方程(B.3)。似然函数的解析解无法获得,所以采用的最大期望(EM)算法进行参数估计。
因此,第j的概率样本属于第i个高斯分布显示了以下方程:
基于上述分析,认为基金样本的特征矩阵(n和米),n基金样本数量和吗米是该基金功能的数字。然后GMM可以进行如下:
步骤6。初始化k高斯分布的参数 。
步骤7。E步骤:计算每个样本属于每个高斯分布的概率根据方程(B.4)。
步骤8。M步:更新平均向量和协方差矩阵的高斯混合分布。
第9步。步骤2和3重复直到损失函数的增加小于预设阈值或达到最大迭代次数。损失函数所示的似然函数方程(B.3)。
第10步。输出每个样本属于每个高斯分布的概率和集群的样品属于最大的概率。
我们应用Akaike信息准则(AIC)对聚类结果进行评估。AIC评估统计模型是一个标准,可以用来测量模型复杂性和拟合优度。它可以获得所示以下方程:
在哪里k是一个参数,表示模型复杂性和l似然函数的值,代表模型拟合优度。一般来说,AIC值越小,降低了模型的复杂性,模型拟合优度越高,和更好的整体性能模型。
基于深度学习预测模型
C.1完全连接神经网络层
FCNN通常是多层感知器机,包括输入层、隐层和输出层。在这项研究中,我们将介绍剩余的概念网络(ResNet) FCNN,称为残余FCNN (R-FCNN),即添加一个残余FCNN连接,以缓解问题的梯度和梯度爆炸消失在深神经网络。
2015年提出ResNet如图8与方程(C.1)。假设输入是X和输出F(X)。的F(X)通常包括卷积和激活等操作。ResNet是添加输入的想法X函数的输出F(X),如方程所示(C.1),它可以用来描述输入和输出之间的非线性关系。没有使用新的公式和理论,剩余的连接只是改变一个新的表达,以解决问题的梯度和梯度爆炸消失在深网络培训。
R-FCNN的架构图所示9。在这项研究中,R-FCNN主要用于提取输入信息和输出之间的非线性相关信息。嵌入后的输入是语义向量,输出向量只包含一个元素,也就是说,某些基金的基金平均价值范畴在接下来的时期。
C.2长期短期记忆层
递归神经网络(RNN)如图10是一种强大的神经网络,可以处理不仅时间序列图像。RNN不仅包括当前的输入信息,但也之前的信息。可以记住历史信息的神经元,然后向前穿过一个前馈神经网络。数据流方程所示(C.2),是激活函数,是当前时间步的输入,上次保存的历史信息的步骤,然后呢W,U,V权重矩阵。
然而,当处理长时间序列数据,RNN可能遇到梯度消失或梯度爆炸的问题,这使得RNN只有短期记忆,也就是说,RNN只能获取附近的信息序列在处理长序列数据但没有早期的记忆功能序列,从而失去信息。为了解决这类问题,LSTM Hochreiter et al . LSTM提出的结构也是一种递归神经网络,主要用于解决常见的问题RNN不记得长历史信息。数据流方程所示(C.3),c存储单元矩阵;指出了阿达玛产品;的初始化c和h是零; ,双曲正切,和乙状结肠激活函数;W,U,V权重矩阵;和b是偏差向量。
一个LSTM细胞图所示11,其中包含三个大门,输入门(我t),忘记门(ft),输出门(ot)。他们确定哪些信息可以输入信息可以被忘记,哪些信息可以输出,分别。还有一个存储单元(ct),记录系统的当前状态和控制三个门。
在这项研究中,LSTM主要应用于基金数据序列中提取时间信息。输入和输出是一样的R-FCNN,嵌入后的语义向量作为输入和一定的基金类别的基金平均价值在未来时期作为输出。
C.3卷积神经网络层
cnn包含一个、两个、三维卷积神经网络。输入数据的三个操作对应于不同的维度。输入数据的一维卷积神经需要一维,相当于完全连接层的卷积操作,如图12。内核在卷积操作从左向右移动得到最终的输出。一维CNN主要用于提取输入信息和输出信息之间的空间相关性。通过多层卷积核的卷积运算,单个元素之间的相关性和所有其他元素输入信息的有效提取。
因为基金数据是一维的,我们应用一维CNN来提取基金数据序列的空间相关性。嵌入后的输入是语义向量。CNN的输出是由一般完全连接连接层减少维度。最终的输出完全连接层的某一基金的基金平均价值范畴在接下来的时期。
C.4注意力机制
三种层次的输出具有相同的形状。因此,我们引入一个注意力机制来衡量输出,得到最终的融合输出根据方程(C.4)。 在哪里 , ,和从三种输出层。最后预测输出,即某一基金的基金平均价值范畴在接下来的时期。可以学到相应的重量参数,在培训过程中,捕捉不同影响程度的不同输出。“○”表示阿达玛的产品。
数据可用性
本文使用的数据主要来自风数据库。数据可从作者要求。
的利益冲突
作者宣称没有利益冲突。