文摘
作为一个最受欢迎的财务管理方法,吸引了越来越多的投资者参与股票。股票投资的风险也相对较高。如何降低风险和增加利润已成为投资者最关心的问题。传统的股票预测模型使用基于股票时间序列分析预测模型,但时间序列模型不能考虑到投资者情绪对股票市场的影响变化。为了使用股票市场投资者情绪信息更准确的预测,本文建立一个股票指数预测和基于时间序列的网络安全模型和深度的学习。基于时间序列模型,提出利用CNN提取深入情感信息来代替基本情感的情感特征提取的水平。在数据源上水平,其他信息来源,如基本特征,介绍了进一步提高模型的预测性能。结果表明,该算法是可行的和有效的,可以更好地预测市场股票指数的变化。这也证明了多个信息来源可以提高模型预测的精度比单一信息源更有效。
1。介绍
金融是一个国家的重要核心竞争力,和其在国民经济的比重逐年增加(1]。作为金融服务体系的重要组成部分支持实体经济,股市也将成为国家核心竞争力的一部分(2]。随着国民经济的蓬勃发展,强有力的政策支持,并逐步改善公众对财务管理的认识,越来越多的机构和个人积极参与股票市场交易(3,4]。对相关金融服务的需求也跟着,所以股票价格预测已经成为一个问题,专业的分析师和投资者高度重视它5]。随着股票市场对经济的影响趋势,预测股市的趋势已成为一个研究的热点话题。许多研究人员进行了科学、细致的研究股票市场,试图制定股票市场的运行规则。然而,研究结果发现,股票市场的变化似乎不相关(6,7]。
有效市场假说理论提出的尤金名声更权威的解释在当前金融圈来研究股票市场变化的规律。在这一理论,股票价格主要受未来信息,即新闻,而不是由现在或过去的价格(8- - - - - -10]。作为一个长期关注资本市场,股票市场预测吸引人们使用各种方法相关研究由于其可预见的和慷慨的回报。预测方法的改进,进一步提高了预测的结果(11]。
例如,林等人提出了一个端到端混合神经网络,利用卷积神经网络(cnn)提取数据特征,并使用递归神经网络长期和短期记忆捕捉长期依赖的历史趋势序列学习的时间序列。上下文特征预测股票市场价格的趋势(12]。胡等人设计了一个混合的关注网络(汉族)来预测股票趋势基于相关消息序列(13]。李等人提出了一种多任务递归神经网络(RNN)和高阶马尔可夫随机域预测股票价格的运动方向(14]。通过一个多任务RNN框架,特征信息提取原始市场数据的个股。大多数投资者的投资决策都不是仅仅通过技术分析的上市公司。因此,技术分析可以结合新闻提供给投资者和情绪反应新闻来定量预测股票的价格走势(15]。传统的股票预测模型采用基于股票时间序列分析预测模型,但时间序列模型不能考虑到投资者情绪对股票市场的影响变化。为了使用投资者情绪信息更准确地预测股票市场,本文建立一个股票指数预测模型基于时间序列和深入学习。基于时间序列模型,提出利用CNN提取很深的情感信息来代替基本情感特性在情感提取水平。
2。相关技术概述
2.1。网络安全概述
网络安全形势预测指的是时间序列预测未来网络安全状态的一段时间根据当前网络环境状态结合历史数据网络的安全形势,以便提前预防可能的网络攻击(16]。情况下元素的提取是网络安全态势感知的基础。全面、准确的网络安全情况数据收集和建立的有效性情况指标体系是重要保障态势评估的正确性(17]。情况下元素的提取要求情况指标可以从网络环境中提取根据指标体系建立情况(18,19]。一系列技术处理后的清洗、集成,减少转换、融合,他们将被用作情况元素随后情况评估和充分准备的情况预测。相关技术情况元素提取包括情况指数提取和数据预处理(20.]。
2.2。市场股票指数
有很多方法来预测股票。两个常用的方法是基本面分析和技术分析21,22]。下面简要描述的两种方法。本文采用一种技术方法,所以在这一节中,它关注的研究现状分析方法基于技术手段。基本面分析也称为定性分析(23]。基本面分析是一个主观的分析方法,依靠金融从业者的经验(24]。这种方法是基于宏观的信息,比如公司的财务和经营状况。专家macroinformation依赖于此,再加上个人经验和判断,意识到未来趋势的预测和推断的股票25- - - - - -27]。
传统的方法包括德尔菲法,主要概率方法,交叉概率方法,领先指标的方法。定性预测方法的有效性很大程度上取决于专家的股票市场和专家的知识和经验的能力。当专家的知识和经验水平很高,股票市场的预测是准确的,但如果缺乏专家经验或能力不足,预测结果将完全不同于实际情况(28]。这种方法有很大的不确定性和主观依赖性,所以它不能描述股票市场客观准确和客观的语言。图1显示了分布图金融市场指数的影响因素。
基于数据挖掘算法的分析方法挖掘潜在的有价值的过程,是固定的,和普通股票prebarium从大量的数据模型。在大数据时代,股票市场数据也在增加倍数(29日]。越来越现实的总结股市的变化规律由人类的统计数据。因此,当前对股市技术研究是基于数据挖掘算法的分析方法(30.]。股票预测模型构建本文的模型也是基于特定方向的深度学习数据挖掘。因此,股票的价格包含所有股票市场的有效信息,和一代的新闻信息在现实生活中往往是随机的。在此基础上,股票价格也将遵循随机漫步理论,所以使用技术手段来分析股票市场变化是无效的(31日,32]。
然而,随着越来越多的研究的出现,特别是综合金融的理论观点,行为经济学和行为金融学,研究人员已经逐渐开始相信有效市场假说是不完全正确33]。因为各种因素的影响在市场,投资者可能会对这些信息做出非理性的行为决策。这也从侧面证明,股票市场,在现实中,并不是一个真正意义上的强大和有效的市场,提供技术分析的可能性。在实际情况下,市场远未充分有效,和许多影响股票价格的因素,如投资者情绪,投资者不能完全了解。此外,投资者情绪,无法及时回复,和一个强大的、很难有效的市场存在34,35]。在市场上有超额利润的空间。对羊群效应的研究表明,其他投资者的情绪会影响到个人投资者的投资决策。
3所示。股票市场预测基于深度学习
股票价格预测有很大价值寻求利润最大化的股票投资,和相关技术研究了几十年。根据有效市场假说,新闻可以对股票价格产生影响,这也表明,事件驱动影响股票市场。领域的自然语言处理(NLP),公共新闻和社会媒体的两个主要的数据来源是股票预测(36]。
3.1。时间序列模型
基于时间序列的股票的对象模型是股票的历史数据。核心步骤是将股票的历史数据,以促进随后的股市预测。在这个模型中,第一个也是最重要的一步是收集和处理时间序列数据。当预测时间序列,它主要是通过观察时间序列的变化趋势,预测未来时间序列变化通过学习法律的变化。时间序列数据通常有大量的数据,很难直接的过程。这需要把它和时间序列除以发现点的关键趋势。通过这种划分方法,原来复杂的数据可以被压缩,同时删除一些噪音在股票序列。有些点不是有助于预测,以便保留信息为模型更有效学习时间序列数据的变化,和时间序列规则可以更清楚地找到。
3.2。深度学习模型
在介绍中提到的,模型的理论基础基于金融时间序列是有效市场假说。相信投资者做出投资决策客观根据金融法律在制定投资决策时不受主观因素的影响。然而,在现实的投资环境中,投资者可能不一定投资于一个完全理性的。他们将受到其他外部干扰,如财经新闻和新闻事件在社会媒体,这将导致情绪变化和影响投资决策。在本节中,提出了两种改进的模型。
首先,对传统分类器(如支持向量机和资讯处理时间序列数据分类的一般问题,递归神经网络的帮助下,以促进时间序列数据的建模,地股票预测模型,在此模型的基础上,有关库存的情感分析结果数据在社会媒体文本添加到构建一个趋势预测模型相结合的基本情感特性。在近年来出现深度学习技术,卷积神经网络是使用最广泛的。图2显示了该指数预测过程基于深度学习。
传统的图像特征往往是人工特征,也就是说,人为地探索一些特性来完成任务,人工的利弊功能将直接影响任务完成的效果。卷积神经网络中,特征提取是卷积完成内核没有人工参与。目前,随着互联网大数据的发展,硬件计算能力的提高,和软件算法的优化,卷积神经网络的结构是不同的,它不再是前浅网络。许多深层网络可以训练。但无论卷积神经网络模型的结构如何变化,其基本组成相似,包括输入层、卷积层、汇聚层、活化层,和完全连接层。
在卷积神经网络隐层中的每个神经元可以被视为一个卷积内核,并且每个卷积内核将执行一个滑动卷积操作图片:
卷积内核用于提取图像的特征,由于其稀疏连接和重量共享:
同样的卷积核,它将被更新在每轮只有一个迭代完成时。因此,对于相同的卷积核,在同一轮迭代中,每个卷积的重量不变,所以它被称为重量共享:
图像卷积运算后的大小等因素有关卷积核的大小,步长和池的大小。通常,几个连续卷积层用于提取更多的功能,但这也意味着大量的计算和参数。因此,为了减少计算和压缩图像特征映射,池层通常是添加中间的连续卷积层:
汇聚层的操作非常类似于卷积层的操作,和输出图像的大小可以实现输入图像大小的一半没有填。根据不同的需求,有两个主要的操作池层,即最大池和平均池:
卷积神经网络训练的本质是使模型有一个适合的数据,同时有很好的泛化能力:
卷积操作本质上是一种线性操作。为了使模型有更好的表达能力,常常需要加入一定程度的非线性,也就是说,添加一个激活层卷积后层:
激活层结构相对比较简单,一般来说,只是一个用于添加非线性激活函数的输出结果卷积层。常用的激活功能包括乙状结肠函数、双曲正切函数,陆和再保险功能:
它可以找到从双曲正切函数及其导数,它非常类似于乙状结肠形式,和函数图像是非常相似的。
4所示。市场股票指数预测分析
4.1。模拟环境和数据
与个股相比,股指的波动一般较小,因为股票指数是由许多不同行业的股票,可以更好地反映整体经济动力和整体环境。因此,最具代表性的上海证券交易所指数(上海证券交易所指数(代码000001)和深圳证券交易所指数(深圳成份指数,代码399001)选择为研究对象。选择股票历史数据时间跨度从1月1日,2015年,2019年12月31日。数据包括7属性:日期、收盘价、开盘价、最高价、最低价,价格上升或下降,和体积。所有数据被下载从印度金融大数据平台。
根据时间跨度,三个不同的实验数据集设置。1219个交易日的数据在5年内从2015年到2019年是第一组,3年731个交易日的数据从2017年到2019年是第二组,2019年和244个交易日的数据是第一集团三组。用深度学习模型训练这三个数据集和预测两个股票指数的收盘价。
4.2。指数预报效果分析
使用1219天的数据样本的上证综合指数从2015年到2019年,5年连续10天、20天的股票数据作为输入样本建立一个收盘价的预测模型预测。这两个模型分别称为SHYSD10和SHYSD20。数据3和4展示他们的预测结果。图3显示了上证综合指数的预测结果每隔10天。图4显示了上证综合指数的预测结果在连续20天。
本文模型的命名规则如下:第一,上海和深圳,分别指的是预测上证综指和深证成指,Ym指样本用于数据的时间跨度米年,Dn是指连续的使用n天的数据作为输入样本,所以下面我不会重蹈覆辙。使用731天的数据样本,上证综合指数3年从2017年到2019年,连续5天,10天的股票数据作为输入样本建立预测模型用于收盘价的预测。分别调用这两个模型Y3D5和Y3D10。数据5和6分别展示他们的预测结果。图5显示了上证综合指数的预测结果在连续5天。图6显示了上证综合指数的预测结果从2017年到2019年每隔10天。
它可以从上面找到这两个模型取得了好的结果,预测两个股票指数的收盘价和四个股票。使用的方法的比较分析两个模型是一样的,在前面的章节。卷积神经网络等方法在股票指数预测比较如图7。
为了验证方法的比较效应提出了与其他方法在过去,本文压缩深度学习与径向基函数神经网络预测模型和卡尔曼滤波的神经网络37- - - - - -39]。卷积神经网络的比较结果和其他方法在股票指数预测图所示7。与普通神经网络模型相比,卷积神经网络模型的平均绝对误差降低了11.6070,12.4070,平均绝对百分误差减少了11.1070,10.4070,和根方差减少了8.070和9.8070,分别。价格变化预报的准确性增加了4.50和2.90,分别。预测的平均绝对百分误差在2%以内,和上部和下部的准确性预测是53%以上。该模型具有较好的泛化能力,可以更准确的库存预测。同时,通过比较分析四组实验的10组,20组,30组,和50组的时间步骤,发现深度学习神经网络的预测性能的确是与所选的时间步。
5。结论
股票市场的变化发挥了重要作用的经济趋势,以及未来研究股票市场必须智能预测领域的一个热门话题。本文的主要研究课题是股票的短期趋势预测建模基于投资者情绪提取和比较多个信息源的影响模型的准确性。为了解决上述问题,本文从两个方面开展了研究工作。作为一个长期关注资本市场,股票市场预测吸引人们使用各种方法相关研究由于其可预见的和慷慨的回报。
预测方法的改进,进一步提高了预测的结果。为了使用投资者情绪信息更准确地预测股票市场,本文建立一个股票指数预测模型基于时间序列和深入学习。基于时间序列模型,提出利用CNN提取很深的情感信息来代替基本情感特性在情感提取水平。在数据源上水平,额外的信息来源等基本特性介绍了进一步提高模型的预测性能。这项计划的结果表明,该算法是可行的和有效的,它可以更好地预测市场股票指数的变化。在未来,我们将进一步开展相关研究提供参考和建议金融市场的发展。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。