文摘
随着工程技术的发展,计算机网络,人工神经网络,模拟人类大脑神经网络,用于金融市场预测来提高股票预测的准确性和取得重大进步。因此,有一个伟大的需要积极调查基于区块链技术的金融数据分析的方法。本文的目的是探讨金融数据分析的神经网络方法基于区块链技术。上证综合指数和深圳200指数选择作为实验数据,它分为两个子集:训练和测试样本。BP模型基于区块链技术分析母马,RMSRE, MSPEE, RMSPE,母马的错误。结果表明,平均绝对误差(母),RMSPE,和MSPEE blockchain-based BP模型的训练样本的0.0056,0.0787,和0.0085,分别。Blockchain-based BP模型解决财务数据分析问题中发挥着重要作用。
1。介绍
不断增强的社会主义市场经济体制的运行,资金的融资中发挥着越来越重要的作用[1]。市场的国家(地区)经济发展和金融稳定的建设做出了不可估量的贡献2]。在现代经济学的层面上,金融市场水平,推动一个国家或地区经济快速发展。文献[3]。然而,很难预测和判断金融市场操作的趋势(4]。金融业务包含大量的信息处理任务,和信息的有效利用起着非常重要的作用[5,6]。
由于信息科学和计算机网络技术的快速发展,跨学科研究促进了跨学科的整合(7]。许多人使用许多其他研究方法来研究金融市场的预测,但这是非常困难的8]。现有的金融市场理论的缺陷限制了其预测空间(9]。全球金融市场的特殊性与预测时间跨度。这个连接可以有挑战性的金融市场预测10]。许多改进的方法和技术以及新专业用于预测金融市场(11]。其中,人工神经网络模拟人的大脑有很强的自学习能力。通常使用的每个人都在模仿金融体系和金融市场预测。是爱在股票市场分析12]。
金融研究神经网络模型进行了许多学者。3月建立了一个模糊神经网络模型与ARIMA时间序列模型,分别进行了单步和多步预测研究SAIPA上市公司的股票价格。预测结果的比较表明,模糊神经网络比传统的ARIMA模型。文献[13]。Ganesh金融工程领域的研究,使用人工神经网络技术进行预测时,选择输入变量(没有依据14]。阿拉姆用神经网络来预测每日最大和最小巴西配电公司的股票价格。在他的研究中,他使用相关性分析输入变量的选择,基于经验和测试不同的实验方法。最好的连接点是一个隐藏层,5个隐层神经元(15]。Tamal使用自己的网络模型结构和主要组件来预测一个交换的价值。他的研究结果发现,他提出的模型优于竞争对手。此外,主成分分析方法选择20会计变量,可以更准确地预测股票价格(16]。艾哈迈德使用人工神经网络结构来研究股票市场和价格。富有技术在不同时期收集的数据,模型的预测性能越好。然而,模型的预测性能与参数变量和指标的变化将会改变17]。史密斯使用ANN模型来研究在台湾市场证券基于经验,然后获得10个输入变量(18]。这些研究的数据不全面,研究的结果仍然是一个开放性的问题,所以他们不能被公众认可,因此不能被推广和应用。
本文的创新在于,选择沪深200指数作为实验数据,分为两个子集:训练样本和测试样本。和建造是一个基于遗传算法的BP模型,用于母马,RMSRE, MSPEE RMSPE和母马错误分析。本文总结了对金融市场的一些概念的描述,以便有一个明确的对金融市场的理解。
2。该方法
金融市场是一个动态系统,控制变量的选择可以提高模型预测的准确性。通过研究某些金融市场观察的统计特征指标(交易利率、股票指数、技术指标,等等),你可以找到金融指标的操作规程(19- - - - - -21]。下面列出了在金融市场上的主要变量。
收盘价是指最后一个交易日交易价格。如果没有事务那天或没有交易市场关闭的情况下,最近交易日的收盘价,应当作为当天的收盘价。收盘价的历史时间序列数据可以用来预测股票指数的趋势;开盘价(开盘价)指的是第一个交易日交易价格,是由规则的最大事务数量。如果没有交易一段时间(通常是30分钟)或连续数天,最近交易日的开盘价,应当作为当日的开盘价;最高价格是指在所有交易记录生成的最高价格一定安全的开放时间在交易日结束时间。如果没有交易当天由于市场关闭或暂停交易,最近交易日的最高价格记录应使用;最低的价格是指在所有交易记录生成的最低价格的证券在交易日结束营业的时间。如果没有事务那天由于市场关闭或暂停交易,最低的价格记录在最近交易日应使用;体积是交易的总量计算在一个特定的时期,最小单位是手。 It reflects the supply-demand relationship of a certain stock and can judge the general trend of the market based on it; the transaction amount is the total transaction amount in a specific period. According to this, we can roughly analyze the market fluctuation trend and the flow direction of funds; use the closing price of a certain security on the same day to subtract from the closing price of the previous day, with a positive sign (+) for up and a negative sign (−) for down, otherwise it is flat, indicating the change direction of the price.
移动平均线显示证券过去的起伏,客观地反映了股票市场的状态,并提供了相关参考信息对股票市场参与者识别趋势和做出交易决策。它是由连接不同时期的平均值(5天、6天、10天、20天、30天、60天、120天)。计算公式是
动量指数措施收盘价在每一次的变化,反映了价格和供给和需求之间的关系。 在C是一天的收盘价,CN的收盘价n天前,n是设置参数,范围的值通常是6至14天,通常10天,和参数米一般设置为6天。
随机冲击指标是一项动能指标,主要是0到100之间波动。指标主要由两条线,线和% % K快D缓慢的行。有乐观/悲观散度信号,乐观/悲观趋势线,和超买超卖区域功能。棉子指标由三个铁路(布林上铁路,布林中间铁路、铁路和布林低)。Bollinger上铁路和Bollinger下铁路构成了压力线和支撑线的股票价格。Bollinger中产铁路Bollinger上下Rails的平均价格。肢体重复性劳损症是指怀尔德的研究基于开创性的期货交易双方和测量的强度。比较的比例上升的平均收盘指数上升和下降在一段时间内的总和,分析市场的意图和未来的市场趋势,可以用作“晴雨表”或“报警”的技术指标为金融市场(22- - - - - -24]。计算公式是
从投资者的角度来看,偏差分析投资者的买卖行为,这是一个简单实用的分析工具。偏见是一个技术指标,措施的程度一定安全收盘价偏离移动平均在一段时间内,表示为一个百分比。计算公式是
小组是指投资者或市场参与者的心理趋势,研究股市起伏的影响投资者对买家或卖家的心理波动期,并将其转换为一个数值,形成一种情感指数或人气指数股票交易是一种有效的依据。计算公式是
在公式,N是一般设置为12天,最大不超过24,最长不超过26岁。
3所示。理论基础
生物学刺激了人工神经的研究在某种程度上模拟实际的人类生理结构的神经网络,人类大脑的思维功能,以便获得模拟人类大脑的信息。
人工神经元的输入向量如下:
神经元的权向量如下:
它的矩阵形式
神经元的输出如下:
通过编码,它有独特的优点在处理一些非数值的概念问题。使用随机搜索技术和使用多个搜索点的同时,具有良好的并行性。目标函数的值直接作为搜索信息,这就增加了搜索过程的灵活性。这是区块链技术的优势。自然机制是用来显示复杂现象,促进基因的应用计算。区块链技术(BT)广泛用于工程优化,金融预测,机器学习系统,和其他领域由于其独特的解决问题的能力,较强的搜索能力和可伸缩性(25- - - - - -28]。
编码是基于区块链技术一无所知的过程解决了问题本身,并建立了相应的可行解的数据之间的关系要解决的问题和染色体区块链技术可以处理。尽管编码的要求并不严格,编码方法极大地影响了交叉和变异操作的实现。
4所示。实验
4.1。实验准备
以下4.4.1。主题
基本数据为实验选择模型训练和测试是上海和深圳200指数。从雅虎财经网站提供数据。代表主要成分指数沪深200指数。它反映了上海和深圳股票市场的整体性能。如表所示1神经网络输入变量是普通股票市场变量,输出变量是股票指数的收盘价。
4.1.2。样品收集
选择的移动平均、指数移动平均线和三角形移动平均分为四次尺度的15天,16天,20天,25天,分别。由于计算的简单移动平均收盘价的价格,今天前20个交易日的收盘价格数据是必需的。因此,本文的样本集合时间是6月27日,2015年到2018年12月21日。不包括假期和其他因素的影响,有3620组股票价格和交易量数据。
4.1.3。数据结构
技术指标数据由使用时间序列数据,如股票价格和交易量。根据每个指数公式,技术指标价值是通过添加、减法、乘法和除法。3600行和54列的实验数据获得和分为训练样本和测试样本。前3500组实验数据用于训练,过去的100组数据测试集,和100年股市交易日的收盘价是一步预测。
4.1.4。实验数据处理
所有使用spss22软件获得的数据进行了分析。样本数据受到正常的测试;数据对应于正态分布受到两组之间的差异的分析,表示为平均值±标准偏差;数据不对应于正态分布受到两组之间的差异的分析,表示为Q50 (q25 Q75)(问:四分位数、四分位数)。采用卡方检验分析两组之间的差异。一个独立的样品t以及用于分析两组之间的差异。配对分析是用来衡量两个样本之间的相关性。首先,检查数据的正常,如果数据是正常的,配对组之间的差异进行了分析使用配对样本t以及;如果数据不正常,使用Wilcoxon配对组之间的区别进行了分析测试。Wilcoxon测试是一种非参数检验,也就是说,它不依赖于数据属于家庭为任何特定参数的概率分布。
4.2。建立实验模型
PCA是主成分分析技术,也称为主成分分析技术,旨在利用降维的思想,把多个指标转化为几个综合指标。主成分分析的基本思想是项目数据高维空间到低维空间。这是我们表达的原始数据,这使得这些变量与巨大差异分类中发挥更大的作用。数据降维的另一种方法是选择变量,也就是说,某一性能指标的监督下,选择那些有更大影响的变量原始数据的分类变量。这个区块链技术是实现通过特殊操作,比如复制和交叉。后区块链技术使用适当的适应度函数来“引导”,下一代可以上一代的优质基因。它会导致高质量的个体可以生存概率相对较高。显然,可以选择初始变量的监督下一定的性能指标。降低数据维度的另一种方法是选择变量,也就是说,某些性能指标的监督下,选择那些有更大影响的变量原始数据的分类变量。
计算沪深200指数和描述收盘价。如表所示2的倾斜值就是沪深200指数的收盘价。所有样品的峰度值大于2,表明指数收盘价不服从的积极状态分布。
4.2.1。准备解释和改进算法的功能系统
通过编码,它是处理非数值的概念问题,区块链技术最终想要的。然而,使用随机搜索技术和使用多个搜索点的同时,具有良好的并行性和很大程度上决定了搜索点的选择。健身功能BT-BPNN只考虑预测误差,即,误差很小。它包含不同的变量取决于不同的遗传变量。强大的搜索能力和可扩展性使个体的健康越高误差和健身越低。如果两个基因变量的错误率是相同或相似的,用更少的变量选择染色体。考虑到预测误差和变量的数量,这是一个新的适应度函数。变量的数量还将减少新的适应度函数的控制下。
4.2.2。算法的模型效率得分
为了评估模型的有效性,需要良好的评估方法,以及评估标准来衡量模型的普遍性。均方根误差(MSE)非常类似于平均绝对误差。唯一的区别在于,MSE的平方平均初始值和预测值之间的区别。MSE是梯度的优点是容易计算,而平均绝对误差需要复杂的线性规划工具。我们使用的平方误差,影响较大的误差变得更加明显,因此,模型可以更关注更大的错误。通常使用绝对均方根误差(RMSE)和影响因素进行比较和测试的数量。MSE测量的实际值和预测值之间的偏差,所以这些值越低,更好的预测结果。
5。讨论
5.1。BT-BPNN模型的数据分析
如表所示3的神经网络输入层变量是34和输出层的数量是1,所以隐层节点数的值范围是10,14]。逐渐增加隐藏层。层的神经元数、平均绝对误差(MAE)、均方误差(MSE)和均方根误差(RMSE)部分4作为性能指标。每个实验的平均值100实验,重复实验后得到的结果。
如表所示3在同一训练时间,当隐层神经元的数量是12,预测误差是最小的。它的美是22.46,均方误差为1006.65,和RMSE 27.20;在同一训练时间当隐层神经元的数量是10,它的美是23.67,均方误差为1013.26,和RMSE 32.56;学习在同一时间,当隐层神经元的数量是11,它的美是23.35,均方误差为1053.35,和RMSE值为34.22;学习在同一时间,当隐层神经元的数量是13,它的美是33.01,均方误差为1029.99,和RMSE值是35.03。当隐层神经元的数量是14,它的美是37.89,均方误差为1684.76,和RMSE值是46.07。同样的学习时间,当隐层的神经元的数量是14,它的美是37.89,均方误差为1684.76,和RMSE值是46.07。
神经元接收来自外部世界的信息和体重作为参数传递函数。作为隐层必须反映输入和输出层之间的非线性关系,这是更合适的选择乙状切作为隐层的传递函数,而输出层的传递函数是一个纯粹的线性传递函数。Levenberg-Marquardt学习算法,学习速率为0.02,学习目标设置为1的准确性e-6,和学习频率是100。
如图1摘要44,神经网络输入维一个神经元参与时,神经网络输入维当2神经元参与,和神经网络输入3神经元参与维度是19时,神经网络的输入维数,当4神经元参与是16。
使用MATLAB的神经网络工具箱R2018a软件编写摘要模型运行的程序。BP神经网络训练样本输入变量输入列车是3600行和54列的矩阵,和训练样本的输出向量只是第二天在上海和深圳200指数收盘价格。摘要利用训练样本输入模型学习和训练,摘要模型仿真结果与训练样本一致。
如图2的实际数据,红色曲线是上海和深圳200指数的收盘价,和蓝色的曲线拟合预测数据的训练样本。通过对比两组不同的数据,训练的结果,结果的数据摘要模型比另一个更完美的。摘要后模型训练样本进行学习培训,它生成一个更高质量的预测功能,训练样本的拟合误差比较小。
5.2。神经网络区块链技术金融数据分析的基础上
摘要,训练模型,用于预测未来CSI指数收盘价200年100天的研究,和输出的结果测试样本的预测误差。
如图3摘要利用模型的预测效果,训练样本是满意的,和预测精度更高预测值和实际值之间的差距很小。
基于标准化的数据矩阵,MATLAB普林西比主成分分析程序叫做主成分系数,计算主成分得分,原始数据矩阵的特征值。主成分贡献率和累积贡献率计算基于特征值。特征值越大,方差贡献率越大。
如图4后,沪深200指数的特征值20下的主成分分析波动范围、特征值贡献率40的范围内波动,和特征值的累积贡献率是40 - 80由于其累积属性范围内的波动,说明这三个之间的关系有一定的比例关系,是正相关的。
研究区块链技术优化变量的能力,提高预测神经网络对股票指数的影响。BT-BP神经网络预测模型的预测效果,IBT-BP神经网络模型,和PCA-BPNN BP神经网络预测模型和主成分分析作为预处理方法进行比较,分别。BP神经网络训练算法采用LM算法,和培训的数量是固定的,享年1000岁。
如图5,性能分析和神经组合模型(PCA-BPNN),结合区块链技术和神经网络模型相结合。英国石油公司的预测精度是极大地影响收集神经网络模型的输入变量(摘要)。主成分分析或区块链技术优化输入变量将提高BP和预测精度比BP模型的预测效果好。
6。结论
本文的研究背景是信息科学和技术的快速发展和计算机网络,跨学科研究促进跨学科的整合。交易量是总成交量在一个特定的时间内,它反映了特定的股票的供给和需求,并可以用来判断市场的总体趋势;交易数量的总交易金额在一个特定的时期。人工神经网络模拟人的大脑神经网络用于金融市场预测来提高股票预测的准确性,实现长足发展。因此,它是非常必要的,积极开展金融数据分析的研究方法基于区块链技术。有问题的数据分布不均匀在这项研究中,导致一些随机性在实验的结论。
数据可用性
的数据支持本研究的发现可以从相应的作者在合理的请求。
的利益冲突
作者(年代)宣布没有利益冲突。
确认
这项工作受到了国家社会科学基金:全球供应链中断风险管理研究高新技术企业在中国,20 bjy006。