复杂性

PDF
复杂性/2019年/文章
特殊的问题

应用机器学习方法在复杂经济和金融网络

把这个特殊的问题

研究文章|开放获取

体积 2019年 |文章的ID 4132485 | https://doi.org/10.1155/2019/4132485

李应,Hongduo曹,天天林,韩愈, 股票价格预测基于复杂网络和机器学习模式”,复杂性, 卷。2019年, 文章的ID4132485, 12 页面, 2019年 https://doi.org/10.1155/2019/4132485

股票价格预测基于复杂网络和机器学习模式

客座编辑:本杰明·m·Tabak
收到了 2019年3月07
接受 2019年5月14日
发表 2019年5月28日

文摘

复杂网络在股票市场和股票价格波动模式预测股票价格研究的重要问题。之前的研究使用历史信息关于单个股票预测股票价格的未来趋势,很少考虑comovement在相同的股票市场。在这项研究中,为了提取信息与股票预测,我们试图把复杂网络方法和机器学习来预测股票价格模式。首先,我们提出一种新的模式网络建设多元股票时间序列的方法。价格波动组合模式的标准普尔500指数(S&P 500),纳斯达克综合指数(NASDAQ),道琼斯工业平均指数)转换为直接加权网络。发现网络拓扑特征,如平均度中心,平均强度、平均最短路径长度、和亲密感中心,可以确定股票市场剧烈波动的时期。接下来,每个组合符号模式的拓扑特征变量作为输入变量用于再邻居(资讯)和支持向量机(SVM)算法来预测第二天单个股票的波动模式。结果表明,最优模型对应于两种算法通过交叉验证和搜索方法,可以找到。三大股指的预测准确率与测试数据集大于70%。在一般情况下,支持向量机算法的预测能力优于资讯算法。

1。介绍

股票价格波动模式分类和预测股票市场研究是一个非常重要的问题。股票价格趋势的预测实际上是一个分类的预测股票价格波动模式(1]。文献表明,预测股票价格足以产生盈利的交易模式和实现盈利的交易策略的执行2]。因此,许多研究都集中在预测股票价格模式而不是预测股票的绝对价格(2- - - - - -4]。

迄今为止,大多数研究都集中在单个股票的波动模式基于自己的历史属性(5,6),较少关注comovement相关的股票和与整体市场的信息。很少有研究使用历史信息对相关股票的输入变量预测和显示,在单个股票价格波动不是孤立的,往往受到多个相关股票的趋势(7,8]。因此,如何提取comovement多种股票和应用这些信息来预测单个股票的波动模式是一个值得研究的问题。

复杂网络分析提供了一种新的解释股票市场行为从系统性的角度来看。利用复杂网络理论来研究股票价格不仅使我们能够分析不同股票之间的关系,还可以使我们探索的macroaspects comovement市场在不同时期的特点9- - - - - -11]。先前的研究已经提出了各种各样的方法来构建复杂网络使用股票价格的时间序列,包括可见性图表(12- - - - - -14),递归网络(15- - - - - -17),相关网络(11,18,19),模式网络(10,20.),和K-neighbors网络(21,22]。所有的网络施工方法、符号模式网络受到许多学者的青睐,因为它可以更精确地反映相关的程度和方向的原始的元素在一个复杂的系统10,20.,23,24]。在股票价格波动模式网络,每个波动模式被认为是一个网络节点,和之间的关系模式被认为是节点之间的连接(10]。通过分析网络的拓扑属性,股票价格波动的特点,可以更好地理解。黄等人使用粗粒度的符号化方法构建的网络市场价格和交易量数据在不同时期根据上海证券交易所(SSE)综合指数,结果表明,网络节点的出度分布服从幂指数定律和基本波动表现出不同的模式在不同时期(24]。王等人把汽油和原油股票的收益转化为五个模式,研究了原油和汽油的特征节点网络在不同时期使用滑动窗口,然后准确地预测原油和汽油股票价格模式基于价格的转化特点网络(10,20.]。

然而,大多数现有的研究股票价格波动模式网络专注于单变量时间序列。在此基础上,我们提出一种新的网络施工方法构建三个最重要的指标的波动模式网络在美国股市,标准普尔500指数(S&P 500)、纳斯达克综合指数(NASDAQ),道琼斯工业平均指数)。首先,结合符号模式三个股指衍生使用粗粒度的方法。然后,结合符号模式作为网络的节点,以及频率和方向的转换模式作为网络连接权重和方向。最后,我们构造直接对美国股市和加权网络。通过分析网络拓扑属性,我们可以确定市场的大幅波动期。

与此同时,许多机器学习算法已经应用于股票价格波动分类和预测,如神经网络(25),随机森林26),决策树(27),支持向量机(SVM) [3,7,再邻居(资讯)1,28]。其中,再邻居(资讯)和支持向量机(SVM)算法已经广泛应用于模式识别和预测、机器学习、信息检索和数据挖掘。资讯是一种简单而有效的分类方法,很容易计算及其性能与最先进的分类方法(29日,30.]。支持向量机,可以将非线性可分的数据映射到高维空间,用超平面分类,非常适合小样本分类由于其优秀的分类能力(26]。资讯和SVM算法都有一个成熟的理论基础与分类预测。球磨机等人也比较SVM的准确性,然而,和其他算法在预测股票价格变动提前一年在5767年公开上市的欧洲公司,和结果表明,SVM的预测能力比资讯(2]。特谢拉提出一个自动股票交易的方法,结合技术分析与资讯分类。使用15股从圣保罗证交所(Bovespa),他们发现,该方法生成的利润大大高于“买入并持有”的方法对大多数公司来说,很少有购买行为产生(1]。黄等人使用支持向量机算法来预测日经225指数的波动,发现SVM优于其他分类方法,如二次判别分析和Elman神经网络反向传播(3]。

文献表明支持向量机和资讯的能力来预测股票模式。然而,他们预测股票价格基于单一股票本身的信息,没有考虑网络的信息系统相关的股票组成。因此,本研究的另一个目的是预测单个股票的次日模式为每个股票组合模式使用的网络拓扑属性作为SVM的输入变量和资讯算法。我们所知,这应该是第一次尝试在现有的研究。然后,我们使用测试数据集的预测精度比较后确定最佳的使用训练集模型。股票价格波动模式网络包括单个股票价格信息和相关股票和描绘的macronature市场,它包含更多的信息比只使用单一股票有关的历史信息。结果表明,模式网络可以提供一些信息使我们能够预测单个股票的价格波动模式。两种预测方法的最优参数搜索策略结合交叉验证和搜索方法使我们能够找到模型执行的测试数据集。总的来说,支持向量机算法的性能优于资讯算法。结合复杂网络和机器学习可以为投资者提供信息盈利能力的策略。

本文的其余部分组织如下。在下一节中,我们将介绍资讯和SVM算法的理论背景。节3构建网络的方法,并为每个股票指数预测次日的模式。节4,我们将展示实证结果并比较资讯和支持向量机的预测精度。最后一部分是总结。

2。理论背景资讯和支持向量机

2.1。然而,

再(资讯)算法是一种非参数分类算法,分配查询数据分类类别大部分 邻居属于(31日]。我们使用欧氏距离度量找到再邻居从已知分类的样本集。假设已知数据集有四个特征变量 和四个类别 的步骤搜索新数据的类别 然而,算法如下。

首先,欧几里得距离的特征变量的数据 和其他数据 在训练数据集的计算方法是:

其次,在训练集的所有数据按升序排序根据距离数据

第三,K数据点的最小距离数据 被选中。

最后,与最大比例的这些类别 数据将被视为数据的类别

然而算法中的一个重要参数来确定K代表的数量最近的邻居时要考虑分类未知样本(1,2]。

2.2。支持向量机

介绍了支持向量机通过Vapnik [32),已广泛应用于模式近年来预测。支持向量机的基本思想是非线性变换输入向量在高维特征空间,然后搜索最优线性分类面在这个特征空间分类平面间的距离最大化和最近的点。最近的训练样本分类平面称为支持向量。支持向量机算法可以简述如下。

考虑到二进制线性分类问题的训练数据集 , ; ,在哪里 是一个特征向量和 是一个类标签。假设这两个类可以通过一个线性分离超平面 为了使正确的分类和分类间隔最大,构造最优的优化问题的飞机被描述为

的最优解 可以解决通过引入拉格朗日乘子。然后我们可以得到最优分类问题(3)。

对于一个非线性分类问题,特征向量转化为高维空间向量首先。然后构造最优分类超平面。假设转换函数 ,然后可以被描述为最优问题 在哪里 是惩罚参数,它指定分类距离之间的权衡和错误分类2]。最后,最优分类超平面可以描述(5)。

函数(6)被称为核函数。因为高斯径向基函数(RBF)的性能很好当数据的附加信息是有限的,它广泛用于金融时间序列分析(3]。高斯径向基函数(RBF)作为核函数来实现支持向量机算法在这项研究中。RBF核函数可以表示为 在哪里 径向基函数的常数。实现了支持向量机算法之前,参数σ和参数 需要确定。

对于multiclassification问题,它可以转化为多个two-classification问题[33]。在这项研究中,一个四个问题转移到六two-classification问题“one-versus-one”方法的支持向量机。

3所示。方法

在本节中,我们介绍的方法使用网络拓扑特征变量预测股票价格模式。图1显示了一个总体框架提出了模式的预测系统。它包括两个部分:复杂网络分析和模式预测使用机器学习。在部分我们提出更详细的过程。

3.1。构建一个模式网络股票市场

使用每个股票指数的每日收盘价,滑动窗口是用来计算一天的回报 ,五天的回报 ,和五天的波动 对应于天t: 在哪里 天收盘价格吗t, 是前一天的收盘价, 是收益率的标准差从第一到第五天。

然后,我们可以计算平均5天的波动 为每个股票指数: 在哪里 是交易日的数量在一个时间序列。假设我们研究 股票在股票市场。然后,我们可以获得整个市场的平均波动率如下:

基于五天返回的符号 和五天波动的大小 每一天,每只股票可以分为四种模式:

每个股票指数相结合的模式,我们可以获得相应的符号组合模式,每一天。假设我们研究三个股票指数,我们可以获得最多 组合模式。每日服用的组合模式作为网络的节点,网络的边缘和权重可以确定订单。如果模式 S1S4S4,天t+ 1是S2S2S2,是一个有向边S1S4S4S2S2S2重量为1。如果转换频率S1S4S4S2S2S2 ,定向边的重量S1S4S4S2S2S2 例如,如果当前的标普500指数模式,纳斯达克,吗 , , ,目前的价格分别组合模式 假设模式转换超过一段时间 S1S4S4、S2S2S2 S1S1S1,S1S4S4、S3S1S4 S2S2S2 S1S1S1 然后,我们可以获得定向加权网络如图2

滑动窗口选择的关键问题是如何有效地保持原始时间序列的质量和数量信息,同时减少计算复杂度最程度(34]。在这项研究中,我们应用一个滑动窗口长度为30天(约一个月在日常生活中,一半四分之一在股票市场),一步一天股指时间序列。所以我们可以得到一个模式网络每30天。表1使用滑动窗口显示的过程。


日期 股票1 股票2 股票3 组合模式


3.2。计算网络拓扑特征变量

接下来,我们计算网络拓扑特征变量每30天的网络。

3.2.1之上。网络的平均度中心

在无向网络,网络的平均度中心水平反映了网络中一个节点与其他节点之间的联系,也就是说,一个节点是否是否与其他节点(17]。公式如下: 在哪里 网络中节点的数量和吗 的值是一个无向网络的邻接矩阵。 如果节点 和节点 连接,否则 一个无向网络的邻接矩阵是一个对称矩阵。然而, 并不意味着 在一个有向网络。在网络,我们必须考虑出度和入度。我们按时间顺序连接节点的入度和出度是一样的,除了第一个节点和最后一个节点。因此,我们只有选择入度进行分析,并计算平均入度中心如下:

在叙事方面,在下一节中,我们描述平均入度中心平均学位中心。平均度中心措施实际连接数的比值最大连接数,即网络的边缘密度。学位中心平均越大,价格更多的节点之间的连接模式网络,节点之间可访问性越高,密度越大的整体网络(35]。

3.2.2。平均网络的力量

在一个网络中,从节点连接的强度 到节点 是重量 定向边缘的节点 到节点 类似的入度和出度指导网络,直接加权网络的力量也可以分为在力量,使劲10,35]。在这项研究中,我们将描述平均使劲平均网络强度:

网络的平均强度越大,网络节点的数量越少,价格波动模式的成分越简单,较小的网络的复杂性,和更高的频率相同的节点。简单的价格模式反映了一个事实,不同股票的价格变化的一致性是更为强大、持续时间更长。

3.2.3。网络的平均最短路径长度

网络的平均最短路径长度描述了网络中节点之间的分离程度,即网络的大小。平均最短路径长度可以用来描述一个“小世界”网络在一个复杂的网络17]。节点的距离 到节点 被定义为从节点所需的最小数量的边缘 到节点 网络的平均最短路径长度的平均长度是所有的网络中最短路径:

平均最短路径越短,越少的中间模式所需股票价格之间的转换模式。模式可以通过更少的边缘连接,和价格模式可以通过更少的其他相互作用模式。因此,转换效率和整体网络速度都大。

3.2.4。网络亲密中心

亲密的中心节点 是互惠的平均最短路径长度从其他节点到节点 (15,36]:

点到其他点越近,就越容易传播信息。现在,我们考虑加权最短路径 ,这被定义为加权距离最短的节点 到节点 然后,我们可以获得网络的亲密中心(37]:

在哪里 从节点是节点的数量可以吗 越接近中心的网络中,网络节点之间最短的加权距离越小,越少价格不同模式之间的转换时间,和转换周期越小。模式节点倾向于改变自己,从而转换区域的整体网络更集中,中心更突出(35]。

3.3。第二天股票模式基于资讯和SVM的预测

我们训练最优预测模型基于获得资讯和SVM算法的网络拓扑特征变量,然后预测次日的模式三个单一股指使用测试数据集。

3.3.1。详细的预测过程

3显示了模式预测实验的详细过程对于每一个单一的股票指数。它包括两个主要步骤:第一步是模型训练,从中我们可以得到最好的模型;和第二步是模式的预测。

首先,第二天股价之间的关系模式和网络中单个股票指数的特征变量训练集由克鲁斯卡尔-沃利斯检验测试。网络拓扑特征变量显著相关的价格模式每个股指将股票指数预测的输入变量。

拓扑特征变量的值归一化,这样不会被忽视,因为较小的价值指标的指标与大的值(26]。公式(20.)用于标准化变量(38]:

接下来,为了得到一个子集的组合模式,我们将训练集划分为几个训练子集的数量根据类型的组合模式(或组合模式节点)在训练集。显然,在每一个子集,一天的组合模式是相同的,但是每个股票指数的第二天模式可以是不同的。对于每个训练子集,第二天一个股票指数的模式是分类变量,和网络拓扑特征变量的输入特性变量资讯和SVM算法。为了防止过度拟合,交叉验证和搜索方法用于确定最优参数。

最后,在测试数据集,每个股票指数的第二天模式得到预测的模型。

最优训练模型是根据公认的组合模式,发现和第二天股票模式预测的基础上相应电流30天网络的拓扑特征变量。平均市场波动和用于测试的标准化参数设置是通过训练集。

3.3.2。模型选择标准

交叉验证是广泛用于模型选择因为它的简单性和普遍性,所以我们使用交叉验证方法和搜索方法确定最优参数在本研究39]。我们旨在K参数为资讯的所有值K= 确定支持向量机的最优参数值,我们执行一个网格搜索C= 10−2,10−1,100,101,102 , = 10−2,10−1,100,101,102 确定最佳的组合。

使用k-fold交叉验证的方法,对于每一个参数的组合,训练数据集分为一个子集与k相等的部分,和k - 1部分的数据作为训练数据,而另一部分用作验证数据。这样,k的准确率验证集k迭代后可以获得。采取的平均准确率k验证集,验证分数,作为标准参数选择,可以找到最优的参数组合。此外,分析(厕所)是另一个简单,高效和常见的交叉验证方法。使用厕所时,一个样本是来自数据集作为验证集,每次和其他样品用作训练集。因此,对于一个具有n个样本数据集,我们可以得到一个总n的不同的测试集和相应的训练集。厕所非常适合小样本的模型选择,因为只有一个训练集的样本提取一次作为验证集,这样浪费更少的样品(40]。

在这项研究中,我们使用三倍交叉验证如果训练子集包含超过100个样本和使用厕所否则交叉验证。

4所示。实证结果与分析

4.1。数据处理

我们使用了标准普尔500指数的收盘价,纳斯达克,态从2000年1月1日到2014年12月31日作为样本数据集。这导致了3769年每日记录。风从数据库获得的数据,在中国一个最权威的金融数据库(数据库可以下载从风https://www.wind.com.cn/)。首先,为期五天的每个股票的回报率和五天波动指数计算。在前一节中列出的方法是用来象征股票指数,然后我们获得组合模式的三个股指每一天。

一个滑动窗口长度的30天,一步一天用于股票时间序列模式划分为3740个时间段。构造一个有向加权网络为每个股票价格模式,导致3740年网络。有47个模式在所有的网络节点。

我们构建股票网络的方法是原始的,所以我们用Python编写代码。我们使用Python 3.7标准库中的一些功能包括networkx sklearn,熊猫,matplotlib为我们分析。

4.2。网络拓扑特性的分析

平均度中心,平均强度、平均最短路径长度、和亲密的中心网络计算使用公式(15),(16),(17)和(19)。这四个网络拓扑特征的进化图所示4- - - - - -7

从这些数据可以看到,平均点度中心,平均强度,亲密中心达到峰值和平均最短路径长度达到最小值都对应时期整体市场波动很大。当三个股指跌至2002年10月以来的最低水平,2009年3月,平均度中心,平均强度,和亲密的中心网络达到了最高点,而最短路径长度达到最低点。这两个时期的最后阶段对应互联网泡沫危机和次贷危机。此外,亲密中心和平均度中心再次达到了最大点在2012年3月,这与另一个长期的美国股市大幅波动。结果表明,这四种网络拓扑特征有显著关系的异常指标在美国股市。大幅波动时期,三个股指的comovement更强,和30天的网络更简单。

的最大价值网络的平均强度反映了这样一个事实:有相对较少的节点在股票模式网络,和股票的波动模式是单调的。它表明,在一个月前的极端值,三大股指的价格波动是同步的,导致波动的相对简单的组合模式。前三大股指在2002年和2009年达到的最低水平,他们基本上是在大幅下降。指标的相关性和一致性这一时期达到了最大,所以网络的平均强度达到最大,这与以前的研究结果是一致的复杂网络使用价格时间序列(9,41]。

此外,当股票市场在一段时间的大幅波动,网络中的节点类型单调,股票网络之间不断切换几个价格模型,和边缘密度较大,平均度中心达到最大值。在此期间,节点更紧凑,节点之间的转换是更快,更少的边缘需要传递,和网络的平均最短路径达到最小值。虽然其他模式可能会出现在这一时期,大波动模式占据最重要的位置,和价格模式倾向于转移之间的主要模式,以便达到最大亲密中心。这个结论是王一样et al。10]。

4.3。第二天股票模式预测使用资讯和SVM算法

通过分析30天的网络拓扑特征对应于每个交易日,我们发现网络拓扑特征的极端值可以反映出的戏剧性的波动期三个股指组成的系统中。资讯和SVM算法用于预测每个股票指数的第二天模式当三个股指的组合模式和相应的30天的网络拓扑特征为当前天是已知的。

基于交叉验证的理论(42今年,为了保持完整的连续性,确保年,我们使用了标准普尔500指数的收盘价,纳斯达克,态从2000年1月1日到2014年12月31日作为训练样本数据集。测试样本数据集使用收盘价的三个指数从2015年1月1日到2017年12月31日。训练集和测试集包含了3769年和755年的记录,分别。由于训练样本集47模式节点,我们把训练数据分为47个训练子集。

4.3.1。克鲁斯卡尔-沃利斯测试筛选变量

方法用于选择变量后,在现有的研究中,我们使用了克鲁斯卡尔-沃利斯检验过滤四个网络拓扑特征变量和第二天的每个股票指数模式使用训练样本[43]。结果如表所示2


标准普尔指数 纳斯达克指数 态指数

平均强度 43.0578 340.2039 29.8488
(0.001) (0.001) (0.001)
平均最短路径长度 9.3241 28.1597 7.6535
(0.0253) (0.001) (0.0537)
平均度中心 25.4071 250.9374 13.0833
(0.001) (0.001) (0.0045)
亲密关系中心 8.4532 190.0352 0.6204
(0.0375) (0.001) (0.8917)

注:括号内数据是假定值。

从表可以看出2变量和第二天的假定值模式的各种股票指数都小于或等于0.1,除了第二天道琼斯工业指数的模式,在亲密中心并不重要。因此,当预测次日的道琼斯工业指数的模式,亲密中心被移除,其他三个变量作为输入变量的资讯和SVM算法。当预测次日的标准普尔500指数和NASDAQ指数模式,所有四个网络拓扑特征变量保留作为输入变量。

4.3.2。预测股票模式使用资讯和SVM算法

预测的准确性被定义为:

我们比较预测次日模式与实际第二天股票指数的模式。如果他们是相同的在某一天,我们可以说,我们的预测是正确的。正确地预测样本的数量的比例的样本总数是准确率。准确率接近1意味着模型取得更准确的预测,而准确率接近0意味着模型更准确。

使用资讯在获得最优模型和支持向量机算法与训练集使用交叉验证和搜索方法,模型被用来预测模式使用测试设备,及其性能评估是基于他们的预测准确率。表3显示最优模型的预测精度获得使用资讯和SVM算法的三个股指。


亲密 算法 态指数 标准普尔指数 纳斯达克指数

是的 然而, 74.83% 72.58% 72.45%
支持向量机 74.97% 73.11% 74.57%

没有 然而, 72.98% 70.59% 70.86%
支持向量机 76.03% 72.45% 73.64%

从表3可以看出,资讯和SVM算法可以确定适当的模型基于训练集使用交叉验证和搜索方法,预测精度与测试组大于70%。然而,一般来说,支持向量机算法的预测精度高于资讯算法。它类似于先前的研究在两种算法的结果;也就是说,支持向量机分类模型的泛化能力大于资讯的模式1,2]。进一步说明了亲密的三个股指预测效果,我们比较亲近的预测准确率的情况下,没有亲密。我们发现一个有趣的结果,预测模型没有亲密时使用SVM的预测准确率最高预测次日的道琼斯工业指数的指数模式。这一结果表明,SVM比资讯更准确和敏感。亲密并不影响对于道琼斯工业指数的预测,克鲁斯卡尔-沃利斯检验的结果显示。

使用SEC-mandated二醚等人研究了卖空美国股票2005年的数据,发现卖空活动强烈与先前的五天的回报和波动性呈正相关(44]。股票的五天的运动也是非常重要的短期投资股票或基金在现实世界中。因此,如果投资者预测未来五天的波动模式,可以获得更多的信息来支持卖空策略。例如,如果下一个五天的模式预测是S1(大幅上升),投资者可以卖空策略执行。

5。结论

基于复杂网络的方法,本研究分析了股票价格波动模式的三个最重要的美国股市股指。与以往的研究不同,本研究使用三大股指构建模式网络的系统,而不是使用一个股票指数。分析的平均强度、平均最短路径长度、平均度中心,和亲密的价格模式的中心网络每30天,发现当整个股票市场在一段时间的大幅波动,平均强度、平均度中心,和亲密中心达到最大值,而平均最短路径长度达到最小值。这表明价格波动模式网络可以在股票市场上反映特殊时期。在股票市场的戏剧性的波动期,各种指标的comovement更强,边缘密度相应模式的网络更大,价格模式之间的转换快,转换区域的节点更集中。它显示了使用价格模式网络的有效性特征来识别特殊时期在股票市场上。在某种程度上,他们可以在股票市场上反映异常时期的macropoint视图。四项指标方法极端值时,投资者应谨慎行事。

股票价格的网络特征变量不仅包含对个股价格变化信息,但也反映了市场在宏观的总体变化特征。因此,本研究的另一个焦点是使用网络的特征变量作为输入变量的资讯和SVM算法预测次日个股的波动模式。首先,克鲁斯卡尔-沃利斯测试用于测试的第二天模式三个股指和四个网络特征变量,我们发现亲密不影响预测第二天股票的态指数模式。价格的组合模式对当前天,网络特征变量作为输入变量用于资讯和SVM算法来预测第二天股票价格模式,和两个算法的准确性与测试组比较。结果表明,资讯和SVM算法显示一个高水平的准确性预测第二天股票价格模式,预测精度大于70%为所有三个股指。然而,支持向量机算法的泛化能力大于资讯的算法。因此,可以预测股票趋势通过使用一个适当的分类算法,结合multistock价格网络的结构特点。这种方法可以生成更多的信息对金融交易策略在现实世界中,为未来的研究提供了一个新的焦点股票价格预测。

应用复杂网络方法股市仍处于发展阶段。揭示股票价格波动的特点,利用复杂网络有助于理解股票价格波动的本质和提供盈利的策略。更详细检查金融危机和网络拓扑属性之间的关系是一个值得进一步研究的主题。此外,结合使用机器学习和复杂网络的方法来研究股票市场更值得深入讨论和多元化发展。

数据可用性

使用的数据来支持本研究的发现已被存入https://www.kesci.com/home/数据集/ 5 c82706ed635ff002ca24a19

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是支持的,在某种程度上,由中国国家自然科学基金(授予号。71371200,71371200,71071168)。

引用

  1. 洛杉矶特谢拉和A . l . i . De Oliveira”自动股票交易技术分析相结合的方法和最近邻分类”专家系统与应用程序,37卷,不。10日,6885 - 6890年,2010页。视图:出版商的网站|谷歌学术搜索
  2. m .球磨机,d . Van Den Poel, n . Hespeels和r . Gryp”评估股票价格方向的多个分类器预测,“专家系统与应用程序,42卷,不。20日,第7056 - 7046页,2015年。视图:出版商的网站|谷歌学术搜索
  3. w·黄y Nakamori, S.-Y。王”,与支持向量机预测股市运动方向,”电脑与行动研究,32卷,不。10日,2513 - 2522年,2005页。视图:出版商的网站|谷歌学术搜索
  4. Y.-W。张,m . d . Chinn和a·g·帕斯卡”年代的实证汇率模型:有适合生存?”国际货币和金融杂志》上,24卷,不。7,1150 - 1175年,2005页。视图:出版商的网站|谷歌学术搜索
  5. g . Armano a Murru f . Roli,“股市预测的genetic-neural专家,”模式识别与人工智能》国际期刊上,16卷,不。5,501 - 526年,2002页。视图:出版商的网站|谷歌学术搜索
  6. a·h·穆贾达姆·m·h·穆贾达姆,m . Esfandyari”股票市场指数使用人工神经网络预测,“杂志的经济、金融和管理科学,21卷,不。41岁,89 - 93年,2016页。视图:出版商的网站|谷歌学术搜索
  7. r·瓦哈卜和k Garg股票市场预测的混合机器学习系统39卷,2008。
  8. 崔y . k . Kwon s s和b . r .月亮,“股票预测基于金融相关,”《会议遗传进化计算,2005年。视图:谷歌学术搜索
  9. l . Lacasa诉尼科西亚,诉Latora”网络结构的多元时间序列,科学报告,5卷,2015年。视图:谷歌学术搜索
  10. l . y . m . Wang Chen, s .江z田,和r·杜”波动行为分析国际原油和汽油价格基于复杂网络的角度来看,“应用能源卷,175年,第127 - 109页,2016年。视图:出版商的网站|谷歌学术搜索
  11. b . m . Tabak t·r·塞拉,d . o . Cajueiro”股票市场网络的拓扑属性:巴西的情况下,“自然史答:统计力学及其应用,卷389,不。16,3240 - 3249年,2010页。视图:出版商的网站|谷歌学术搜索
  12. b . l . Lacasa,卢克,f . Ballesteros j .卢克和j·c·努诺-“从时间序列到复杂网络:可见性图表,“美国国家科学院院刊》上的美利坚合众国,卷105,不。13日,4972 - 4975年,2008页。视图:出版商的网站|谷歌学术搜索
  13. z高,Cai, y, w .党和美国,“多尺度有限穿透水平能见度图分析非线性timeseries,”科学报告》第六卷,没有。1,文章ID 35622, 2016。视图:出版商的网站|谷歌学术搜索
  14. e .壮族m小,g .冯”发达的金融市场时间序列分析的集成使用可见性图表,”自然史答:统计力学及其应用卷,410年,第495 - 483页,2014年。视图:出版商的网站|谷歌学术搜索
  15. r·v·唐纳y邹,j . f .董n . Marwan和j . Kurths“递归网络小说范式对非线性时间序列分析,“新物理学杂志,12卷,不。第三条ID 033025, 2010。视图:出版商的网站|谷歌学术搜索
  16. h . y . Li曹,y . Tan“小说基于网络图,识别时间序列方法”复杂性,17卷,不。1,13-34,2011页。视图:出版商的网站|谷歌学术搜索
  17. n . Marwan j . f .董y邹,r·v·唐纳和j . Kurths“复杂网络方法复发时间序列的分析,“物理信,卷373,不。46岁,4246 - 4254年,2009页。视图:出版商的网站|谷歌学术搜索
  18. h . y . Li曹,y . Tan“比较两种方法的建模大规模数据时间序列的复杂网络,”每年的进步,1卷,不。1、文章ID 012103 p。509年,2011年。视图:出版商的网站|谷歌学术搜索
  19. y杨和h·杨,“复杂的基于网络的时间序列分析,自然史答:统计力学及其应用,卷387,不。5 - 6,1381 - 1386年,2008页。视图:出版商的网站|谷歌学术搜索
  20. A . m . Wang l . m . Vilela l .田h . Xu和r·杜”一个新的时间序列预测方法基于复杂网络理论,”学报》第五届IEEE国际会议上大数据,2017年(大数据)2017年12月,页4170 - 4175。视图:谷歌学术搜索
  21. Ikeguchi t . y .什t .木村,混沌动力学分析,利用复杂网络理论的措施施普林格,柏林,德国,2008年。
  22. x徐、张j . m .小,“总科现象和网络诱导时间系列的主题,“美国国家科学与美利坚合众国,卷105,不。50岁,19601 - 19605年,2008页。视图:出版商的网站|谷歌学术搜索
  23. z z, w . Er-Hong Ming-Yuan, m . Qing-Hao”定向加权复杂网络基于时间序列符号模式表示,“《物理学报》,卷66,不。21日,ID 210502条,2017年。视图:出版商的网站|谷歌学术搜索
  24. W.-Q。黄,s .姚明,X.-T。壮族,“网络动态模型基于SSE综合指数和成交量波动,”东北大学学报没有,卷。31日。10日,1516 - 1520年,2010页。视图:谷歌学术搜索
  25. s·h·金和s . h .春”分级预测使用双相情感预测:数组的应用概率神经网络股市指数,”国际期刊的预测,14卷,不。3、323 - 337年,1998页。视图:出版商的网站|谷歌学术搜索
  26. j·帕特尔沙,p .塔迦尔,k . Kotecha”预测股票和股票价格指数运动使用确定性趋势数据准备和机器学习技术,”专家系统与应用程序,42卷,不。1,第268 - 259页,2015。视图:出版商的网站|谷歌学术搜索
  27. M.-C。吴,S.-Y。林和学术界。林”,一个有效的决策树应用于股票交易,”专家系统与应用程序没有,卷。31日。2、270 - 274年,2006页。视图:出版商的网站|谷歌学术搜索
  28. 苏和m . v . s . t . Nambi”分类指数运动使用再邻国(事例)算法,”圆柱交易信息科学和应用程序,9卷,不。9日,第270 - 261页,2012年。视图:谷歌学术搜索
  29. a·w·c·g·艾特克森称,摩尔,s . Schaal“局部加权学习”,人工智能审查,11卷,不。1 - 5、11 - 73、1997页。视图:出版商的网站|谷歌学术搜索
  30. C.-J。黄,D.-X。杨,Y.-T。壮族”应用程序的包装器方法和组合分类器股票趋势预测,“专家系统与应用程序,34卷,不。4、2870 - 2878年,2008页。视图:出版商的网站|谷歌学术搜索
  31. Mitra和t .阿数据挖掘:多媒体,软计算和生物信息学约翰•威利& Sons 2005。
  32. 诉Cherkassky”,统计学习理论的本质。”技术计量学,38卷,不。4、409 - 409年,1996页。视图:出版商的网站|谷歌学术搜索
  33. W.-M。林,学术界。吴,学术界。林,F.-S。程,“多重电能质量扰动分类使用支持向量机和one-versus-one方法,”《2006年国际会议上电力系统技术,POWERCON20062006年10月,中国。视图:谷歌学术搜索
  34. f·李和j·肖,”如何获得有效slide-window大小在时间序列相似性搜索,“计算机科学与技术的前沿》杂志上,3卷,不。1,第112 - 105页,2009。视图:谷歌学术搜索
  35. x太阳,m .小y赵,x天雪,“系统动力学特征加权和定向网络由时间序列数据,”混乱:一个跨学科的非线性科学》杂志上,24卷,不。2篇文章ID 024402 9页,2014。视图:出版商的网站|谷歌学术搜索|MathSciNet
  36. l·c·弗里曼,”中心在社交网络概念澄清,“社交网络,1卷,不。3,页215 - 239,1978 - 1979。视图:出版商的网站|谷歌学术搜索
  37. a·w·沃尔夫,“社会网络分析:方法和应用,”美国人种学者,24卷,不。4、136 - 137年,1995页。视图:出版商的网站|谷歌学术搜索
  38. k .胫骨、t·s·李和h·金,”一个在破产预测模型,应用支持向量机”专家系统与应用程序,28卷,不。1,第135 - 127页,2005。视图:出版商的网站|谷歌学术搜索
  39. 美国Arlot和A . Celisse”为模型选择交叉验证的调查程序,”统计调查4卷,40 - 79年,2010页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  40. g·c·考利和n l·c·托尔伯特”,有效分析交叉验证的内核fisher判别分类器,”模式识别,36卷,不。11日,第2592 - 2585页,2003年。视图:出版商的网站|谷歌学术搜索
  41. x l .夏,d .你,江,Guobc,“全球金融危机比较和当地股市灾难在中国股票网络之上,“自然史统计力学中的应用文章ID S0378437117307227卷。490年,第230 - 222页,2017年。视图:谷歌学术搜索
  42. z周和y,2011年机器学习及其应用,清华大学出版社,北京,2009。
  43. x王、h·雪和w·贾预测模型的股票的罗辛和基于BP神经网络的感觉,价值工程,2010。
  44. k . b .二醚K.-H。李,i m . Werner”卖空交易策略和回报可预见性。”金融研究,22卷,不。2、575 - 607年,2009页。视图:出版商的网站|谷歌学术搜索

版权©2019 Hongduo曹等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点8181年
下载2197年
引用

相关文章

文章奖:2020年杰出的研究贡献,选择由我们的首席编辑。获奖的文章阅读