复杂性

在这一页上

文摘介绍结果结论数据可用性的利益冲突确认引用版权相关文章

研究文章|开放获取

体积2019年| 文章的ID5320686| https://doi.org/10.1155/2019/5320686

预测金融极端基于加权视觉图形的主要股指

Dong-Rui陈,¹ 壮族刘 ,¹ yi cheng张,^1、2 和Zi-Ke张 ^1、3

学术编辑器: 露西娅瓦伦蒂娜Gambuzza

收到了 2019年6月3日

修改后的 2019年8月20日

接受 2019年9月23日

发表 2019年10月31日

文摘

理解和预测极端的转折点在金融市场上,金融泡沫和崩溃等,近年来吸引了大量关注。实验观察表示指数增加的价格之前崩溃表明金融极端的可预测性。在这项研究中,我们的目标是预测极端事件在股票市场上使用19年的时间序列数据(2000年1月- 2018年12月)的金融市场,包括12种全球股票指数。此外,我们提出一个极端指标通过网络,它是由价格时间序列使用加权视觉图形算法。股票指数12日实验结果表明,该指标可以预测金融极端很好。

1。介绍

股票市场是全球金融市场的一个重要组成部分。自进入股票市场相对比较容易和回报是可观的,股票市场已经成为一个主要市场普通投资者的投资活动。然而,相比之下,发达国家的资本市场如美国,新兴股票市场,作为代表中国,更不稳定,和他们的系统风险要大得多,由于成立时间短和不完善的制度体系。因此,模拟股市和做出准确的预测是非常有用的对于投资者和监管当局管理系统风险(1]。金融极端,如泡沫,崩溃,和篮板,起到至关重要的作用在股票市场,研究和预测金融极端使用股票市场指数也是一个热门话题在金融市场的研究2- - - - - -4]。

在过去的十年中,已经有越来越多的文献解决复杂网络方法的使用动力系统基于时间序列的特征。至少有三个主类网络表示方法将时间序列(5),如接近网络(6),过渡网络(7),和可见性图表(8]。接近网络的连通性是由共同的统计相似性或度量时间序列的不同部分之间的距离。张和小介绍一个方法来把伪周期时间序列转换成网络,中周期时间序列被认为是节点,和边缘是由时间周期之间的相关性的强度(6]。许等人提出另一种方法的相空间点被认为是网络中的节点,每个节点和最亲密的链接k邻居们形成一个复杂的网络9]。产生顺序分区转移网络,时间序列使用序数象征模式。顺序模式作为网络的节点,和导演边缘是基于时间的顺序模式(10]。2008年由Lacasa能见度图算法,节点对应的时间序列的数据点,和一个边缘连接两个节点分配如果他们可以看到对方。可见图算法可以将所有类型的时间序列映射到网络,通过将一系列定期转换为正则图,一系列随机随机图,和一个分形序列变成一个无标度网络8,11- - - - - -14]。

基于可见性框架,水平能见度算法(15和有限的穿透可见性算法生成16]。斯蒂芬等人提取的所有段时间序列与一个预定义的窗口大小和映射每个段可见性图表。先后发生的可见性图表依次相连。链接的权重反映的转让行为的州(17]。此外,燕和Serooskerken提出一个绝对的隐形图,这是恰恰相反的可见性算法,预测股票价格的槽点(18]。低复杂度和良好的几何性质,可见性图表已广泛应用于多种时间序列,包括湍流(19),太阳黑子系列(20.)、心电图(ecg) [21),工程造价指数(CCI) [22,23),和金融市场(24- - - - - -28]。

基于之前的成就,我们构建了一个加权视觉图(包括绝对隐身可见性图表和图表),边缘的重量被定义为价格差异的组合和相应的节点的时间间隔。然后,我们提出了一种新的基于加权预测指标的金融极端的视觉图形。金融市场被定义为极端的峰值(或槽)点,这是最大(或最小)在一段时间内股票价格指数。12日实验指标显示强大的预测能力的指标。

本文的其余部分组织如下。节2,我们描述的数据用于这项工作并提出金融极端的指标。节312日,我们将展示实验结果股票指数。结论部分4。

2。方法和数据描述

2.1。数据描述

一系列的股票市场指数可以反映市场的整体运动。我们收集了来自雅虎财经(12个主要的股票市场指数https://finance.yahoo.com)和《每日收盘价系列用于大约19年,从2000年1月至2018年12月。在此期间,大约有4500个交易日(准确的交易日可能稍微不同的指标之间)。的极端(波峰或波谷点)金融市场被定义为最大(或最小)在一段时间的股票指数。表1显示的信息和基本统计12股指,一个= 45b= 131(这些变量将在稍后解释)。在这项工作中,我们提出对这些数据集的极端情况的一个指标。

2.2。问题定义

在这项研究中,我们定义了金融市场的极端峰值(或槽)点最大(或最小)在一段时间的股票指数。在这种情况下,我们的目标是找到一个指标,具有较强的预测能力(或槽)峰值点。数学上,对于一个给定的股票价格时间序列 ,在哪里t是时间变量和y价格价值t点时间t是一个高峰(或槽)点是最大(或最小)的价格在此期间 ,在哪里一个和b后的交易日(一个)和(b)当前日期,分别。在前面的工作(18),我们选择和 ,表示交易日的数量在6个月和2个月,分别。总共的数量高峰和低谷点中的每个股票指数被认为是段表中所示1。图1说明了高峰和低谷的上海证交所(SSE)指数。我们在这项工作的目标是预测是否(或槽)峰值点会出现在接下来的几天。

2.3。建设绝对隐身可见性图表和图表

2.3.1。可见性图表

在这项工作中,我们发现极端的指标从网络的角度来看,但是我们首先简要介绍可见性图表Lacasa et al .,提出的算法是最常用的方法来将一个时间序列转换成一个网络(8]。对于一个系列 ,两个节点之间存在明显的优势和 ,如果任何节点位于它们之间满足

图2(一个)是一个示意图的可见性图表转换从上交所的系列指数在2015年1月的每日收盘价。自然数是用来标志着交易日。它们之间的点和线组成的可见性图表。节点对应于相同的顺序序列数据和一条边连接的两个节点,如果可以看到另一个(它们之间的可见性)。分10和16图2(一个)为例来解释“可见性”的概念分10和16之间有五个点(11 - 15),都是红线从10点到16。节点之间存在一个链接(能见度)10和16。能见度的定义图,节点有一个很大的价格会更有可能有更多的链接,这是预测的基本方法峰值点。

(一)

(b)

(c)

(d)

2.3.2。绝对看不见图

绝对看不见图算法(18是恰恰相反的可见性的算法。对于一个系列 ,两个节点之间存在绝对的隐形边缘和 ,如果任何节点位于它们之间满足

图2 (b)是一个绝对的隐形图的示意图。分12和16图2 (b)作为一个例子来解释的概念分12和16之间的“绝对隐形”有三个点(13、14、15)以上的线从12到16点。因此,每一个点位于12和16可以阻碍12和16之间的可见性,和一个链接(绝对隐身)存在。绝对看不见图的定义,节点以极低的价格将更有可能有更多的链接,这是预测的基本方法槽点。

基于可见性图表和绝对隐形图算法,燕和Serooskerken提出一项指标来预测时间序列的极值(18]。文章的方法显示了将会有更多可能的出现的极端值如果程度相应的节点比其他的要高得多。

2.4。指标的极端

应该指出的是,上述方法只考虑两个节点之间的边,错过很多原系列的详细信息。以可见性图表为例(图2(一个)),分11和12之间的联系,分11和13之间没有差异在最初的可见性图表。然而,不同的变种是非常重要的,也是一个重要因素相关的极端。因此,我们提出一种加权视觉图(WVG),认为两者之间的变异点基于最初的可见性图表或绝对看不见图。如图2 (c),虚线代表水平视线,实线和虚线之间的角度定义为大萧条角。一对节点满足可见性的视觉条件图(或绝对看不见图),它们之间的边缘的重量被定义为俯视角的正切值:

与原来的可见性图表(或绝对看不见图)算法,WVG算法考虑更多的细节,如两个点之间的时间间隔和价格变化的时间序列。应该注意的是,如果价格增加,抑郁的角度是正的,积极的重量,反之亦然。在整个时间序列中,我们使用的观察窗年代天的数据构建加权视觉图。对于每个图形转换从相应的时间窗口,我们定义和为加权视觉图形的指标来预测高峰和低谷的外观点在接下来的几天,分别。预测峰值点,我们使用加权的可见性图表,和被定义为

预测槽点,我们使用加权绝对隐形图,被定义为在哪里我观察窗口,代表了最右边的点年代观察窗的长度。

加权的视觉图形,每个节点的结构附近的值很敏感。受到邻居们的影响,这些指标基于可见性图表和绝对隐形图波动频繁。例如,数据显示2(一个)和2 (b),很明显,分16日和17日,虽然这两天的价格是相似的,相应的指标是非常不同的。减少相邻点的影响,我们认为观测的邻居节点作为一个整体(如图2 (d)),累计加权指标可以计算如下: 在哪里n决定的大小考虑累积的邻居。

3所示。结果和讨论

3.1。比较的方法

指标基于(D)和程度的累积程度(广告)的可见性图表和绝对隐形图应用比较方法。这项工作总结在表中使用的指标2。

3.2。指标

我们设置观察窗的长度262 (年代= 262)交易日,其移动一步= 1天。对于每一个观察窗,我们计算表中列出的指标2,我们希望峰值点(或槽点)会出现在接下来的45岁(一个= 45天,如果指标具有重要意义。因此,我们选择不同的阈值为指标观察预测。一旦指示值大于阈值,我们相信会有一个峰值(或槽)后45天内点最右边的点对应的窗口。为了测试提出的性能指标,我们计算精度(P和回忆R分别)。假设是极端的数量(波峰或波谷点)的总时间系列,的数量的预测极端值大于阈值和指标极端的预测数量,这是真正的极端。精度可以通过和回忆。大型精密手段方法的高精度和大召回预计意味着更多的极端。虽然精度和召回两种竞争措施的性能,我们使用F1得分为最主要的测量。F1分数定义如下:

3.3。实验结果

首先,我们以SSE指数情况为例来说明预测过程。对于每个观测时间窗口,我们可以获得一个指标根据表中列出的方程2。数据3和4显示指标的分配基于波峰和波谷点的各种方法,分别。黄色的酒吧代表指标的值,蓝色的点是指数的价格(日志)系列。应该注意,第一年的指标不能计算,随着窗口大小等于262(大约1年)。根据这两个数据,之前总是会有一个很大的指标(或槽)峰值点,这表明,所有的指标都是有效的预测极端。然而,比较基于节点度(VG,数据指标3(一个)和4(一))和边(WVG,数字3 (b)和4 (b)),更清楚地指示值基于边检测的重要指标,在大多数指标的0和很少的指示值非常大,这是密切相关的(或槽)峰值点。

(一)

(b)

(c)

(d)

(一)

(b)

(c)

(d)

我们专注于一个特定的极端(金融危机)在2014年至2016年在上交所为例,显示极端事件的交互和指标。图5显示了部分形成的过程和相应的SSE指数泡沫破灭。2014年11月下旬,上交所指数开始上升逐渐由于宏观经济预期和宽松的货币政策。在2014年12月到2015年1月,上交所指数从2680年到3210年(近20%),这显然是一个超速增长的价格。因此,我们可以证实,一个泡沫形成。根据图5(一个)可以看到,它的波动峰值指标大幅增加在这一时期,和峰值指标的最大值出现在12月8日,2014年。峰值指标达到最大后,上交所指数继续上涨,和股票市场风险进一步增加。与此同时,金融监管当局采取更严格的措施,增加停在5166年6月12日,2015年。在下面两个自然月,上交所指数下跌超过42%,减少超速。在这个阶段有显著负泡沫。槽指标构建在这个工作也充分反映过程。如图5 (b)在负泡沫阶段,迅速增加槽的预测指标。2015年8月下旬,槽指标大幅波动。8月26日的最低点2927.29,槽相应指标达到最小。从图5(一个),我们注意到峰值指标也降低了负泡沫过程中,但槽指标的变化更敏感。

(一)

(b)

要测试该方法的性能,我们显示精度,回忆,和F1分高峰和低谷预测图6。积累的方法,邻居的数量设置为。水平轴代表不同的阈值指标,指标的值大于阈值表明峰(或槽)点在接下来的45个交易日。的指标通过不同的方法显示了显著差异(数据显示3和4),很难用具体的解释阈值。在这里,我们使用百分比来表示阈值在图6。例如,前20%表明前20%指标被视为极端的指标。不同的阈值,我们可以观察到精度增加而增加阈值(数字6(一)和6 (d)),因为太多的假阳性样本的阈值。类似的现象也被发现在其他预测场景,如推荐系统(29日)和链接预测在社交网络(30.]。有趣的是发现回忆是非常高(近100%)即使有很高的指示值的阈值,这意味着几乎所有真正的极端(波峰和波谷点)可以预测指标。根据图6,一个人可以发现这些指标,通过积累权重WVG(红酒吧,(或 )),比其他方法更准确的预测高峰和低谷点。此外,对于不同的阈值,改进仍然强劲。

(一)

(b)

(c)

(d)

(e)

(f)

图6表明该指标基于累积重量WVG是最好的方式来预测极端SSE指数系列。的计算(或 ),我们必须考虑邻居的数量(n)。图7说明了的影响n预测精度,代表了F1分。它应该指出只是(或 )不考虑邻居的影响力。图7表明,F1得分之间有很大的不同和 ,但增量变化时略有增加。这表明的影响n不是很重要,但考虑到邻居的影响是非常重要的。

(一)

(b)

我们检查提出的性能指标在12个主要财务指标。数据8和9呈现出F1高峰和低谷的四项指标得分点,分别。类似于上交所的结果,基于累积重量指标WVG方法明显优于其他所有12个数据集。

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(我)

(j)

(k)

(左)

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(我)

(j)

(k)

(左)

在前面的实验中,参数总是保持不变(一个= 45,b= 131,年代= 262)。为了测试这些参数的影响,我们选择不同的参数组合,一个= 20、30、40、50、60、70、80年和90年,b= 90,125,160,195,230,265,300,335,和370,年代= 101,131,181,221,262,350,和400年计算F上交所1分数数据。数据10- - - - - -13说明组合的影响一个和b和一个和年代分别为高峰和低谷的预测。颜色代表了F1分。参数的影响是非常重要的在整个范围。然而,如果我们关注的地方 , ,和 ,的方差F1分是很轻微的,在这个区域的值也高得多。此外,结果基于AW也比其他方法在大多数情况下。同样的AUC,我们也算公关曲线下的面积来衡量比较四种方法的性能,在一个更大的曲线下面的面积表示更大的精度和较高的召回。和图14显示了区域分布。结果表明,该方法(AW)执行比其他人在大多数情况下。

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(我)

(j)

(k)

(左)

(m)

(n)

(o)

(p)

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(我)

(j)

(k)

(左)

(m)

(n)

(o)

(p)

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(我)

(j)

(k)

(左)

(m)

(n)

(o)

(p)

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(我)

(j)

(k)

(左)

(m)

(n)

(o)

(p)

4所示。结论

金融市场极端吸引关注由于其相关金融泡沫和崩溃。由于金融市场的极端复杂性,现象学对股票价格的调查数据中扮演着关键角色在获得更好的理解金融动态。在这项工作中,我们旨在预测金融极端基于股票指数从复杂网络的角度来看。金融极端被定义为(或槽)峰值点在股市长期工作。我们提出指标根据累计重量的WVG股价系列。实验结果在12个主要股票指数显示强大的预测能力的指标,这将是一个有效的指标对投资者使用调整他们的策略。

数据可用性

股票指数价格数据(12)用于这项工作可以从以下在线访问地址:https://finance.yahoo.com/world-indices。

的利益冲突

作者宣称没有利益冲突。

确认

本研究支持的部分浙江省自然科学基金(批准号。LR18A050001和LY18A050004)和中国自然科学基金(批准号61873080和61873080)。

引用

y盾,j。王,蔡博富。陈,“价格联动的谣言在股票市场和投资者风险传染bilayer-coupled网络”复杂性卷,2019篇文章ID 4727868, 21页,2019。
视图: 出版商的网站 | 谷歌学术搜索
s .阿里艾哈迈德,m·哈桑,r . Ostermark“极端的可预测性返回土耳其股市,”新兴市场金融和贸易,1-13,2019页。
视图: 出版商的网站 | 谷歌学术搜索
d·索尔内特和W.-X。周,”大未来的可预测性的变化主要金融指标,”国际期刊的预测,22卷,不。1,第168 - 153页,2006。
视图: 出版商的网站 | 谷歌学术搜索
a·约翰森、o . Ledoit和d·索尔内特”崩溃临界点。”国际理论和应用金融杂志》上,3卷,不。2、219 - 255年,2000页。
视图: 出版商的网站 | 谷歌学术搜索
y邹,r·v·唐纳n . Marwan j . f .董和j . Kurths“复杂网络的非线性时间序列分析方法”,物理的报告卷,787年,页1 - 97,2019。
视图: 出版商的网站 | 谷歌学术搜索
张先生和m .小”,从伪周期时间系列:复杂网络拓扑结构和动态,“物理评论快报,卷96,不。23日,ID 238701条,2006年。
视图: 出版商的网站 | 谷歌学术搜索
g . Nicolis a·g·坎图和c . Nicolis交互网络的动态方面,“国际期刊的分歧和混乱,15卷,不。11日,第3480 - 3467页,2005年。
视图: 出版商的网站 | 谷歌学术搜索
b . l . Lacasa,卢克,f . Ballesteros j .卢克和j·c·努诺-“从时间序列到复杂网络:可见性图表,“美国国家科学院院刊》上,卷105,不。13日,4972 - 4975年,2008页。
视图: 出版商的网站 | 谷歌学术搜索
X.-K。小徐、张j . m .,”总科现象和网络诱导时间系列的主题,“美国国家科学院院刊》上的美利坚合众国,卷105,不。50岁,19601 - 19605年,2008页。
视图: 出版商的网站 | 谷歌学术搜索
c . w . Kulp j . m . Chobot h·r·Freitas和g·d·Sprechini”使用顺序分区网络过渡到分析心电图数据,”混乱:一个跨学科的非线性科学》杂志上,26卷,不。7篇文章ID 073114 2016。
视图: 出版商的网站 | 谷歌学术搜索
h . m . Wang徐、l .田和h·尤金·斯坦利”程度分布和主题资料有限的穿透水平能见度的图表,“自然史答:统计力学及其应用卷,509年,第634 - 620页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
X.-H。倪,Z.-Q。江,W.-X。周”,度分布的可见性图表绘制从分数布朗运动和多重分形随机漫步,“物理信,卷373,不。42岁,3822 - 3826年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
j . b . l . Lacasa,卢克,卢克,j . c .努诺-“可见性图:一种新方法估算分数布朗运动的赫斯特指数,”EPL (Europhysics字母),卷86,不。3,p。30001年,2009年。
视图: 出版商的网站 | 谷歌学术搜索
l . Lacasa和r·托拉尔”的描述随机和混乱使用可见性图表系列,“物理评论E,卷82,不。第三条ID 036120, 2010。
视图: 出版商的网站 | 谷歌学术搜索
b·卢克l . Lacasa·Ballesteros和j·里克,“水平能见度图:确切结果随机时间序列,”物理评论E,卷80,不。4、文章ID 046103, 2009。
视图: 出版商的网站 | 谷歌学术搜索
T.-T。周,N.-D。金,Z.-K。高,“有限穿透可见性图表从时间序列建立复杂网络,”《物理学报》,卷61,不。第三条ID 030506, 2012。
视图: 谷歌学术搜索
m·斯蒂芬·c·顾,h·杨,“可见性图表时间序列分析为基础,《公共科学图书馆•综合》,10卷,不。11日文章ID e0143015, 2015。
视图: 出版商的网站 | 谷歌学术搜索
w .燕和e . v . Serooskerken”预测金融极端:一个网络角度超指数增长,”《公共科学图书馆•综合》,10卷,不。9篇文章ID e0128908 2015。
视图: 出版商的网站 | 谷歌学术搜索
c . Liu W.-X。周,W.-K。元,“可见性图的统计特性三维完全发展湍流能量耗散率的“自然史答:统计力学及其应用,卷389,不。13日,2675 - 2681年,2010页。
视图: 出版商的网站 | 谷歌学术搜索
刘y邹,m .小,z, j . Kurths“复杂网络的方法来描述太阳黑子的统计特性系列中,“新物理学杂志,16卷,不。1,文章ID 013051, 2014。
视图: 出版商的网站 | 谷歌学术搜索
h . Sivaraks a和c Ratanamahatana”,健壮的和准确的异常检测心电图工件使用时间序列主题发现,“计算和数学方法在医学文章ID 453214卷,2015年,20页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
b . r . Zhang Ashuri y邓,”一个新颖的方法,基于模糊逻辑的预测时间序列和可见性图表,“先进的数据分析和分类,11卷,不。4、759 - 783年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
b . r . Zhang Ashuri、y Shyr和y邓小平,“预测工程造价指数基于可见性图:网络的方法,”自然史答:统计力学及其应用卷,493年,第252 - 239页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
W.-D。李和X.-J。赵:“股票时间序列多尺度horizontal-visibility-graph相关分析”,EPL (Europhysics字母),卷122,不。4 p。40007年,2018年。
视图: 出版商的网站 | 谷歌学术搜索
M.-C。钱,Z.-Q。江,W.-X。周”,环球和nonuniversal异速生长的伸缩行为世界股票市场指数,可见性图表”物理学杂志》的一个,43卷,不。33岁的ID 335002条,2010年。
视图: 出版商的网站 | 谷歌学术搜索
l . Lacasa诉尼科西亚,诉Latora”网络结构的多元时间序列,科学报告,5卷,不。1,p。15508年,2015。
视图: 出版商的网站 | 谷歌学术搜索
m·d·Vamvakaris a . a . Pantelous和k . m . Zuev,”标准普尔500指数的时间序列分析:水平能见度图方法,”自然史答:统计力学及其应用卷。497年,41-51,2018页。
视图: 出版商的网站 | 谷歌学术搜索
e .壮族m小,g .冯”发达的金融市场时间序列分析的集成使用可见性图表,”自然史答:统计力学及其应用卷,410年,第495 - 483页,2014年。
视图: 出版商的网站 | 谷歌学术搜索
l, m . Medo c·h·杨,研究。张,Z.-K。张,t·周“推荐系统”,物理的报告,卷519,不。1,1-49,2012页。
视图: 出版商的网站 | 谷歌学术搜索
l . Lu和t .周”,在复杂网络链路预测:一项调查,”自然史答:统计力学及其应用,卷390,不。6,1150 - 1170年,2011页。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

1863年

下载

1367年

引用