文摘

理解和预测极端的转折点在金融市场上,金融泡沫和崩溃等,近年来吸引了大量关注。实验观察表示指数增加的价格之前崩溃表明金融极端的可预测性。在这项研究中,我们的目标是预测极端事件在股票市场上使用19年的时间序列数据(2000年1月- 2018年12月)的金融市场,包括12种全球股票指数。此外,我们提出一个极端指标通过网络,它是由价格时间序列使用加权视觉图形算法。股票指数12日实验结果表明,该指标可以预测金融极端很好。

1。介绍

股票市场是全球金融市场的一个重要组成部分。自进入股票市场相对比较容易和回报是可观的,股票市场已经成为一个主要市场普通投资者的投资活动。然而,相比之下,发达国家的资本市场如美国,新兴股票市场,作为代表中国,更不稳定,和他们的系统风险要大得多,由于成立时间短和不完善的制度体系。因此,模拟股市和做出准确的预测是非常有用的对于投资者和监管当局管理系统风险(1]。金融极端,如泡沫,崩溃,和篮板,起到至关重要的作用在股票市场,研究和预测金融极端使用股票市场指数也是一个热门话题在金融市场的研究2- - - - - -4]。

在过去的十年中,已经有越来越多的文献解决复杂网络方法的使用动力系统基于时间序列的特征。至少有三个主类网络表示方法将时间序列(5),如接近网络(6),过渡网络(7),和可见性图表(8]。接近网络的连通性是由共同的统计相似性或度量时间序列的不同部分之间的距离。张和小介绍一个方法来把伪周期时间序列转换成网络,中周期时间序列被认为是节点,和边缘是由时间周期之间的相关性的强度(6]。许等人提出另一种方法的相空间点被认为是网络中的节点,每个节点和最亲密的链接k邻居们形成一个复杂的网络9]。产生顺序分区转移网络,时间序列使用序数象征模式。顺序模式作为网络的节点,和导演边缘是基于时间的顺序模式(10]。2008年由Lacasa能见度图算法,节点对应的时间序列的数据点,和一个边缘连接两个节点分配如果他们可以看到对方。可见图算法可以将所有类型的时间序列映射到网络,通过将一系列定期转换为正则图,一系列随机随机图,和一个分形序列变成一个无标度网络8,11- - - - - -14]。

基于可见性框架,水平能见度算法(15和有限的穿透可见性算法生成16]。斯蒂芬等人提取的所有段时间序列与一个预定义的窗口大小和映射每个段可见性图表。先后发生的可见性图表依次相连。链接的权重反映的转让行为的州(17]。此外,燕和Serooskerken提出一个绝对的隐形图,这是恰恰相反的可见性算法,预测股票价格的槽点(18]。低复杂度和良好的几何性质,可见性图表已广泛应用于多种时间序列,包括湍流(19),太阳黑子系列(20.)、心电图(ecg) [21),工程造价指数(CCI) [22,23),和金融市场(24- - - - - -28]。

基于之前的成就,我们构建了一个加权视觉图(包括绝对隐身可见性图表和图表),边缘的重量被定义为价格差异的组合和相应的节点的时间间隔。然后,我们提出了一种新的基于加权预测指标的金融极端的视觉图形。金融市场被定义为极端的峰值(或槽)点,这是最大(或最小)在一段时间内股票价格指数。12日实验指标显示强大的预测能力的指标。

本文的其余部分组织如下。节2,我们描述的数据用于这项工作并提出金融极端的指标。节312日,我们将展示实验结果股票指数。结论部分4

2。方法和数据描述

2.1。数据描述

一系列的股票市场指数可以反映市场的整体运动。我们收集了来自雅虎财经(12个主要的股票市场指数https://finance.yahoo.com)和《每日收盘价系列用于大约19年,从2000年1月至2018年12月。在此期间,大约有4500个交易日(准确的交易日可能稍微不同的指标之间)。的极端(波峰或波谷点)金融市场被定义为最大(或最小)在一段时间的股票指数。表1显示的信息和基本统计12股指,一个= 45b= 131(这些变量将在稍后解释)。在这项工作中,我们提出对这些数据集的极端情况的一个指标。

2.2。问题定义

在这项研究中,我们定义了金融市场的极端峰值(或槽)点最大(或最小)在一段时间的股票指数。在这种情况下,我们的目标是找到一个指标,具有较强的预测能力(或槽)峰值点。数学上,对于一个给定的股票价格时间序列 ,在哪里t是时间变量和y价格价值t点时间t是一个高峰(或槽)点 是最大(或最小)的价格在此期间 ,在哪里一个b后的交易日(一个)和(b)当前日期,分别。在前面的工作(18),我们选择 ,表示交易日的数量在6个月和2个月,分别。总共的数量高峰和低谷点中的每个股票指数被认为是段表中所示1。图1说明了高峰和低谷的上海证交所(SSE)指数。我们在这项工作的目标是预测是否(或槽)峰值点会出现在接下来的几天。

2.3。建设绝对隐身可见性图表和图表
2.3.1。可见性图表

在这项工作中,我们发现极端的指标从网络的角度来看,但是我们首先简要介绍可见性图表Lacasa et al .,提出的算法是最常用的方法来将一个时间序列转换成一个网络(8]。对于一个系列 ,两个节点之间存在明显的优势 ,如果任何节点 位于它们之间满足

2(一个)是一个示意图的可见性图表转换从上交所的系列指数在2015年1月的每日收盘价。自然数是用来标志着交易日。它们之间的点和线组成的可见性图表。节点对应于相同的顺序序列数据和一条边连接的两个节点,如果可以看到另一个(它们之间的可见性)。分10和16图2(一个)为例来解释“可见性”的概念分10和16之间有五个点(11 - 15),都是红线从10点到16。节点之间存在一个链接(能见度)10和16。能见度的定义图,节点有一个很大的价格会更有可能有更多的链接,这是预测的基本方法峰值点。

2.3.2。绝对看不见图

绝对看不见图算法(18是恰恰相反的可见性的算法。对于一个系列 ,两个节点之间存在绝对的隐形边缘 ,如果任何节点 位于它们之间满足

2 (b)是一个绝对的隐形图的示意图。分12和16图2 (b)作为一个例子来解释的概念分12和16之间的“绝对隐形”有三个点(13、14、15)以上的线从12到16点。因此,每一个点位于12和16可以阻碍12和16之间的可见性,和一个链接(绝对隐身)存在。绝对看不见图的定义,节点以极低的价格将更有可能有更多的链接,这是预测的基本方法槽点。

基于可见性图表和绝对隐形图算法,燕和Serooskerken提出一项指标来预测时间序列的极值(18]。文章的方法显示了将会有更多可能的出现的极端值如果程度相应的节点比其他的要高得多。

2.4。指标的极端

应该指出的是,上述方法只考虑两个节点之间的边,错过很多原系列的详细信息。以可见性图表为例(图2(一个)),分11和12之间的联系,分11和13之间没有差异在最初的可见性图表。然而,不同的变种 是非常重要的,也是一个重要因素相关的极端。因此,我们提出一种加权视觉图(WVG),认为两者之间的变异点基于最初的可见性图表或绝对看不见图。如图2 (c),虚线代表水平视线,实线和虚线之间的角度定义为大萧条角。一对节点满足可见性的视觉条件图(或绝对看不见图),它们之间的边缘的重量被定义为俯视角的正切值:

与原来的可见性图表(或绝对看不见图)算法,WVG算法考虑更多的细节,如两个点之间的时间间隔和价格变化的时间序列。应该注意的是,如果价格增加,抑郁的角度是正的,积极的重量,反之亦然。在整个时间序列中,我们使用的观察窗年代天的数据构建加权视觉图。对于每个图形转换从相应的时间窗口,我们定义 为加权视觉图形的指标来预测高峰和低谷的外观点在接下来的几天,分别。预测峰值点,我们使用加权的可见性图表,和 被定义为

预测槽点,我们使用加权绝对隐形图, 被定义为 在哪里观察窗口,代表了最右边的点年代观察窗的长度。

加权的视觉图形,每个节点的结构附近的值很敏感。受到邻居们的影响,这些指标基于可见性图表和绝对隐形图波动频繁。例如,数据显示2(一个)2 (b),很明显,分16日和17日,虽然这两天的价格是相似的,相应的指标是非常不同的。减少相邻点的影响,我们认为观测的邻居节点作为一个整体(如图2 (d)),累计加权指标可以计算如下: 在哪里n决定的大小考虑累积的邻居。

3所示。结果和讨论

3.1。比较的方法

指标基于(D)和程度的累积程度(广告)的可见性图表和绝对隐形图应用比较方法。这项工作总结在表中使用的指标2

3.2。指标

我们设置观察窗的长度262 (年代= 262)交易日,其移动一步= 1天。对于每一个观察窗,我们计算表中列出的指标2,我们希望峰值点(或槽点)会出现在接下来的45岁(一个= 45天,如果指标具有重要意义。因此,我们选择不同的阈值为指标观察预测。一旦指示值大于阈值,我们相信会有一个峰值(或槽)后45天内点最右边的点对应的窗口。为了测试提出的性能指标,我们计算精度(P和回忆R分别)。假设 是极端的数量(波峰或波谷点)的总时间系列, 的数量的预测极端值大于阈值和指标 极端的预测数量,这是真正的极端。精度可以通过 和回忆 大型精密手段方法的高精度和大召回预计意味着更多的极端。虽然精度和召回两种竞争措施的性能,我们使用F1得分为最主要的测量。F1分数定义如下:

3.3。实验结果

首先,我们以SSE指数情况为例来说明预测过程。对于每个观测时间窗口,我们可以获得一个指标根据表中列出的方程2。数据34显示指标的分配基于波峰和波谷点的各种方法,分别。黄色的酒吧代表指标的值,蓝色的点是指数的价格(日志)系列。应该注意,第一年的指标不能计算,随着窗口大小等于262(大约1年)。根据这两个数据,之前总是会有一个很大的指标(或槽)峰值点,这表明,所有的指标都是有效的预测极端。然而,比较基于节点度(VG,数据指标3(一个)4(一))和边(WVG,数字3 (b)4 (b)),更清楚地指示值基于边检测的重要指标,在大多数指标的0和很少的指示值非常大,这是密切相关的(或槽)峰值点。

我们专注于一个特定的极端(金融危机)在2014年至2016年在上交所为例,显示极端事件的交互和指标。图5显示了部分形成的过程和相应的SSE指数泡沫破灭。2014年11月下旬,上交所指数开始上升逐渐由于宏观经济预期和宽松的货币政策。在2014年12月到2015年1月,上交所指数从2680年到3210年(近20%),这显然是一个超速增长的价格。因此,我们可以证实,一个泡沫形成。根据图5(一个)可以看到,它的波动峰值指标大幅增加在这一时期,和峰值指标的最大值出现在12月8日,2014年。峰值指标达到最大后,上交所指数继续上涨,和股票市场风险进一步增加。与此同时,金融监管当局采取更严格的措施,增加停在5166年6月12日,2015年。在下面两个自然月,上交所指数下跌超过42%,减少超速。在这个阶段有显著负泡沫。槽指标构建在这个工作也充分反映过程。如图5 (b)在负泡沫阶段,迅速增加槽的预测指标。2015年8月下旬,槽指标大幅波动。8月26日的最低点2927.29,槽相应指标达到最小。从图5(一个),我们注意到峰值指标也降低了负泡沫过程中,但槽指标的变化更敏感。

要测试该方法的性能,我们显示精度,回忆,和F1分高峰和低谷预测图6。积累的方法,邻居的数量设置为 水平轴代表不同的阈值指标,指标的值大于阈值表明峰(或槽)点在接下来的45个交易日。的指标通过不同的方法显示了显著差异(数据显示34),很难用具体的解释阈值。在这里,我们使用百分比来表示阈值在图6。例如,前20%表明前20%指标被视为极端的指标。不同的阈值,我们可以观察到精度增加而增加阈值(数字6(一)6 (d)),因为太多的假阳性样本的阈值。类似的现象也被发现在其他预测场景,如推荐系统(29日)和链接预测在社交网络(30.]。有趣的是发现回忆是非常高(近100%)即使有很高的指示值的阈值,这意味着几乎所有真正的极端(波峰和波谷点)可以预测指标。根据图6,一个人可以发现这些指标,通过积累权重WVG(红酒吧, (或 )),比其他方法更准确的预测高峰和低谷点。此外,对于不同的阈值,改进仍然强劲。

6表明该指标基于累积重量WVG是最好的方式来预测极端SSE指数系列。的计算 (或 ),我们必须考虑邻居的数量(n)。图7说明了的影响n预测精度,代表了F1分。它应该指出 只是 (或 )不考虑邻居的影响力。图7表明,F1得分之间有很大的不同 ,但增量变化时略有增加 这表明的影响n不是很重要,但考虑到邻居的影响是非常重要的。

我们检查提出的性能指标在12个主要财务指标。数据89呈现出F1高峰和低谷的四项指标得分点,分别。类似于上交所的结果,基于累积重量指标WVG方法明显优于其他所有12个数据集。

在前面的实验中,参数总是保持不变(一个= 45,b= 131,年代= 262)。为了测试这些参数的影响,我们选择不同的参数组合,一个= 20、30、40、50、60、70、80年和90年,b= 90,125,160,195,230,265,300,335,和370,年代= 101,131,181,221,262,350,和400年计算F上交所1分数数据。数据10- - - - - -13说明组合的影响一个b一个年代分别为高峰和低谷的预测。颜色代表了F1分。参数的影响是非常重要的在整个范围。然而,如果我们关注的地方 , , ,的方差F1分是很轻微的,在这个区域的值也高得多。此外,结果基于AW也比其他方法在大多数情况下。同样的AUC,我们也算公关曲线下的面积来衡量比较四种方法的性能,在一个更大的曲线下面的面积表示更大的精度和较高的召回。和图14显示了区域分布。结果表明,该方法(AW)执行比其他人在大多数情况下。

4所示。结论

金融市场极端吸引关注由于其相关金融泡沫和崩溃。由于金融市场的极端复杂性,现象学对股票价格的调查数据中扮演着关键角色在获得更好的理解金融动态。在这项工作中,我们旨在预测金融极端基于股票指数从复杂网络的角度来看。金融极端被定义为(或槽)峰值点在股市长期工作。我们提出指标根据累计重量的WVG股价系列。实验结果在12个主要股票指数显示强大的预测能力的指标,这将是一个有效的指标对投资者使用调整他们的策略。

数据可用性

股票指数价格数据(12)用于这项工作可以从以下在线访问地址:https://finance.yahoo.com/world-indices

的利益冲突

作者宣称没有利益冲突。

确认

本研究支持的部分浙江省自然科学基金(批准号。LR18A050001和LY18A050004)和中国自然科学基金(批准号61873080和61873080)。