文摘
极端事件,通常表现为广义极值(GEV)模型,可以表现出长期记忆,需要量化的影响。众所周知,极端的复发间隔可以更好地描述的重大影响长期记忆比使用GEV模型。我们基于时间序列数据集的统计分析后,利维稳定分布确认拉伸指数分布可以描述一个广泛的记忆行为从指数分布间隔(无内存)过渡到幂律分布的(强大的内存或分形标度性),扩展以前的评价拉伸指数函数使用高斯/指数分布的随机数据。进一步的偏差和讨论的历史悖论(即。,the residual waiting time tends to increase with an increasing elapsed time under long-term memory) are also provided, based on the theoretical analysis of the Bayesian law and the stretched exponential distribution.
1。介绍
极端事件在复杂系统已经广泛探索几十年来,如自然灾害等极端气候事件(1],megalandslides [2),和地震3,4),引起严重的挑战在经济、社会和环境。极端事件的集群现象意味着长期记忆的存在(5,6]。这些现象被广泛观察到河的水位(7),海洋温度波动(8),大规模的气候温度(9),等等。广义极值分布模型(GEV)(或间隔模型)设计分析中的最大间隔(见图1(一),人工随机数据生成使用利维稳定分布,这将进一步讨论部分2)。根据传统的极值定理,这些极端将收敛于三个广义极值分布:邻,甘力克,威布尔10]。尽管GEV模型取得了许多成功的和实证结果10,11,12),它是一个基于独立和恒等分布的统计模型(先验知识)数据调查概率密度分布特征没有时间记忆的影响(13]。预测分布的尾部,低概率高的影响,无法准确地使用传统的极端获取统计数据,因为它是不可能获得的有效描述空间概率密度分布或先验知识。
(一)
(b)
先前的研究已经证实,复发时间分析(见图1 (b))是一个强大的工具来描述时间扩展属性和推导定量风险评估的危险事件(14]。该方法可以更有效地使用实验数据和特征时间尺度的物理相关性。同时,先前的研究表明,极端事件的复发没有必要遵循纯粹的无记忆的泊松分布(15,16]。
本研究旨在调查极端事件与内存使用两个主要步骤。首先,我们将确定嵌入在极端事件记忆效应。记忆效应可以表现为自相关函数(17,18),例如,一个归一化时间序列{}( ): 幂律衰减和相关指数 。在这项研究中,我们使用去趋势波动分析(DFA) [21)来检测这种long-correlated行为与赫斯特指数 。对于长期的相关数据,赫斯特指数= (22- - - - - -25] 在哪里 。拉伸指数分布与相关指数提出了在17- - - - - -20.然后采用描述复发时间)。
第二,我们将探索时间记忆的影响的预测极端事件基于利维稳定后的人工数据分布。根据先前的事件的记忆行为,可能会有一种改进的估计未来事件发生的概率。直接量化这种影响,我们将戴维斯et al。26):“去年地震以来的时间越长,时间越长,直到下一个预期的时间?“因此,我们将运用拉伸指数分布,这是一个广泛使用的统计模型描述时间记忆功能,探索可能的“悖论”之间的残余的等待和运行时间。通过扩展的数值分析文献[26- - - - - -28),索尔内特和Knopoff提出一个严格的定量统计框架条件概率的反应,发现这个框架非常敏感假定分布(29日]。在此,我们将试图提供一个推导这一悖论(剩余等待时间增加运行时间在长期记忆),基于贝叶斯法的理论分析和拉伸指数分布。
这也是值得注意的,我们选择利维稳定分布来量化时间序列的重尾分布时分析极端事件。提醒需要在生成长期记忆的时间序列数据,因为幂律过程的非高斯分布特征无法使用传统统计模型分析,如高斯分布和对数正态分布17,18,30.]。基于大量的成功的调查利维稳定分布在实际应用31日,32),在这里,我们描述heavy-tail行为的时间序列使用利维稳定分布稳定指数(0 )。我们应用利维稳定分布和赫斯特指数线性分式稳定噪声(LFSN)来模拟heavy-tail和长时记忆过程,然后研究极值的性质使用上面的方法提出了行为。
接下来的工作是组织如下。节2介绍LFSN模型和解释用来测试仿真参数极值统计行为。节3的缺陷,我们将展示传统极值统计模型在描述时间的行为。时间记忆的重现期的影响然后使用拉伸指数分布描述。此外,基于贝叶斯理论和拉伸指数统计模型,推导出上述“悖论”的原则。结论部分4。
2。方法
2.1。随机数生成
利维稳定分布包含四个参数:稳定指数( ),偏态参数( 1)、尺度参数( ),和位置参数( )。我们采用利维稳定分布提供洞察力heavy-tail概率分布,这heavy-tail模拟控制的稳定指数波动过程α<2在本研究[33]。在下面,我们使用的随机数生成方法征收钱伯斯等人提出的分布进行分析(34]。算法的更多细节可以在[35]。
线性分式稳定运动(LFSM)是一种泛化的分数布朗运动(fBm) [36]。LFSN,这是一个增量LFSM的过程,显示异常波动和长期记忆通过赫斯特指数和稳定指数 。给出LFSM随机过程如下(37]: 在哪里 在这 , , 是一个标准的对称稳定的征收随机测量 。线性分式稳定噪音一样的LFSM增量过程 在哪里 和提出了长期记忆的时候 ,它可以减少时分数高斯噪声 。在我们的人工数据生成稳定指数 赫斯特参数 对应于相关指数 (见2),生成的数据的数量 。
2.2。长期记忆的影响和非高斯过程GEV统计数据
在古典GEV模型中,假设之一 是独立的,恒等分布的累积分布函数描述的数据吗 。最大值 也是一个元素的原始数据。因此,分布的最大值满足
根据Fisher-Tippett极值定理,如果有恒定的列 和 , 是一个非退化分布函数。因此,必须收敛到一个极值分布的三种类型根据原始数据的分布,当数据的数量吗 (9]。对幂律分布后的原始数据,收敛于f分布,或II型分布,这被定义为 在哪里是位置参数,代表尺度参数,是形状参数。
图2显示了概率密度分布的比较为相关( )和不相关的数据 (对应年度最大值)。长期记忆的分布数据(蓝色)转向左边与不相关的序列相比,和左尾展览一个明显扩大的趋势,这是符合一个提供(18]。值得注意的是偏态的概率密度分布的相关数据后,利维稳定分布集中的研究显然比高斯分布和指数分布后,认为在18]。这种差异主要是因为利维稳定分布是一个中间part-dominated沉重的尾巴,而高斯分布和指数分布。同样清楚的是,长期记忆的分布数据(由蓝线在图表示2)更发散与不相关的序列相比,特别是在左边。这个结果显示内存或相关性的作用的影响,使许多大值事件是集中在特定的时间间隔而其他时期的最大值一般很小。因为大的值将仍然认定为年度最大值,极端的右尾分布几乎是相关性的影响。GEV模型不能清晰的反应时间的行为。
当我们研究极值问题,重现期的极端值的计算是一个非常重要的部分。为的最大价值,相应的概率 。因此,重现期的最大价值估计分位数的概率 ,我们可以得到的
在这里,我们让 然后估计一个百年不遇的最大的两个不同的内存行为数据(在图分析2)。通过(8), , ,我们可以找到 。值得注意的是获得的重现值具有较强的实用意义上的片面性,和传统极值模型不能描述时间相关行为的因素。
3所示。结果与讨论
3.1。极端复发时间的统计数据
我们分析了返回时间间隔超过阈值返回时间长期时间序列相关的统计数据。不相关的数据,如“白噪音”,返回的时间间隔也不相关的和遵循指数分布根据泊松统计(12]。当返回的时间间隔的影响长期的相关性,展品显著慢衰减指数比泊松分布。这慢衰减可以被拉伸指数分布(38,39]: 的指数的相关指数来描述内存数据,参数和是独立的 ,和的平均回报在给定的阈值区间吗 。在研究的普遍性(9),四个不同的原始分布数据的返回区间函数(高斯、指数、幂律,对数正态)被安装在14),结果表明,拉伸指数同意与高斯数据和其他发行版也不错。还值得注意的是,复发时间的拉伸指数分布可以完全来自更深层的过程,也就是说,霍克斯的interevent触发过程(40]。
图3显示的分布返回的时间间隔原始数据(红色标志)和重组数据(新10−1显示的黑色符号)。在这两种情况下,只反映了变化的比率 ,复发时间分析的应用不再局限于实际的阈值 。图3也证实,慢吞吞的分布函数是指数级的数据。
与不相关的数据的结果相比,指数的影响在(9)使返回间隔表现出明显的两级分化。更直观地说,返回时间间隔的 和 要更频繁的内存比不相关的数据记录。这意味着的意思是一个可怜的描述,因为分析对象没有典型的规模或“特征”规模是失踪,或广泛的被称为“无尺度”现象41]。这也意味着从指数分布的变化( 幂律分布)( 当该指数减少(相关性程度的增加)42]。这意味着拉伸指数分布是subslow衰减分布和指数分布之间的幂律分布 的幂律关系是一种统计的分形强调所有尺度上的相似性19,43]。因此,拉伸指数分布的subslow衰变实际上是一个无标度统计表单或的结果从一个nonsimilarity结构过渡到一个完全统计分形结构。
3.2。“悖论”现象的长期记忆效应下的剩余等待时间
根据在上面的部分中,讨论“集群”现象意味着数据有着悠久的记忆效应,发生的事件不再是一个简单的无记忆的泊松指数分布。慢衰减的拉伸指数分布体现了发生的事件作为一个“无标度”的过程。这个时间的行为可以量化的事件之前,所以将会有一个相应的可预测的影响下一个事件的发生。一般来说,它反映了过去的依赖返回之前的间隔时间间隔。的等待时间到下一个事件的时间间隔也遵循拉伸指数分布。
由et al。17]讨论了记忆效应的存在,根据仿真数据和获得剩余等待时间的“悖论”现象 增加而增加和 。在这里,我们试图获得一个特定的示范和异常结果量化,基于拟合参数指数分布如图3。在接下来的推导,我们采用数值分析方法引入了索尔内特和Knopoff29日]。
首先,我们假设P(r)返回间隔分布,和未知剩余等待时间满足之前的假设 。根据条件概率贝叶斯定理,分布函数满足
在这里,我们预期的等待时间是时间的函数和分析的变化规律 。从(10),预计等待时间计算
开发一些直觉,我们首先分析了泊松指数分布。从(10),我们可以得到
对应于指数分布没有记忆,时间的估计不依赖于运行时间 ,与 。至于拉伸指数,从(9)和(10),我们得到
然后我们计算(13)使用Gauss-Kronrod集成的方法。图4显示的分布在时间 , , 基于图的拟合结果3。很明显,有逐步扩大的尾巴的起源吗增加和谎言之上在 ;的概率,大量剩余的等待时间随着时间增加增加。异常结果的答案是正的,这个属性显然是与衰减缓慢相比之下,泊松指数分布。
当我们进一步研究预期的时间之间的关系((1))和运行时间基于拟合结果图3,一个人可以发现预期的等待时间取决于 ,相比之下,无记忆数据的指数分布。它清楚地显示不同的长期相关性的影响,预计剩余时间到下一个事件的增加而增加 。同时,反常行为增加的程度,这变化是增强通过减少 。这个结果意味着依赖记忆效应的存在不仅相邻回报之间的间隔,还在未知的等待时间之间的时间间隔和运行时间 。这个结果证实这项发现在之前的统计分析(17]。
4所示。结论
本研究主要探讨记忆效应的影响在极值模型,基于随机数据生成的利维稳定分布,这是不同于以前的评估使用高斯或指数分布在17,18]。结合非高斯和记忆效应,LFSN用于模拟实验数据。仿真结果表明,拉伸指数分布提供了一种可靠的方法来估计的扩展行为极端事件的时间间隔,概括前面的评价后的拉伸指数函数来分析随机数据高斯分布和指数分布。使用贝叶斯统计原则与条件指数分布,我们还从理论上验证各种研究发现的“反常”行为(17,18)(剩余等待时间可以增加一个增加运行时间在长期记忆或所谓的“异常停留时间”),这可能揭示现实世界的极端事件的预测。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作是由中国国家自然科学基金支持下批准号。11572112,41628202,41330632和基础研究基金批准号下的中央大学2017 b21614。