复杂性

在这一页上

文摘介绍方法结果与讨论结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

故障识别、诊断和预测基于复杂的信号分析

把这个特殊的问题

研究文章|开放获取

体积2018年| 文章的ID5913976| https://doi.org/10.1155/2018/5913976

调查拉伸指数函数量化长期记忆的极端事件后基于人工数据利维稳定分布

红光的太阳 ,¹ 林元,¹ 勇张 ,^1、2 和尼古拉斯Privitera²

学术编辑器: Gangbing歌

收到了 2018年1月29日

修改后的 2018年4月17日

接受 2018年5月13日

发表 2018年7月3日

文摘

极端事件,通常表现为广义极值(GEV)模型,可以表现出长期记忆,需要量化的影响。众所周知,极端的复发间隔可以更好地描述的重大影响长期记忆比使用GEV模型。我们基于时间序列数据集的统计分析后,利维稳定分布确认拉伸指数分布可以描述一个广泛的记忆行为从指数分布间隔(无内存)过渡到幂律分布的(强大的内存或分形标度性),扩展以前的评价拉伸指数函数使用高斯/指数分布的随机数据。进一步的偏差和讨论的历史悖论(即。,the residual waiting time tends to increase with an increasing elapsed time under long-term memory) are also provided, based on the theoretical analysis of the Bayesian law and the stretched exponential distribution.

1。介绍

极端事件在复杂系统已经广泛探索几十年来,如自然灾害等极端气候事件(1],megalandslides [2),和地震3,4),引起严重的挑战在经济、社会和环境。极端事件的集群现象意味着长期记忆的存在(5,6]。这些现象被广泛观察到河的水位(7),海洋温度波动(8),大规模的气候温度(9),等等。广义极值分布模型(GEV)(或间隔模型)设计分析中的最大间隔(见图1(一),人工随机数据生成使用利维稳定分布,这将进一步讨论部分2)。根据传统的极值定理,这些极端将收敛于三个广义极值分布:邻,甘力克,威布尔10]。尽管GEV模型取得了许多成功的和实证结果10,11,12),它是一个基于独立和恒等分布的统计模型(先验知识)数据调查概率密度分布特征没有时间记忆的影响(13]。预测分布的尾部,低概率高的影响,无法准确地使用传统的极端获取统计数据,因为它是不可能获得的有效描述空间概率密度分布或先验知识。

(一)

(b)

图1

(一)maxima系列的插图在GEV模型代表了间隔大小(在这里天),代表的最大价值时间间隔。(b)返回区间的定义在时间序列的阈值。返回的时间间隔两个相邻的事件之间的距离超过阈值。黑色(b)中的虚线表示下一个未知的事件,超过阈值“现在”的时候;是最后一个事件以来的运行时间;和是剩余等待时间到下一个极端事件。

先前的研究已经证实,复发时间分析(见图1 (b))是一个强大的工具来描述时间扩展属性和推导定量风险评估的危险事件(14]。该方法可以更有效地使用实验数据和特征时间尺度的物理相关性。同时,先前的研究表明,极端事件的复发没有必要遵循纯粹的无记忆的泊松分布(15,16]。

本研究旨在调查极端事件与内存使用两个主要步骤。首先,我们将确定嵌入在极端事件记忆效应。记忆效应可以表现为自相关函数(17,18),例如,一个归一化时间序列{}( ): 幂律衰减和相关指数。在这项研究中,我们使用去趋势波动分析(DFA) [21)来检测这种long-correlated行为与赫斯特指数。对于长期的相关数据,赫斯特指数= (22- - - - - -25] 在哪里。拉伸指数分布与相关指数提出了在17- - - - - -20.然后采用描述复发时间)。

第二,我们将探索时间记忆的影响的预测极端事件基于利维稳定后的人工数据分布。根据先前的事件的记忆行为,可能会有一种改进的估计未来事件发生的概率。直接量化这种影响,我们将戴维斯et al。26):“去年地震以来的时间越长,时间越长,直到下一个预期的时间?“因此,我们将运用拉伸指数分布,这是一个广泛使用的统计模型描述时间记忆功能,探索可能的“悖论”之间的残余的等待和运行时间。通过扩展的数值分析文献[26- - - - - -28),索尔内特和Knopoff提出一个严格的定量统计框架条件概率的反应,发现这个框架非常敏感假定分布(29日]。在此,我们将试图提供一个推导这一悖论(剩余等待时间增加运行时间在长期记忆),基于贝叶斯法的理论分析和拉伸指数分布。

这也是值得注意的,我们选择利维稳定分布来量化时间序列的重尾分布时分析极端事件。提醒需要在生成长期记忆的时间序列数据,因为幂律过程的非高斯分布特征无法使用传统统计模型分析,如高斯分布和对数正态分布17,18,30.]。基于大量的成功的调查利维稳定分布在实际应用31日,32),在这里,我们描述heavy-tail行为的时间序列使用利维稳定分布稳定指数(0 )。我们应用利维稳定分布和赫斯特指数线性分式稳定噪声(LFSN)来模拟heavy-tail和长时记忆过程,然后研究极值的性质使用上面的方法提出了行为。

接下来的工作是组织如下。节2介绍LFSN模型和解释用来测试仿真参数极值统计行为。节3的缺陷,我们将展示传统极值统计模型在描述时间的行为。时间记忆的重现期的影响然后使用拉伸指数分布描述。此外,基于贝叶斯理论和拉伸指数统计模型,推导出上述“悖论”的原则。结论部分4。

2。方法

2.1。随机数生成

利维稳定分布包含四个参数:稳定指数( ),偏态参数( 1)、尺度参数( ),和位置参数( )。我们采用利维稳定分布提供洞察力heavy-tail概率分布,这heavy-tail模拟控制的稳定指数波动过程α<2在本研究[33]。在下面,我们使用的随机数生成方法征收钱伯斯等人提出的分布进行分析(34]。算法的更多细节可以在[35]。

线性分式稳定运动(LFSM)是一种泛化的分数布朗运动(fBm) [36]。LFSN,这是一个增量LFSM的过程,显示异常波动和长期记忆通过赫斯特指数和稳定指数。给出LFSM随机过程如下(37]: 在哪里在这 , , 是一个标准的对称稳定的征收随机测量。线性分式稳定噪音一样的LFSM增量过程在哪里和提出了长期记忆的时候 ,它可以减少时分数高斯噪声。在我们的人工数据生成稳定指数赫斯特参数对应于相关指数 (见2),生成的数据的数量。

2.2。长期记忆的影响和非高斯过程GEV统计数据

在古典GEV模型中,假设之一是独立的,恒等分布的累积分布函数描述的数据吗。最大值也是一个元素的原始数据。因此,分布的最大值满足

根据Fisher-Tippett极值定理,如果有恒定的列和 , 是一个非退化分布函数。因此,必须收敛到一个极值分布的三种类型根据原始数据的分布,当数据的数量吗 (9]。对幂律分布后的原始数据,收敛于f分布,或II型分布,这被定义为在哪里是位置参数,代表尺度参数,是形状参数。

图2显示了概率密度分布的比较为相关( )和不相关的数据 (对应年度最大值)。长期记忆的分布数据(蓝色)转向左边与不相关的序列相比,和左尾展览一个明显扩大的趋势,这是符合一个提供(18]。值得注意的是偏态的概率密度分布的相关数据后,利维稳定分布集中的研究显然比高斯分布和指数分布后,认为在18]。这种差异主要是因为利维稳定分布是一个中间part-dominated沉重的尾巴,而高斯分布和指数分布。同样清楚的是,长期记忆的分布数据(由蓝线在图表示2)更发散与不相关的序列相比,特别是在左边。这个结果显示内存或相关性的作用的影响,使许多大值事件是集中在特定的时间间隔而其他时期的最大值一般很小。因为大的值将仍然认定为年度最大值,极端的右尾分布几乎是相关性的影响。GEV模型不能清晰的反应时间的行为。

当我们研究极值问题,重现期的极端值的计算是一个非常重要的部分。为的最大价值,相应的概率。因此,重现期的最大价值估计分位数的概率 ,我们可以得到的

在这里,我们让然后估计一个百年不遇的最大的两个不同的内存行为数据(在图分析2)。通过(8), , ,我们可以找到。值得注意的是获得的重现值具有较强的实用意义上的片面性,和传统极值模型不能描述时间相关行为的因素。

3所示。结果与讨论

3.1。极端复发时间的统计数据

我们分析了返回时间间隔超过阈值返回时间长期时间序列相关的统计数据。不相关的数据,如“白噪音”,返回的时间间隔也不相关的和遵循指数分布根据泊松统计(12]。当返回的时间间隔的影响长期的相关性,展品显著慢衰减指数比泊松分布。这慢衰减可以被拉伸指数分布(38,39]: 的指数的相关指数来描述内存数据,参数和是独立的 ,和的平均回报在给定的阈值区间吗。在研究的普遍性(9),四个不同的原始分布数据的返回区间函数(高斯、指数、幂律,对数正态)被安装在14),结果表明,拉伸指数同意与高斯数据和其他发行版也不错。还值得注意的是,复发时间的拉伸指数分布可以完全来自更深层的过程,也就是说,霍克斯的interevent触发过程(40]。

图3显示的分布返回的时间间隔原始数据(红色标志)和重组数据(新10⁻¹显示的黑色符号)。在这两种情况下,只反映了变化的比率 ,复发时间分析的应用不再局限于实际的阈值。图3也证实,慢吞吞的分布函数是指数级的数据。

与不相关的数据的结果相比,指数的影响在(9)使返回间隔表现出明显的两级分化。更直观地说,返回时间间隔的和要更频繁的内存比不相关的数据记录。这意味着的意思是一个可怜的描述,因为分析对象没有典型的规模或“特征”规模是失踪,或广泛的被称为“无尺度”现象41]。这也意味着从指数分布的变化( 幂律分布)( 当该指数减少(相关性程度的增加)42]。这意味着拉伸指数分布是subslow衰减分布和指数分布之间的幂律分布的幂律关系是一种统计的分形强调所有尺度上的相似性19,43]。因此,拉伸指数分布的subslow衰变实际上是一个无标度统计表单或的结果从一个nonsimilarity结构过渡到一个完全统计分形结构。

3.2。“悖论”现象的长期记忆效应下的剩余等待时间

根据在上面的部分中,讨论“集群”现象意味着数据有着悠久的记忆效应,发生的事件不再是一个简单的无记忆的泊松指数分布。慢衰减的拉伸指数分布体现了发生的事件作为一个“无标度”的过程。这个时间的行为可以量化的事件之前,所以将会有一个相应的可预测的影响下一个事件的发生。一般来说,它反映了过去的依赖返回之前的间隔时间间隔。的等待时间到下一个事件的时间间隔也遵循拉伸指数分布。

由et al。17]讨论了记忆效应的存在,根据仿真数据和获得剩余等待时间的“悖论”现象增加而增加和。在这里,我们试图获得一个特定的示范和异常结果量化,基于拟合参数指数分布如图3。在接下来的推导,我们采用数值分析方法引入了索尔内特和Knopoff29日]。

首先,我们假设P(r)返回间隔分布,和未知剩余等待时间满足之前的假设。根据条件概率贝叶斯定理,分布函数满足

在这里,我们预期的等待时间是时间的函数和分析的变化规律。从(10),预计等待时间计算

开发一些直觉,我们首先分析了泊松指数分布。从(10),我们可以得到

对应于指数分布没有记忆,时间的估计不依赖于运行时间 ,与。至于拉伸指数,从(9)和(10),我们得到

然后我们计算(13)使用Gauss-Kronrod集成的方法。图4显示的分布在时间 , , 基于图的拟合结果3。很明显,有逐步扩大的尾巴的起源吗增加和谎言之上在 ;的概率,大量剩余的等待时间随着时间增加增加。异常结果的答案是正的,这个属性显然是与衰减缓慢相比之下,泊松指数分布。

当我们进一步研究预期的时间之间的关系((1))和运行时间基于拟合结果图3,一个人可以发现预期的等待时间取决于 ,相比之下,无记忆数据的指数分布。它清楚地显示不同的长期相关性的影响,预计剩余时间到下一个事件的增加而增加。同时,反常行为增加的程度,这变化是增强通过减少。这个结果意味着依赖记忆效应的存在不仅相邻回报之间的间隔,还在未知的等待时间之间的时间间隔和运行时间。这个结果证实这项发现在之前的统计分析(17]。

4所示。结论

本研究主要探讨记忆效应的影响在极值模型,基于随机数据生成的利维稳定分布,这是不同于以前的评估使用高斯或指数分布在17,18]。结合非高斯和记忆效应,LFSN用于模拟实验数据。仿真结果表明,拉伸指数分布提供了一种可靠的方法来估计的扩展行为极端事件的时间间隔,概括前面的评价后的拉伸指数函数来分析随机数据高斯分布和指数分布。使用贝叶斯统计原则与条件指数分布,我们还从理论上验证各种研究发现的“反常”行为(17,18)(剩余等待时间可以增加一个增加运行时间在长期记忆或所谓的“异常停留时间”),这可能揭示现实世界的极端事件的预测。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项工作是由中国国家自然科学基金支持下批准号。11572112,41628202,41330632和基础研究基金批准号下的中央大学2017 b21614。

引用

p . Yiou和m . Nogaj“极端气候事件和天气政权在北大西洋:何时何地?”《地球物理研究快报没有,卷。31日。7篇文章L07202 2004。
视图: 出版商的网站 | 谷歌学术搜索
o . Korup和j·j·Clague”,自然灾害、极端事件和山地形,”第四纪科学评论,28卷,不。11 - 12,977 - 990年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
j·j·爱,“可靠的极端地球物理事件发生概率:地震、火山爆发、磁性风暴,”《地球物理研究快报,39卷,不。10篇文章L10301 2012。
视图: 出版商的网站 | 谷歌学术搜索
a . Saichev和d·索尔内特”、“普遍”分布inter-earthquake乘以解释道,“物理评论快报,卷97,不。7日,第078501条,2006年。
视图: 出版商的网站 | 谷歌学术搜索
r·格拉泽Klimageschichte中欧:1000四年潮湿,Klima Katastrophen,2001年博智金融。
w .很快和美国Baliunas代理气候和环境变化的过去的1000年里,“气候研究,23卷,不。2、89 - 110年,2003页。
视图: 出版商的网站 | 谷歌学术搜索
即Rodriguez-Iturbe和a·莱分形流域:机会,Selforganization美国剑桥,剑桥大学出版社,纽约,1997年。
r . a . Monetti s Havlin, a .由“长期坚持在海洋表面温度波动,”自然史一卷,320年,第589 - 581页,2003年。
视图: 出版商的网站 | 谷歌学术搜索
p . Huybers w .咖喱,“年度、米兰柯维奇和连续介质温度变化之间的联系,“自然,卷441,不。7091年,第332 - 329页,2006年。
视图: 出版商的网站 | 谷歌学术搜索
m·r·利百特·g·林格伦,h . Rootzen极端和相关随机序列的性质和过程施普林格科学与商业媒体,2012年。
p . Embrechts c Kluppelberg, t . Mikosch造型极值事件:保险和金融施普林格科学与商业媒体,2013年。
h . v .斯托奇和f·w·Zwiers统计分析在气候研究美国剑桥,剑桥大学出版社,纽约,1999年。
m·r·利百特和h . Rootzen极值理论”为随机过程,上的概率,16卷,不。2、431 - 478年,1988页。
视图: 出版商的网站 | 谷歌学术搜索
j . f . Eichner j . w . Kantelhardt a .由美国Havlin,“回归统计间隔在长期相关记录,“物理评论E,卷75,不。1,第011128条,2007。
视图: 出版商的网站 | 谷歌学术搜索
奥特曼e . g和h Kantz”,复发时间分析、长期相关性和极端事件,“物理评论E,卷71,不。5日,第056106条,2005年。
视图: 出版商的网站 | 谷歌学术搜索
j . Lavergnat和p . Gole雨滴释放的随机模型:应用程序的模拟降雨观测,”《水文,卷328,不。1 - 2,8-19,2006页。
视图: 出版商的网站 | 谷歌学术搜索
a .由j . f . Eichner j . w . Kantelhardt和s . Havlin“长期记忆:自然机制的集群气候极端事件和异常剩余时间的记录,”物理评论快报,卷94,不。4、第048701条,2005年。
视图: 出版商的网站 | 谷歌学术搜索
j . f . Eichner j . w . Kantelhardt a .由美国Havlin,“极值统计记录的长期坚持,“物理评论E,卷73,不。1,第016130条,2006。
视图: 出版商的网站 | 谷歌学术搜索
j . Laherrere和d·索尔内特拉伸指数分布在自然和经济:“肥尾”特征尺度”,欧洲物理期刊B-Condensed物质和复杂的系统,卷2,不。4、525 - 539年,1998页。
视图: 出版商的网站 | 谷歌学术搜索
d·索尔内特施普林格系列在协同学,关键在自然科学现象:混沌、分形、自组织和障碍:概念和工具在协同学,施普林格系列,施普林格,柏林,2004年。
c . k .彭s . v . Buldyrev s Havlin m·西蒙斯h·e·斯坦利和a . l . Goldberger“马赛克组织DNA的核苷酸,”物理评论E卷,49号2、1685 - 1689年,1994页。
视图: 出版商的网站 | 谷歌学术搜索
e . Koscielny-Bunde a .由s . Havlin h·e·罗马y Goldreich,和h . j .,也是“大气变化,表明一个普遍的持久性规律”物理评论快报,卷81,不。3、729 - 732年,1998页。
视图: 出版商的网站 | 谷歌学术搜索
j·d·Pelletier和d . l . Turcotte”自仿时间序列:II。应用程序和模型”,地球物理学的发展40卷,第166 - 91页,1999年。
视图: 出版商的网站 | 谷歌学术搜索
r·o·韦伯和p . Talkner光谱和相关性的气候数据从几天到几十年,”地球物理学研究杂志:atm,卷106,不。D17, 20131 - 20144年,2001页。
视图: 出版商的网站 | 谷歌学术搜索
j . f . Eichner e . Koscielny-Bunde a .由s . Havlin周宏儒。在大气中,也是“幂律的持久性和趋势:长温度记录的详细研究,“物理评论E,卷68,不。4、第046133条,2003年。
视图: 出版商的网站 | 谷歌学术搜索
p·m·戴维斯、d·d·杰克逊和y y·卡根,“去年地震以来的时间越长,时间越长,直到下一个预期的时间?”美国地震学会公报,卷79,不。5,1439 - 1456年,1989页。
视图: 谷歌学术搜索
s . n .病房和s . d . b .说,“地震发生的规律如何?一个合成的圣安德烈亚斯断层的地震活动模型,”《地球物理研究快报,20卷,不。19日,2131 - 2134年,1993页。
视图: 出版商的网站 | 谷歌学术搜索
s . d . b .去病房、“合成圣安德烈亚斯断层的地震,”《地球物理学,37卷,不。6,1495 - 1513年,1994页。
视图: 谷歌学术搜索
索尔内特d和l . Knopoff”的悖论预计直到下一次地震时间”美国地震学会公报,卷87,不。4、789 - 798年,1997页。
视图: 谷歌学术搜索
a .由j . f . Eichner s Havlin和j·w·Kantelhardt”返回间隔的稀有事件记录与长期坚持,“自然史答:统计力学及其应用,卷342,不。1 - 2、308 - 314年,2004页。
视图: 出版商的网站 | 谷歌学术搜索
诉诉Uchaikin和v . m . Zolotarev机会和稳定:稳定分布及其应用1999年,沃尔特·德·Gruyter。
r . Weron“计算密集型风险价值计算,”论文/ Humboldt-Universitat柏林中心应用统计学和经济学(案例)柏林洪堡大学,2004。
视图: 谷歌学术搜索
j·p·诺兰,“稳定分布的参数化和模式。”统计与概率的信,38卷,不。2、187 - 195年,1998页。
视图: 出版商的网站 | 谷歌学术搜索
j·m·钱伯斯,c . l .锦葵和b·w·卡”的方法模拟稳定的随机变量,美国统计协会的出版物,卷71,不。354年,第344 - 340页,1976年。
视图: 出版商的网站 | 谷歌学术搜索
y梁和w·陈,”一个调查计算利维稳定分布和一个新的MATLAB工具箱,”信号处理,卷93,不。1,第251 - 242页,2013。
视图: 出版商的网站 | 谷歌学术搜索
i . i Eliazar和m . f . Shlesinger”部分动作,”物理的报告,卷527,不。2、101 - 129年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
s . a . Stoev稳定的自相似和局部自相似性的随机过程:随机属性,参数估计和仿真波士顿大学,2005。
g·f·纽威尔和m . Rosenblatt“零交叉概率为高斯平稳过程,”数理统计年鉴中,33卷,不。4、1306 - 1313年,1962页。
视图: 出版商的网站 | 谷歌学术搜索
布莱克和w·林赛,“平交路口问题随机过程,”IEEE信息理论,19卷,不。3、295 - 315年,1973页。
视图: 出版商的网站 | 谷歌学术搜索
a . Saichev和d·索尔内特”理论的地震复发时间,“地球物理学研究杂志:固体地球,卷112,不。B4,文章B04313, 2007。
视图: 出版商的网站 | 谷歌学术搜索
j·b·Bassingthwaighte l . s . Liebovitch和b . j .西方,“分形现象在时间和空间上的性质,”分形生理学、生理学方法系列、pp, 11-44 Springer,纽约,纽约,美国,1994年。
视图: 出版商的网站 | 谷歌学术搜索
r .玉石,s . s .毛发g·斯齐亚沃尼et al .,“去趋势波动分析:无尺度对神经元振荡,”前沿生理学,3卷,450页,2012年。
视图: 出版商的网站 | 谷歌学术搜索
a .补充·赫尔曼·l·柯奇士便因和l·r·科扎克”在颞生理信号的分形特性的复杂性生理测量,23卷,不。1,R1-R38, 2002页。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

1857年

下载

1218年

引用