复杂性

PDF
复杂性/2019年/文章
特殊的问题

复杂的方法应用于数据分析、处理和可视化

把这个特殊的问题

研究文章|开放获取

体积 2019年 |文章的ID 2095063 | https://doi.org/10.1155/2019/2095063

Jose Roberto c . Piqueira塞尔吉奥•恩里克•Vannucchi Leme de Mattos, LMC和SDL复杂性措施:一个工具来探讨时间序列”,复杂性, 卷。2019年, 文章的ID2095063, 8 页面, 2019年 https://doi.org/10.1155/2019/2095063

LMC和SDL复杂性措施:一个工具来探讨时间序列

客座编辑:何塞Garcia-Rodriguez
收到了 2018年9月21日
修改后的 2018年11月24日
接受 2018年12月10
发表 2019年1月02

文摘

Lopez-Ruiz的这项工作是一个泛化,曼奇尼,和Calbet (LMC)和黑眼圈,戴维森,和复杂性兰茨贝格(SDL)措施,考虑到系统的状态或过程是由一系列连续时间动态变量。当两个措施是基于信息熵的计算复杂性,定义为一个等价的信息来源使用分区动态变量的范围。在时间间隔与测量相关的信息动态变量是种子来计算瞬时LMC和SDL措施。展示作品的方法生成指标,两个例子,一个有关气象数据和其他有关经济数据,提出和讨论。

1。介绍

这个词的复杂性,在常识意义,代表系统难以描述,设计,或理解。然而,由于柯尔莫哥洛夫提出了计算复杂度的概念(1),新思想已经与这个词有关,主要发生在生命科学(2),相关的复杂性和信息(3]。

因此,复杂性开始相关系统和出现的意想不到的行为,由于非线性4,5),关于系统理论(6),一个新的意义是雕刻,假定复杂性是一半的平衡和不平衡7]。

发展这个想法,在开创性的论文(8],Lopez-Ruiz,曼奇尼和Calbet提出了LMC (Lopez-Ruiz,曼奇尼和Calbet)复杂性度量的随机分布利用信息熵(9评估平衡,均匀分布的二次偏差评估不均衡。

然而,有一些批评LMC测量,考虑到是不准确的一些类系统服从马尔可夫链的链和不能被认为代表一个广泛的变量。费尔德曼和科兰驰菲尔德10)提出了一个修正的不均衡,取代它的相对熵的均匀分布。

黑眼圈,戴维森,兰茨贝格提出的另一个修改LMC措施,取代了不平衡项的补充平衡项。这种方法叫做SDL(黑眼圈、戴维森和兰茨贝格)[11),提出了使用LMC获得的结论相似,对于大多数通常的统计分布(2]。

LMC和SDL复杂性的主要限制措施是由于科兰驰菲尔德,费尔德曼和Shalizi,他们认为一个平衡系统可以结构复杂(12),但这个问题可以得到解决,通过加权有序和无序,根据具体的问题进行分析。

自2000年代初以来,LMC和SDL适应动力系统已成功应用于不同类型的时间演化问题:鸟的歌曲(13),神经可塑性(14),物种在生态系统之间的相互作用2),如若风景的15)、经济系列(16],传播萧条[17),和量子信息18]。

记住这些观点,本文提出了一种系统化的方法用于引用论文,LMC和SDL措施的基础上,应用到时间系列,通过定义和计算的动态复杂性的措施。

程序,应用于一系列时间代表一些组织或一个系统的功能方面,关于其复杂性的进化提供了见解。

LMC和SDL动力措施是基于信息熵(16),第一个任务,在下一节中所描述的那样,是定义一个字母的来源,将概率分布与可能的系统状态。

概率分布的定义后,一个新的部分定义了如何动态LMC和SDL措施可以在每次计算,基于个人信息与系统状态,生成时间系列LMC和SDL措施。

为了说明计算过程,给出了两个例子:一个气象时间序列相关,另一个经济时间序列。在这两种情况下部分,实际讨论如何分配假设的值的范围提出了系统状态。

被选出的例子表明,该方法可以应用于不同类型的现象:降水(第一个例子),并有很强的周期性成分和经济时间序列(第二个例子)这似乎是随机的。

工作与结论部分关闭,强调相同的程序可以应用于任何时间实数系列,即使有不同的时间范围,计算复杂性的措施。

2。定义源和一系列时间的概率分布

考虑到香农的模式9源的一个信息,一个时间序列 被认为是一个函数的非负整数到一个真正的时间间隔,即, ,与每一次 一个真正的属于数量 , 最初的即时和 任意时间,这取决于数据的可用性。

一组 被认为是一系列独立随机变量和随机过程 作为一个整体是静止的19]。

第一步是将区间 成N个子区间。为了简单起见,N等于 ,

在这一点上,它可能是问如何选择N,之间有一个妥协精密(高值(N)和计算速度(N)值低。理论上并不能解决这个问题;然而,在一节的例子中,实际暗示这个选择。

因此,定义的源字母间隔 , ,

这时,一个时间间隔定义为一个给定的n必须选择,和时间序列 变量的值 必须阅读和相关的间隔 ,包含各自的价值。

因此,对于整个组 ,每个时间间隔 属于字母与来源 一定数量的时期 ,它定义了一个相对频率

作为 ,它可以作为一个概率,与每个区间关联

定义后,每个子区间 ,其个人贡献整个信息熵给出了 ;和信息熵的最大值为整个源, ,可以计算(9]。

3所示。动力LMC和SDL

字母和个人信息来源定义,的瞬时值 与各自相关吗 ,允许的计算瞬时值的平衡(障碍)项:

结合(1)的不同定义不均衡(顺序)而言,动力LMC定义和SDL的措施。

3.1。LMC动态测量

根据Lopez-Ruiz表示,曼奇尼,Calbet [8),动态不均衡(顺序)可以作为二次计算偏差源字母表的概率分布的均匀分布,因此,每个区间的个人贡献

延长LMC测量的定义、动态LMC计算 ,是由

3.2。SDL动态测量

所提出的黑眼圈,戴维森,兰茨贝格(11),动态不均衡(顺序)可以计算为补的动态平衡条件:

延长SDL测量的定义,动力SDL,计算 ,是由

4所示。应用气象数据的方法

每月气象时间系列研究在这一节中,表明上述方法可以应用,独立于自然的时间尺度和周期性的现象。

气象数据系列相对于雨降水Dourados-MS-Brazil [20.]分析了,只有在方法论的角度来看,没有任何气象推测的结果。

月降水指数时间系列,从2004年1月至2012年9月,如图1,代表的价值 (20.),其复杂性进行了分析。

因此,时间间隔 相关的偏移 它被分为 , , , 小区间构建源和各自的概率分布。

根据这些概率分布, 计算和绘制一个想法如何测量间隔部门选择和影响结果。

4.1。LMC和SDL之间的等价性

划分的范围 部分,计算的结果 措施如图2(一个)2 (b),分别。

作为数据2(一个)2 (b)显示,尽管数值差异,时间的演进 由曲线相似,8部分部门的情况。

观察数据,可以推断LMC测量捕获的周期性特征的降水年更好的方法。然而,SDL测量假设其最大值(或25)。

如果的范围 分为16个部分,数据3(一个)3 (b)显示的结果

它可以观察到,在这种情况下(sixteen-division情况), 相差一个比例因子,LMC措施呈现更好的准确性表达雨季节的周期性特征。SDL测量提供了高价值的峰值,但没有达到最大值(或25)。

比较数据2(一个)3(一个), 对于不同范围分区,曲线的全球方面是相同的,通过增加部门的数量,动态范围的措施减少,和一些快速振荡变化类似于噪音出现。

比较数据2 (b)3 (b), 对于不同范围分区,整个曲线的各个方面都是一样的,吵闹的方面由于越来越多的类似于提出的区间分歧

4.2。区间范围分区

观察,动态范围的措施增加部门的数量减少,由于这一事实来源的元素数量的增加引发更均匀分布可能的措施。

为了更好地理解这一现象,这些措施是由增加的间隔数重新计算 ,结果一百三十二年分区如图4(一) 并在图4 (b)

通过分析的结果数据2(一个),3(一个),4(一),它可以观察到,通过增加数量的间隔,的动态范围 减少,但显然,这一系列的时间演化 维护其定性行为混合噪声与准确性。

通过分析的结果数据2 (b),3 (b),4 (b),它可以观察到,通过增加数量的间隔,的动态范围 减少及其最大值(或25)是没有达到。显然,这一系列的时间演化 维护其定性行为混合噪声与准确性。

5。将方法应用于经济数据

在本节中,相对的转换货币经济系列研究[16)为例,随机现象显示了方法的适用性。

时间系列相关日常美元巴西雷亚尔(美元/ BR)转化率,从1999年1月至2015年9月,如图5(16]分析了,只有在方法论的角度来看,没有任何经济猜想的结果。

这个转化率代表的价值 ,的复杂性进行了分析。

因此,时间间隔 相关的偏移 它被分为 , , , 小区间构建源和相应的概率分布。

根据这些概率分布, 计算和绘制一个想法如何测量间隔部门选择和影响结果。

5.1。LMC和SDL之间的等价性

划分的范围 部分,计算的结果 措施如图6(一)6 (b),分别。

作为数据6(一)6 (b)显示,尽管数值差异,时间的演变 定性是相同的,由曲线非常相似,8部分部门的情况。

如果的范围 分为16个部分,数据7(一)7 (b)显示的结果

它可以观察到,在这种情况下(sixteen-division情况), 只有一个比例因子不同,相同的定性时间演化。

比较数据6(一)7(一), 对于不同范围分区,整个曲线的定性方面是相同的,通过增加部门的数量,这些措施的动态范围的变化,暗示一些快速振荡变化,类似于噪音。

比较数据6 (b)7 (b), 对于不同范围分区,整个曲线的定性方面是相同的,吵闹的方面由于越来越多的区间划分。

因此,从现在开始,只有LMC措施将被分析,因为SDL呈现相同的定性的动态行为和分区的敏感性。

5.2。区间范围分区

增加的数量的间隔 和重新计算 ,结果一百三十二年分区如图8(一个)一百六十四年分区,如图8 (b)

通过分析的结果数据6(一),7(一),8(一个),8 (b),它可以观察到,通过增加数量的间隔,最大的价值 降低提高精度,但显然,这一系列的时间演化 维护其定性行为混合噪声与准确性。

试图更精确的区间范围分区,如何 计算多个分区,但是考虑到更短的时间段的数据。7月和2002年12月之间的间隔是选择,因为,正如解释(16),关于巴西的转化率是至关重要的。

数据9(一个),9 (b),9 (c),9 (d)显示LMC动态测量计算的初始数据,与区间范围划分为8,16日,32岁的64个零件,分别。

从这些结果可以观察到,对于较短的时间间隔,一般时间演化的定性特征出现,独立的分区。然而,随着小区间的数量增加时,瞬时数值改变,但是精度增加,允许更精确的分析。

6。结论

的方法计算LMC和SDL动力学复杂性发展,开始建设一个源和一个概率分布,对于任何时间系列。贡献是关于扩展思想,主要用于静态情况下,变量代表某种组织演化现象。

LMC和SDL措施被观察到相当于在某些时间分析,但当有一种强烈的振荡分量,LMC措施似乎更准确表达复杂的演化,气象数据分析显示。

更多的随机分布的数据,这两个指标(LMC和SDL)呈现相同的精度,随着经济数据分析显示。

这一点总是讨论区间范围分区的一个对象。选择的小区间的数量关系的经验。

长时间的间隔不是很敏感部门的数量的增加,尽管气象数据比经济更敏感。然而,对于短时间间隔,增加部门的数量产生一个精确的分析,引入噪声。

给出的例子是为了说明方法的方法,没有任何妥协的气象专家或经济可以推断出结论,利用开发工具。

数据可用性

本文中使用的所有数据都可以在互联网的下列链接的引用。

的利益冲突

作者宣称没有利益冲突有关这篇文章的出版。

确认

本文中使用的所有数据都可以在互联网的下列链接的引用。这项工作由CNPq支持,巴西。

引用

  1. a·n·柯尔莫哥洛夫”三种方法的定义概念”信息的量”、“研究Akademiya SSSR。研究问题研究所Peredachi Informatsii Akademii SSSR。Problemy Peredachi Informatsii,1卷,不。vyp。1,3-11,1965页。视图:谷歌学术搜索|MathSciNet
  2. m .阿南德和l . Orloci”植物群落的复杂性:概念和量化,”理论生物学杂志》上,卷179,不。2、179 - 186年,1996页。视图:出版商的网站|谷歌学术搜索
  3. h .劳工信息和自组织在协同学,施普林格系列,斯普林格出版社,柏林,第二版,2000年版。视图:MathSciNet
  4. e·莫兰在复杂性,汉普顿出版社,纽约,纽约,美国,2008年。
  5. g . Nicolis i Prigogine,非平衡系统的自组织美国约翰·威利& Sons, 1977年。
  6. l·冯·Bertalanffy一般系统理论:基础、开发应用程序乔治·巴西公司,纽约,纽约,美国,1968年。
  7. k·金子和津田,复杂系统:混乱和超越施普林格1 -:柏林,德国,2001年。
  8. r . Lopez-Ruiz、h·l·曼奇尼和x Calbet,“统计测量的复杂性,物理信,卷209,不。5 - 6,321 - 326年,1995页。视图:出版商的网站|谷歌学术搜索
  9. c·e·香农和w·韦弗,通信的数学理论美国芝加哥,llini书版,1993。视图:MathSciNet
  10. d·p·费尔德曼和j·p·科兰驰菲尔德,“统计指标的复杂性:为什么?”物理信,卷238,不。4 - 5,244 - 252年,1998页。视图:谷歌学术搜索
  11. j·s·夏纳,m·戴维森和p . t .兰茨贝格”简单措施的复杂性。”物理评论E:统计、非线性和软物质物理学卷,59号2、1459 - 1464年,1999页。视图:出版商的网站|谷歌学术搜索
  12. j·p·科兰驰菲尔德、d·p·费尔德曼和c·r·Shalizi”我评论”的简单测量复杂”、“物理评论E:统计物理学、等离子体、液体,和相关的跨学科主题,卷62,不。2、2996 - 2997年,2000页。视图:谷歌学术搜索
  13. m·l·达席尔瓦j . r . c . Piqueira和j·m·e·Vielliard”利用香农熵测量个体变化Rafous-bellied画眉Turdus rufiventris口头沟通,“理论生物学杂志》上,卷207,不。1,57 - 64,2000页。视图:出版商的网站|谷歌学术搜索
  14. m . Pinho m·马扎j . r . c . Piqueira和a·c·罗克,”香农熵应用于音质重组的分析计算模型的经典条件作用,”Neurocomputing,第928 - 923页,2002年。视图:谷歌学术搜索
  15. s . h . v . l . De Mattos l . e .韦森特a . p .球场,和j·r·c·Piqueira”贡献的复杂性范式塞拉多的组织和动力学的理解,“阿哒学术界Brasileira de Ciencias,卷88,不。4、2417 - 2427年,2016页。视图:出版商的网站|谷歌学术搜索
  16. l·p·d·Mortoza和j·r·c·Piqueira“测量的复杂性在巴西经济危机,”PLOSONE,12卷,不。第三条ID e0173280, 2017。视图:谷歌学术搜索
  17. j . r . c . Piqueira v . m . f•德利马和c m . Batistela“扩散性抑制海浪复杂性措施和自相似性,”自然史答:统计力学及其应用卷,401年,第277 - 271页,2014年。视图:出版商的网站|谷歌学术搜索
  18. y . c . Campbell-Borges和j·r·c·Piqueira“复杂性度量:量子信息的方法,”10卷,p。19日,2012年。视图:谷歌学术搜索
  19. a . Papoulis和美国皮拉伊概率,随机变量和随机过程美国Mc Graw山,第四版,2002年版。
  20. ”“巴西农业研究公司”(senior de连续曹Agropecuaria),“https://www.embrapa.br/agropecuaria-oeste/biblioteca/acervo, 2018年。视图:谷歌学术搜索

版权©2019 Jose Roberto c . Piqueira和塞尔吉奥•恩里克•Vannucchi Leme de Mattos。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点1005年
下载531年
引用

相关文章

文章奖:2020年杰出的研究贡献,选择由我们的首席编辑。获奖的文章阅读