复杂性

PDF
复杂性/2019年/文章
特殊的问题

计算方法的建模、仿真和优化的复杂系统

把这个特殊的问题

研究文章|开放获取

体积 2019年 |文章的ID 8750643 | https://doi.org/10.1155/2019/8750643

安德烈•德米特里维克多•德米特里斯捷潘Balybin, Twitter上的自组织临界性:现象学理论和实证调查数据分析结果”,复杂性, 卷。2019年, 文章的ID8750643, 16 页面, 2019年 https://doi.org/10.1155/2019/8750643

Twitter上的自组织临界性:现象学理论和实证调查数据分析结果

客座编辑:劳尔Banos
收到了 2019年8月16日
修改后的 2019年11月06
接受 2019年12月11日
发表 2019年12月27日

文摘

最近,已经有越来越多的经验证据支持这一假说,在社交网络上的雪崩microposts传播,如Twitter,与一些社会政治事件有关。此类事件的典型例子是政治选举和抗议运动。受这一现象的启发,我们构建了一个现象学模型,描述了Twitter的自组织临界状态。这个条件的外部表现是microposts雪崩的传播网络。模型是基于部分带三个参数的自组织机制与随机源。结果表明,绝热模式的自组织临界状态的密集的协调行动是由一个相对较小的网络用户的数量。确定网络的关键州和验证模型,我们提出了一系列的三个microposts观测时间序列的比例指标。

1。介绍

一般20世纪科学发展的趋势,也是通过在新的世纪里,逐步渗透的物理思想和方法在自然以及人文传统。自1970年代以来,数学和物理建模的方法已经被越来越多的应用在人口统计学等科学、社会学、经济学、历史、和政治科学。在所有这些科学、客观、欲望,最好有一个定量描述各种社会和经济现象正在增加。

定量模型的发展社会学、政治学、交通流理论,和其他领域的社会调查逐渐相关任务从人文科学和工程科学的跨学科应用数学和物理。在近年来的文献中,术语sociophysics [1,2)被分配给所有这些领域。这个新的自然科学领域的主要任务是寻找客观地衡量和formalizable模式,确定各种社会过程。Sociophysics分析所有现有品种的结构和动态的社会系统中,借用物理理论和实验的思路和方法。

研究的对象和现象的一些sociophysics社交网络(例如,看到评论(3)和引用其中)和临界现象,如相变,观察到它们(例如,看到那些评论(4,5)和引用)。Dorogovtsev和合作者状态在他们的论文中(4],“关键现象在网络包括一个广泛的问题:网络结构变化,critical-scale-free-network架构的出现,各种各样的渗流现象,流行阈值,相变在合作模型上定义网络,临界点不同的优化问题,转换在共赢夫妻们一个合作网络模型及其底物,不同的政权之间的转换过程发生在网络,和许多其他人。“在不可逆过程热力学理论,指出,重要的结构重建时的外部参数达到一定临界值(分岔点)和字符的相变动力学(6]。达到临界点的微调系统的外部参数。在某种意义上,这种临界现象并不强劲。以下类型的非线性系统的自组织可以识别导致nonrobust临界现象:自组织在相变过程中,由时空尺度不变性特征过渡到临界点,当外部参数达到临界值;自组织在几何相变过程中,当细胞填充的临界值概率达到(例如,渗流阈值);在分岔点和耗散结构的自组织,以防当一些外部参数(例如,古典牺牲别人的问题)的温度梯度达到临界值。

在1980年代末,贝克et al。7,8)发现有复杂系统大量的自由度,进入一个关键模式由于内部这些系统的进化趋势。这种系统的临界状态不需要外部控制参数和可能发生自发的微调。因此,提出了自组织临界状态(SOC)的理论。这是理论声称是普遍的理论,解释了自发发生的关键州开放的非平衡系统。特征,定性SOC有别于其他类似的自然现象是实现自组织临界状态的范围广泛的外部控制参数。SOC,然而,没有特殊参数调优”是必需的,而且,在这个意义上,这样的临界现象是健壮的。

从SOC模型出现的那一刻起,这个模型开始适用于描述关键现象系统无论其性质(例如,看到评论(9)和引用)。不例外的应用理论临界现象的描述社交网络(例如,看到工作(10- - - - - -13])。

我们调查的动机是这样的。有许多研究(例如,看到的作品(11,13- - - - - -20.]),它建立了所观察到的流动microposts生成的微博社交网络(如Twitter)的特点是遗憾的行为。时间序列的microposts描绘这些流的时间序列具有幂律分布概率, 噪声和长期记忆。因为它将部分所示2.2,这些特征的时间序列是社交网络的关键特性在SOC状态。尽管如此,没有建设的研究,分析和验证的物理模型解释的现象的出现和传播microposts在Twitter上的雪崩。建设、分析和验证的现象学模型是我们研究的目的。

提出了结构化如下工作。部分2.1致力于Twitter的描述的一个场景的自组织临界状态过渡,由网络功能的细节。部分2.2介绍了光谱的概念自组织网络临界指标,这是一个标识符,允许的SOC状态网络区别于非临界状态,从时间序列的分析结果microposts。采矿方法和数据分析识别网络的状态,以及识别的结果从观测数据网络状态,介绍了部分3。这些数据被用来验证部分中给出的模型4,它描述了Twitter自组织临界状态过渡的条件从亚临界状态。部分5从研究给出了一般性的结论,以及他们的讨论。最后,部分6致力于讨论拟议的模型中无法解决的任务,并简要描述他们的解决方案的方法。

2。Twitter上的自组织临界性

本节提出了一种定性nonformalized描述的机制出现在Twitter上自组织临界状态的协调行动的战略导向的网络用户。指标的范围自组织临界性的一个社交网络被定义为网络的标识符在亚临界(SubC)功能,自组织临界(SOC)和超临界(SupC)状态。

2.1。在Twitter上的自组织临界性机制

著名的物理模型的自组织临界性,阿贝耳沙堆模型(21),提供了一个场景的系统实现自组织临界状态的情况下。模型与一堆沙子是隐喻性的,和这样的真正动力系统可能非常不同。我们适应这个场景解释SOC状态在Twitter上的出现,伴随着大量的外观microposts网络上的各种大小的:从小型雪崩的每秒10 microposts大雪崩约每秒1000 microposts甚至更多。对应的时间序列显示持续测量数量的microposts(雪崩大小)每隔一段时间。

我们假设Twitter自组织临界状态的结果一致的行为相对较少的网络用户( ) 达到一个临界状态 进一步讨论致力于这种假设的证据。

首先,我们介绍的概念,需要进一步讨论。让 Twitter用户的总数有兴趣在一个特定的主题,例如,“2016年美国总统选举。“这样的用户,他们是由给定主题感兴趣,形成一个社区网络,因此,只有这些用户可以发送microposts与这个话题有关。让这 ( )这个社区的用户按照一定的策略。例如,这些用户是泵的目标网络,即。,来distribute as many microposts, related to a certain topic on the network, as possible. Call these users as strategically oriented users (SOUs). SOUs have a common goal, to achieve that they act in concert. Consolidation of users into a subcommunity of SOUs does not necessarily occur as a result of a preliminary conspiracy, but also unconsciously. Examples of concerted action to achieve a common goal can be the promotion of a candidate in the political elections, as well as the coordination of actions of participants in protest movements and/or the involvement of citizens in protest movements. Recent protest movements have suggested that online social networks might play a key role in their organization, as adherents have a fast, many-to-many communication channel to help coordinate their mobilization [22]。网络用户的行为在自然灾害可能无意识的共谋的结果。剩下的 用户不遵循一个连贯的策略,从这个意义上说,是随机的用户(劳斯)。

将网络用户划分为两个类的基本原理是研究结果Pramanik和合作者在他们的论文中提出的23]。他们介绍两个提到的策略:随机提和智能提到提到偏好的用户模型。他们提出了一个模型级联形成的Twitter,将转发和提到的活动。实现模型的证明聪明的优雅提到战略提高微博人气,特别是在低转发环境。

在我们看来,我们使用Twitter用户提出的详尽的分类(24)对网络用户进行分类两类之一。分类由真实用户,包括个人用户,专业用户和商业用户,以及数字演员,包括垃圾邮件用户,饲料/新闻,和病毒/营销服务。当然,这些类之一个苏的分配或劳斯是有条件的,是由具体的话题,讨论了网络用户。然而,在大多数情况下,所有数字演员正在使用机器人,专业用户,业务用户可以被认为是苏。例如,专业的主要目标用户和商业用户在网络上涉及到尽可能多的用户,例如,个人用户,在某个话题的讨论。最后,个人用户可以被视为劳斯。的确,这样用户创建他们娱乐的Twitter页面,培训,或接收消息,等。这是最大量类的Twitter用户。

考虑网络的特性用户的交互作用,导致在Twitter上SOC状态的出现。解释机制的出现这样的状态,它是适当的区分三个连续网络状态:SubC状态,SOC状态,SupC状态。

SubC状态是混乱的网络状态,观察到在一个特定的时间间隔或在亚临界时间 (从 )。这种状态的混沌性质的示范microposts雪崩的混乱(无序)分布在网络上。最常见的场景的观察这个状态对应的存在只有劳斯( )在网络上,产生雪崩microposts的特定主题。这种雪崩不是相互联系,它们小,很快就消失在时间和空间。这是由于这样的事实:劳斯的行为不以一致的方式,不追求一个目标,并且不泵某些信息的网络,因此,它不会导致的形成雪崩microposts的大小。在这样一个网络,自组织有序的状态,它的特点是各种规模的microposts雪崩的存在,是不可能的。劳斯不合作(同步)行为特征的,因此,网络的自发跃迁从混乱到有序状态,各种规模的雪崩的microposts发布在网络上,是不可能的。我们不排除在社区劳斯,连接只通过讨论某个话题,有当地与少量的层级结构(用户,用户,用户的用户,等等)。雪崩遵循一个微博,转发或类似的微博,因为他们跨越网络。但是雪崩microposts分布在这种结构规模相对较小。甚至整体的层次结构将只允许生成许多雪崩的小尺寸不相连。

假设在每一时刻的时候,一个苏( )在Twitter上,其中 这些用户一致行动,试图形成雪崩microposts的大小与某一主题相关。渐渐地,苏在网络层次结构形式。这些用户的合作行为使他们有机会建立层次结构非常有效的产生雪崩microposts更大的尺寸。如果苏是真实用户,其中大部分都是有影响力的人的推特,然后可以形成一个层次结构与大量的水平(# 1有影响力的人,他的用户,用户的用户,等等),可以产生雪崩microposts更大的尺寸。可以生成更大的雪崩,如果两个劳斯,这是用户的用户在一定的水平,和其他有影响力的人(有影响力的人# 2,# 3有影响力的人,等)和他们的用户,包括苏和劳斯,将会被集成在这个结构。在某种意义上,劳斯是一个活跃的环境增加产生的雪崩最初的大小苏。

应该指出的是,被认为是层次结构并不是唯一的结构,通过它可以产生雪崩microposts更大的尺寸。其他可能的机制产生临界将描述的结论。然而,上述各种规模的microposts雪崩的传播机制,在我们看来,是最合理的。这是由用户的基本细节决定组织在Twitter上:用户(层次级# 1),他的订阅者(层次级# 2),用户的用户(层次级# 3),等。此外,在25),结果表明,分层次下属的演化复杂网络减少的反常扩散超度量空间的等级制度。这样一个系统的平稳分布的水平是由一个幂律。此外,Bakshy和合作者状态在他们的论文中(26]“不出所料,我们发现最大的瀑布往往是由用户生成的影响力在过去有大量的追随者。“这项研究还提供了一个理由的存在层次结构(# 1有影响力的人,他的用户,用户的用户,等等),作为最有效的结构分布的大型microposts雪崩。在文献[27),提出了一种概念和实际模型局部网络在Twitter上的分类,根据他们的网络级结构。分层tweet-retweet-follow序列之间存在的联系和讨论了级联的转发28]。

如果 不达到临界值 ,然后microposts无关的雪崩,虽然更大的尺寸,还在Twitter上形成。苏的等级制度形成和劳斯在《社交网络》仍不能形成雪崩microposts的大小。SubC状态是对小外部影响:添加一个网络上的苏不会定性改变网络的行为。

时刻的时候,苏的数量达到临界值 ,和网络进入SOC状态。SOC状态不是抵抗小外部影响:只有一个添加microposts苏会引起雪崩的大小。雪崩microposts分布的自组织行为的关键网络基于个人用户的行为是不可预测的。在这种情况下,社交网络已经出现房地产和在这个意义上是一个复杂的系统。因此,各种规模的microposts雪崩的出现的原因是某些网络的自组织临界性社区,用户感兴趣的一些话题。应该注意的是,网络在SubC状态不一定去SOC状态。网络可以放松,直到它到达SOC状态。放松可能是由于减少或不变的苏数量随着时间的推移,由于苏的失去兴趣在网络上讨论的话题。

Twitter的自组织临界状态时microposts的数量( )有关某一主题几乎成为非零( ),即。,corresponds to its separation from zero ( )。以确保 ,添加一个苏在Twitter在每个时间间隔 ,相应的弛豫时间。SOC状态是健壮与可能的变化对《社交网络》。例如,如果用户之间的相互作用的本质变化,《社交网络》暂时偏离现有的临界状态,但一段时间后,恢复了一个稍微不同的形式。分级网络结构将会改变,但其动力学仍将是至关重要的。每一次,当试图把Twitter从SOC状态时,《社交网络》总是返回到这个状态。

常规回到SOC状态对任何偏离它让我们表明,它是一种特殊的稳定平衡的发展网络,根据贝克,称为间断平衡(7,8]。如果《社交网络》是在这样的一个平衡,然后会发生重大的变化都与一个强大的外部影响(例如,强大的社会网络注入战略面向用户)和渐进的内部变化的结果。

命令SupC状态,如果观察到 ,对小外部影响:添加一个网络上的苏不会定性改变网络的行为。在这种状态下,超临界的个苏,雪崩的大小microposts继续增长。如果网络没有泵由个苏,然后放松,回归到SubC状态。

2.2。频谱的自组织临界指数

2.1指出,这是网络上的雪崩大型microposts的存在是被Twitter在SOC的特征或SupC状态。因此,定量分析结果的雪崩大小microposts可以作为标识符的社交网络的状态。

确定网络状态,有必要确定雪崩microposts的规模,这将允许分配给社交网络的一个关键的州。

考虑到自组织临界性理论的基础之一是复杂性理论(有时也被称为范式)29日),我们将使用更一般的概念的复杂性:nonstrict定义的复杂性的临界水平的外部演示系统无论其内部结构。在这种情况下,复杂的系统是系统,它能够产生极值事件:意想不到的(预测)和/或不寻常的事件。

在Twitter的情况下,我们正在谈论某些特性的观测时间序列microposts ( ),例如,大幅的分配的时间序列值。另外一个特性是大幅增加序列的时间序列值的存在一个临界值分布对应的雪崩microposts网络。

社交网络的复杂性的关键特性在它们生成的时间序列的幂律概率分布函数(幂律PDF) microposts,时间序列的功率谱密度(PSD)的时间序列的特征 噪音,自相关函数的幂律(幂律ACF),它的特点是长记忆时间序列的存在(30.]。

在一般情况下,幂律的pdf文件可以被认为是一个统计的价值尺度不变性microposts:时间序列的 在哪里 应该注意的是,通常具有幂律pdf文档 (31日]。我们认为最常见的情况属于幂律PDF。权力的法律 不能归一化,通常不自然现象中找到。幂律PDF的低价值 没有一个有限的平均 ( ),但对于 平均被定义。的均方 , 有一个明确的值

幂律PDF (1)指的是与重尾分布,这与分布紧凑,著名的3σ规则(忽略的可能性的值的数量microposts超过3σ)是不满意。如果分布(1)是实现,那么罕见的大事件不足够频繁发生的概率是被忽视的。巨大的可能性,非凡的事件出现在Twitter上表示网络灾难的趋势。

的另一个特征尺度不变的时间序列的属性 噪音,这是观察到的权力形式的PSD在低频率 :

价值在PSD (2)确定噪声的颜色。为 噪音, 的情况下 通常被称为粉红噪声。 噪声的特点是所有的复杂系统,不管他们的本性。如果时间序列 为社交网络没有噪音,然后定期重复的值microposts的数量。这是由于这一事实,在microposts的时间序列,是不可能区分一个特点规模负责大型的外观microposts的数量值。尺度不变的PSD演示了一个强大的社交网络非线性信号时是不可能孤立单个组件的频谱,并提供其物理解释。因此,Twitter的动力学microposts, 噪音是观察,不能分解成单独的组件。Twitter,操作在一个自组织状态,产生振荡的microposts PSD的形式(2)。

第三个通用功能的复杂性与权力相关法律(1)和(2)的存在长记忆时间序列的microposts。在简单的系统中,时间相关函数(例如,自相关函数),显示该时间序列的程度“记住”了它的历史,具有以下形式(30.]:

复杂系统具有幂律降低ACF的时间差 增加: 在哪里

幂律的存在ACF的时间序列microposts意味着当前microposts数量很大程度上取决于过去的microposts由Twitter,以及信息的缺乏特征倍microposts之前的外观将会丢失。此外,依赖(4)决定了一个缓慢的力量减少microposts流在时间的概率 相同条件下,流动在早些时候出现的时间

这根本上是重要的存在长时间相关性的Twitter的出现。这一事实决定的可能性的出现雪崩的microposts(极值事件)的协调战略导向的网络用户的行为。紧急Twitter属性发生的机理是详细描述部分2.1。如果microposts相关时间序列的一个特定的话题,法律(1),(2)和(4)完成,那么以下重要后果是可能的。

首先,相关的Twitter段,包括苏和劳斯,分发microposts有关一个特定的主题,在SOC状态。其次,权力的法律描述大尺度不变性microposts结构时间序列的自组织生成的关键的社交网络。尺度不变性的方法研究被认为是部分的3所示。2

PDF、PSD、ACF权力法律的形式使其可以使用的范围区间指标 自组织临界性的指标(复杂度)的社交网络(Twitter)。如果社交网络在SOC或SupC州,然后等州权力的指标法律采取间隔的值 否则,Twitter是SubC状态。

在本节的结论,我们注意到,该方法识别网络的复杂性不是基于图结构的统计分析,但在时间序列的统计和分形分析生成的网络。

根据Dorogovtsev和合作者的定义4)复杂网络与更复杂的网络架构比经典随机图和他们的“简单”Poissonian分布的关系。“这些网络是网络与重尾分布,特别是,幂律分布。类是无标度网络的复杂网络之一。无标度网络的定义在图结构的层面上提出了巴斯和艾伯特20多年前(32]。无标度网络,如果顶点的分布函数 边的数量 是由一个幂律: ,以及在(1), 但通常被认为是无标度网络 例如,存在无标度网络 (33]。

应该注意的是,巴斯的优惠附件并不是唯一一个无标度网络的机制出现;有几个其他机制(例如,看到的作品(32,34,35])。为进一步讨论,是很重要的依赖项(5无论机制)是满意。

有很多研究,提出可行性的实证依据方程(5)为大量不同类型的社交网络(例如,看到的作品(36- - - - - -38])。然而,最近的研究似乎表明,不是所有的社交网络,幂律(5)是统计证明(例如,看到的作品(39,40])。原来权力的识别顶点的分布规律自然或人工系统并非如此简单(例如,看到工作(39,41,42])。例如,它并不总是可以区分一个幂律从对数正态样本体积小。抛物线对数正态法在对数坐标对应的值足够小的时间间隔 看起来像一个直线对应的幂律。

我们建议的方法的优势是什么?首先,不需要无标度网络划分为几种类型取决于评估的价值指标 和这个评估的重要性水平,提出了(42]。事实上,我们的方法包括使用的三个网络复杂性指标 使用指标的光谱的复杂性 作为网络标识符是唯一可能的复杂性的分析时间序列生成的网络(一些随机过程的实现),而不是在分析数据时的静态网络结构。事实上,PSD和ACF是信号的特点,随机过程和时间序列。其次,频谱的使用 识别网络复杂性范式中的基本原理的复杂性,作为非线性科学的范式之一,而且,在其核心,自组织临界性理论。在这一理论的背景下,网络复杂性决定只有频谱指标的值和不依赖于分布类型 第三,频谱的使用 让我们确定亚临界、自组织临界和超临界状态的网络操作。第四, 指标既可以独立地估计作为一个静态估计斜率比值的对数的规模和比例的估计microposts指标的时间序列,例如,使用去趋势波动分析(见部分3所示。2)。

3所示。数据分析、结果和讨论

本节提供了一个简短的概述的使用数据挖掘技术所需的形成时间序列microposts及其统计和分形分析,以及Twitter的评价指标及其复杂性解释。

3.1。时间序列数据挖掘Twitter

最适合挖掘的数据源的Twitter时间序列数据包含tweet id (tweet的惟一标识符)对于不同的事件,如政治选举和自然灾害,是哈佛Dataverse。它包含的数据集的tweet id在12个不同的主题,每个数据集,包括超过200万个独特的tweet id的形式18位数字(例如,1128408193699340294)组合成一个文本文件(. txt)。哈佛Dataverse收集的数据使用社交饲料管理器,它是丰收的开源软件从Twitter社交媒体数据和网络资源。为什么有必要开始使用Twitter id,而不是微博本身,是每个Twitter的开发政策,tweet id可能会公开共享用于学术目的,但微博可能不是。

然而,为了获得Twitter时间序列,有必要水合物tweet id的获得数据集。保湿是加载的过程从微博基于JSON对象可用tweet id。它可以通过使用Twitter的api接口,以及使用第三方应用程序。我们用0.0.3水合器版本软件。根据获得的数据,可以构建用户的交互结构和时间序列的tweet(包括转发和其他提到)。

我们使用以下相关tweet id时间序列事件和主题的形成和随后的统计和分形分析的时间序列microposts:(1)2016年美国总统大选Tweet id (43]。数据集包含大约2.8亿条tweet id和转发与2016年美国总统选举。推文之间的收集2016年7月13日和11月10日,2016年。(2)女性的Tweet id(3月44]。数据集包含7275228条tweet id和转发有关妇女的1月21日3月2017年。推文之间的收集2016年12月19日,2017年1月23日。(3)项2016年底美国政府推特档案库(45]。数据集包含5655632条tweet id和转发,和原来的微博是由大约3000个Twitter账户,这是与美国政府有关。推文之间的收集2016年10月21日,2017年1月21日。(4)哈维和厄玛飓风Tweet id (46]。数据集包含35596281条tweet id和转发有关飓风厄玛和哈维。(5)移民和旅行禁令Tweet id (47]。数据集由16875766条tweet id和转发相关的移民和旅行禁令宣布的特朗普政府2017年1月。推文之间的收集2017年1月30日,4月20日,2017年。(6)夏洛茨维尔Tweet id (48]。数据集包括tweet id 7665497微博并转发相关事件的夏洛茨维尔弗吉尼亚,2017年8月。(7)2018年冬季奥运会Tweet id (49]。数据集包含13816206条tweet id和转发有关2018年冬季奥运会在平昌举行,韩国。推文之间的收集2018年1月31日,2月27日,2018年。(8)美国政府Tweet id (50]。数据集由9673959条tweet id和转发,和原来的微博是由大约3400美国政府账户。这些帐户是与美国联邦政府机构。推文之间的收集2017年1月20日,7月20日2018年。(9)新闻媒体Tweet id (51]。数据集由39695156条tweet id和转发,和原来的微博是由大约4500个新闻媒体的Twitter账户;这意味着账户旨在传播新闻的大众媒体。2016年微博收集在8月4日,7月20日,2018年。(10)2018年美国国会选举Tweet id (52]。数据集由171248476条tweet id和转发与2018年美国国会选举有关。推文之间的收集2018年1月22日,2019年1月3日。(11)第115届美国国会Tweet id (53]。数据集由2041399条tweet id和转发,和原来的微博都是用Twitter账户的第115届美国国会的成员。推文之间的收集2017年1月27日,1月2日,2019年。(12)爱尔兰8日Tweet id (54]。数据集由2279396条tweet id和转发有关爱尔兰宪法公投废除第八修正案5月25日,2018年。2018年微博收集在4月13日,6月4日,2018年。

结果,我们得到了12个等距(步骤1秒)时间序列microposts ( )不同的长度 ,每一个都是一些相关的话题(tweet id)。接下来,有一个时间序列分析方法的描述 (见部分3所示。2),以及这些分析的结果对于每个时间序列,获得对其整个长度 (见部分3所示。3)。

3.2。统计和分形Twitter时间序列分析的方法

在我们的研究中,时间序列的分析的主要目的microposts是统计确认声明的经验指标范围的复杂性 将值 形式上,我们测试的统计假设一个简单的线性回归的意义: 在哪里 对于PDF, PSD, ACF。这是一个测试的零假设 ,与一个备择假设 与零假设的协议, 值作为指标的最低水平的意义,在其中 被拒绝。我们使用普通最小二乘法(OLS)方法估计参数

过渡到简单线性回归的可能性为时间序列的统计分析是由于依赖性的尺度不变性(1),(2)和(4)。一方面,这样的转变将使它更容易获得指标的统计估计 , , ;另一方面,它将允许建立一个过滤分离从其他non-scale-invariant法律权力的法律,例如,从正常,指数,对数正态和扩展指数法为PDF。

ACF的观察时间序列 代表值的相关性 在不同的时间滞后 ( ),即。,correlations over different time scales 它是根据公式计算 ,在哪里 是一个增量, 状态数据的平均值 ,分别。我们应用标准光谱分析技术(傅里叶变换)计算PSD 的时间序列 作为频率的函数

时间序列分析的传统方法依赖于PSD的测量和ACF。然而,只有高斯过程的实现是详尽的描述了他们的第二个时刻。外这样的实现,一个完整的统计描述需要估计的高阶的时刻。此外,高阶的时刻并不总是有这样一个清晰的物理意义为ACF和PSD。因此,评价一个小值的数量可以被赋予一定的意义变得重要。这些价值包括时间序列的分形维数。

分形维数的比例指数密切相关 ,可以的赫斯特指数,归一化方法估计的范围或波动分析(FA) [55),或广义赫斯特指数,估计的方法去趋势波动分析(DFA) [56]。

DFA方法是一种有效的方法来分析时间序列的特征的存在长记忆或 噪音。DFA方法是一种泛化的FA方法分析非平稳的时间序列的尺度不变性。

DFA方法允许这两种估计比例指标的时间序列 和获得的间接估计 从广义扩展指标,计算指标 的时间序列。在第一种情况下,它的定义 尺度不变的(狭义)的时间序列 ,即。,time series for which the equality of probability distributions ( )发生(57];在第二种情况下,它是关于存在的依赖关系的时间序列和幂律ACF 噪声的形式58]:

英足总方法并不总是给指标的正确估计 大多数时间序列(30.]。与英足总方法相比,DFA方法提供更正确的估计在大多数情况下(30.),所以我们用这种方法来估计

DFA方法的一个算法基于意识形态的过渡从原始时间序列 一维随机漫步的广义模型。在该算法中,数据首先减少到零平均随机漫步的后续施工 接下来,该系列 分为nonintersecting段的长度 ,在每个定义一条直线的方程,近似序列 发现 近似看作是一个当地的趋势。接下来,均方误差的线性近似计算: 和相应的计算是在大范围的值 人们相信依赖 经常有能力的形式 ,和一个线性段的存在对数尺度允许我们国家比例存在。

microposts的数值描述不同类型的相关动态,如果 而不相关的行为 例如,时间间隔 对应于anticorrelations(大型和小型的交替值时间序列的microposts); 决定了相关动力学(大比平均值多遵循大值,和小值按照小的)。的特殊情况 是观察到的 噪音。

3.3。数据分析结果

1介绍了OLS估计频谱复杂性的斜率 线性化的依赖项(6)和DFA比例指标的估计 , , ,获得使用依赖项(7)。相应的 值显示在括号中。


Tweet id

2016年美国总统选举 1.23(0.0121) 1.29(0.0182) 0.12(0.0201) 0.92(0.0036) 0.08(0.0036) 1.04(0.0036)
女性的3月 2.11(0.0234) 1.23(0.0198) 0.42(0.0211) 0.90(0.0101) 0.10(0.0101) 1.05(0.0101)
2016美国政府任期结束 3.24 (0.6743) 0.24 (0.7235) 5.24 (0.6990) - - - - - - - - - - - - 0.45 (0.7699)
飓风哈维 2.12(0.0312) 1.13(0.0289) 0.34(0.0320) 0.89(0.0015) 0.11(0.0015) 1.06(0.0015)
飓风厄玛 2.23(0.0234) 0.98(0.0194) 0.18(0.0209) 0.96(0.0098) 0.04(0.0098) 1.02(0.0098)
移民和旅行禁令 2.18(0.0401) 1.09(0.0320) 0.21(0.0128) 0.97(0.0094) 0.03(0.0094) 1.02(0.0094)
夏洛茨维尔 2.18(0.0313) 1.21(0.0287) 0.43(0.0121) 0.90(0.0101) 0.10(0.0101) 1.05(0.0101)
2018年冬季奥运会 3.59 (0.7239) 0.22 (0.6348) 5.64 (0.5341) - - - - - - - - - - - - 0.52 (0.8172)
美国政府 3.28 (0.6361) 0.19 (0.7298) 6.01 (0.6399) - - - - - - - - - - - - 0.48 (0.7456)
新闻媒体 3.36 (0.4275) 0.23 (0.3895) 5.50 (0.4458) - - - - - - - - - - - - 0.54 (0.6451)
2018年美国国会选举 1.47(0.0281) 1.05(0.0398) 0.22(0.0435) 0.95(0.0099) 0.05(0.0099) 1.03(0.0099)
第115届美国国会 3.99 (0.3189) 0.26 (0.4197) 5.24 (0.5618) - - - - - - - - - - - - 0.46 (0.9999)
爱尔兰8th 2.18(0.0311) 1.18(0.0270) 0.35(0.0311) 0.97(0.0129) 0.03(0.0129) 1.02(0.0129)

符号“-”表示无统计上显著的DFA估计 指标(见方程(7))。这是由于这样的事实,没有显著的线性相关性 microposts对应的时间序列。指数的显著值都用粗体表示。

3.4。结果和讨论

最重要的背景下,我们的研究结果是存在的两类时间序列microposts和tweet id对应于它们。

第一节课的时间序列 , , 指标的时间序列的电力法律属于频谱指标的复杂性 ,因此,Twitter,生成的时间序列microposts, SOC状态或SupC状态。《社交网络》能够产生极端事件,雪崩microposts的大小(关于“大小”,看到部分2.1)对应于以下tweet id:“2016年美国总统大选,”“妇女的3月,”“飓风哈维,”“飓风厄玛,”“移民和旅行禁令,”“夏洛茨维尔”“2018年美国国会大选,”和“爱尔兰8日。“此外,当前microposts数量很大程度上取决于过去的microposts由Twitter。事实上,尽管ACF该类指标的时间序列, 值得注意的是所有tweet id相关的抗议活动或政治选举或自然灾害期间人口活动。PDF的时间序列有无限的 和无限的 事件相关的政治选举和有限的 在所有其他情况下。DFA的估计 给密切值对应的指标 ,和统计学意义的存在价值的标度指数 决定了时间序列的尺度不变性,这是一个关键特性的自组织临界性的社会网络。此外,所有时间序列的第一个类 ,这对应于粉红噪声的存在,因此,在SOC或SupC Twitter状态。的存在依赖项(4)的时间序列microposts意味着当前microposts数量很大程度上取决于过去的microposts由Twitter,以及缺乏时代特征的信息之前出现的microposts将丢失。

第二个类包含的时间序列 , , ;此外,估计所有的指标都没有显著:统计假设与以往被视为接受 值见表1。因此,至少对这些时间序列的microposts,权力法律(1)和(4)并不满意。这个结果去趋势波动分析的结果是一致的,认为没有统计上显著的标度指数的估计 ;因此,这些时间序列的microposts不是尺度不变。因此,Twitter,这些时间序列,是SupC SOC状态和状态。Twitter用户,在这种状态下,不协调。这导致时间序列的生成,谱不执行。也许SubC状态,但是这样的结论需要的决心PDF和ACF依赖关系的显式形式,这是超出了我们的研究范围。唯一的论点支持Twitter的假设在SubC状态指示器的事实 接近的值对应于白噪声( )。

4所示。参数Twitter自组织模型

时间序列的分析结果microposts节3不仅是重要的解决管理问题和识别的Twitter,但也作为发展的基础上的宏观模型描述进化过程和验证社会网络。在我们的研究中,这种时间序列的分析是必要的验证模型,描述了SOC的Twitter状态。这种模型的构造和验证的目的是研究部分中给出4

足够的Twitter的自组织临界模型验证指标的法律(1),(2)和(4)的理论和观测时间序列microposts属于复杂的光谱指标

4.1。广义参数模型

众所周知(例如,看到的作品(59- - - - - -61年),自组织的概念是一个重要的物理概念的泛化现象,如相变。因此,我们提出的现象学理论,是一个泛化理论的热力学开放系统的转换。Twitter自组织是可能由于其开放性,因为有传入和传出网络用户的不断流动;其宏观性质,因为它包含大量的用户;及其耗散,因为有损失microposts和相关信息的流动。

基于从属的协同作用的原理,可以认为Twitter的自组织临界状态是完全由抑制无限的微观行为的自由度由少量的宏观的自由度。因此,社交网络的用户的集体行为是由几个参数定义或自由度:订单参数 ,它的作用是microposts有关某一主题的数量发送个苏,无意中策略后,劳斯;共轭场 与microposts分布式网络上相关信息;和一个控制参数 这是苏的网络的数量。另一方面,在Twitter上的非平衡系统的自组织,流动的耗散microposts网络上应该扮演着重要的角色,它可以确保网络的转变到静止状态。过程中的自组织临界状态的网络,所有三个自由度都有一个平等的角色,和描述的过程需要一个有进化的观点。三个自由度的限制也是由Ruelle-Takens定理(62年),根据观察到的自组织是一个非凡的照片如果选择自由度的数目,至少三个。

动力学方程和一个详细的物理证据之间的关系给出了其参数在我们的论文63年]。带三个参数的自组织机制的建设是基于类比单模激光器的运转机制和微博社交网络。方程的研究可能的修改导致模型能够描述在Twitter上临界现象,特别是SOC或SupC州,超出了本文的范围。这些方程的无量纲量有以下形式: 在哪里 是波动的强度(或噪声)每个自由度的吗 ; 是放松乘以相应的数量; 是白噪声随机因素;和 是苏的数量的网络在初始时间时刻( )网络的进化。的参数 决定了外部干扰的程度或泵的社交网络战略面向用户,从平衡态中删除微博。

假设 ,也忽视了随机因素 ,方程(9)代表一个著名的洛伦茨方程,系统中动态变量描述的有条理的行为秩序参数,共轭字段和控制参数。在这样一个系统,功能 , , 描述自主放松microposts,共轭信息和战略导向的网络用户的数量固定值 , , 洛伦兹系统考虑勒夏特列原理:由于自组织的原因是增长的控制参数 ,的值 应该改变以这样一种方式,防止经济增长 最后,有序参数之间的正反馈 和控制参数 ,导致增加共轭场 ,从根本上是重要的。这就是导致自组织(60]。尽管洛伦兹系统是一个相当粗糙的近似解决一些问题,该系统是一个适当的模型,定性地描述了各种自然过程的自组织系统,包括一线和二阶相变动力学(59]。

反馈强度指标 在方程(9),这也是区别与洛伦兹系统,是一个Twitter的干扰指标的顺序有条理的行为。从物理的角度,替换订单参数归一化到一个( )与更大的值 ( )意味着订购流程影响Twitter的有条理的行为超过在理想情况下,当 在当 ,的参数 可以确定通过引入单位阶跃函数 使用下面的替换: 在哪里

另一个替代的替代方程(9)的参数 下面的形式:

过渡的意义 在洛伦兹系统订单的转换参数的绝对值避免幂函数的最小值 用一个分指数

此外,如果没有指定另外,参数 被定义为(10)和(11)。

4.2。Twitter在绝热近似的自组织临界性

方程(9),以及洛伦兹方程的系统,没有一个精确的解析解。在满足特定的条件下,系统(9在绝热近似相当可以接受的近似。绝热自组织模式对应于一个相变过程的平稳值控制参数不能减少泵的参数(例如,看到工作(59- - - - - -61年])。

在绝热近似的特征松弛时间microposts的数量 远远超过了相应的松弛时间与microposts相关信息和战略面向用户的数量: 这意味着信息 和战略面向用户的数量 遵循microposts的数量的变化 在Twitter上。当条件 完成,服从的原则可以忽视量的波动 在方程(9),即。,assume

使用Twitter作为一个开放的非平衡系统的绝热方法意味着,当社交网络的价值将由战略面向用户倾向于零( ),有一个缓慢下降microposts流动 和迅速降低了相关信息 以及战略面向用户的数量 ,谁发送microposts。

使用绝热近似允许减少相空间的维数,即,从一个三维动态系统的分析与加性噪声(9)的分析单参数随机带乘性噪声系统的最优:

朗之万方程(12)、漂移和扩散部分由以下值: 在哪里

4.3。结果和讨论
4.3.1。自组织临界状态的Twitter

认为社交网络Twitter是自组织成一个临界状态的结果同意苏和劳斯。这样一个饱和网络国家战略面向用户和信息具有以下特点:首先,由面向重要随机战略之间的相互作用强度的用户( ),其次,在Twitter上产生重大影响的简化过程的有条理的行为。在这种情况下,平等(10)持有的反馈强度指标 在这种状态下,即使一个微不足道的外部干扰( )足以雪崩microposts对社交网络的传播。

因此,方程(12),描述的是社交网络的SOC状态,将在以下形式:

假设均匀过程(14)发生在间隔 ,在哪里 的最低数量是microposts幂律的PDF。然后,nonnormalized解决方案和实验所得到相应的固定与反射边界是由

PDF的积分(15)具有以下形式,而笨重的分析: 在哪里 是超几何函数。

PDF(非规范的图15在对数尺度) 和的值 提出了在图1

分布(15)是一个幂律的PDF表单(1)与指标 ,对应的反馈强度指标 增加反馈强度导致的固定概率的增加 对所有

为了获得PSD分析值和随机过程的ACF (14),有必要获得解析解 和实验所得到相应的不稳定。是否有可能获得一个精确的分析值 因此,一个分析的定义 ,然后它将很难解释。因此,我们获得的这些依赖性的结果数值积分方程(14)。根据这个随机过程的实现,获得了依赖性 测定。

在数据23PSD,介绍了ACF在对数尺度的过程中实现(14)。获得随机的实现过程和处理结果,标准Wolfram Mathematica算法使用11.2版本。首先,数据是使用“ItoProcess”功能来生成的。进一步,基于获得的数据使用“PowerSpectralDensity”功能,PSDs类似图所示2建成。使用“CorrelationFunction”, acf类似如图中被发现3。下面所示的数据是:线性近似的估计比例指标 所获得的平均超过10000 OLS估计的实现 随机过程。在图所示的直线2是一个线性近似的PSD的OLS估计指数吗 与粉红噪声对应于一个随机过程;直线图3是一个线性近似的ACF指数的估计 对应于一个随机过程的长期记忆。相应的 值显示在括号中。

因此,方程(14)是一个很好的近似描述Twitter的自组织临界状态。实际上,所有理论的复杂性指标(临界) , , 属于频谱指标的复杂性

4.3.2。亚临界和超临界状态的Twitter

Twitter的SubC状态是一种混乱的状态,其特征是可以忽略不计的雪崩的存在microposts,因此, 不是幂律PDF。还SubC状态的特点是耐小扰动。在这种状态下,一些小混乱的定向流动microposts是由所有用户的社交网络,无论规模战略面向用户。的社交网络功能直到SubC状态 达到一定临界值 在这种状态下,简化过程几乎没有影响网络的首尾一致的行为,即。的反馈强度指标 ,和每一个自由度的波动强度相当(让我们以 )。

因此,SubC Twitter是被下面的朗之万的状态方程: 在哪里

假设流程(17)在区间 ,和实验所得到相应的固定的解决方案是一个PDF下列形式:

分布的积分(18)具有以下形式:

分布曲线(18呈现在图4在一个双对数的规模。

很明显,PDF呈现在图4不是一个幂律PDF,因此这种分布描述的出现雪崩microposts只有相对较小的规模。此外,增加网络注入 导致增加,虽然不显著,在出现的频率相对大量的microposts。

因此,它是合理的假设进一步提高战略面向社交网络用户的数量一定的临界值 ,伴随着显著增加随机强度之间的相互作用( ),将导致网络自组织临界状态。

Twitter SubC状态能够生成时间序列的microposts相对较小的值。也许,这些时间序列对应于以下微博标识符:“项2016年底美国政府”,“2018年冬季奥运会,”“美国政府”和“新闻媒体”。

如果 ,然后混乱秩序的变化,而不是无关紧要的microposts混乱的定向流动,一个专门的定向流动(雪崩)microposts出现在网络上。这个流在宏观的变得重要。像SupC SubC状态,状态是对小干扰(例如,添加只有一个苏)。SupC状态,小扰动不能明白地影响microposts雪崩的大小。

microposts的数量的分布特征是Twitter的SupC状态呈现在图5在一个双对数的规模。提出了pdf(见分布(15)) 和各种网络注入参数的值。

此图所示的分布符合幂律PDF。此外,权重分布的反面是由于增加注入网络的战略面向用户。如果Twitter SupC状态,那么苏和的数量,因此,microposts雪崩大小继续增长。

5。讨论

结果都是感兴趣的对于识别SubC状态或Twitter的SupC状态对小干扰稳定分析的基础上观察到的时间序列microposts和确定的原因社交网络自组织临界状态。

存在的临界指标 microposts的观测时间序列是一个足够的功能,Twitter是SupC状态。这样一个国家 网络上的演化过程,在时间间隔中继续存在 从时间开始 ,网络的行为变得不可预测:雪崩microposts任何规模的随着时间的推移会出现

很重要的SupC状态的识别网络不需要详细分析微程序级的用户之间的交互。只有一个时间序列的分析microposts光谱中是足够的,不需要进行大量的资源成本。此外,估计 可以获得独立,例如,使用DFA方法。

之前在SOC状态网络的过渡时间 然后在SupC状态,在SubC状态在时间间隔 如果网络是在这种状态下,PDF和ACF的观测时间序列microposts扇区(见附件(不1)和(4),分别)。这种状态可以被描述为PDF和ACF指数法,指数 PSD的值接近于0。重要的是要注意,有可能是一个网络在这种状态下可能出现一个临界状态。在SOC状态转变之前,会有一个缓慢增长的大小雪崩microposts随着时间的推移,直到出现一个大水花在时间序列 但SOC状态的出现在网络上没有必要:网络可以继续SubC状态,直到它完全放松是因为失去用户兴趣的话题讨论。

一个监控社交网络状态的方法基于光谱分析,例如,可以有效识别抗议运动的起源,Twitter是一个工具。此外,该方法可以用来研究用户在网络上的活动与政治选举。例如,如果社交网络处于SubC状态和相应的时间序列的microposts可以找到间隔 ,在缓慢增加雪崩的大小是所观察到的,那么这样的存在 可能是前体的SOC的外观状态,进一步转换到SupC状态。另一种情况是可能的。如果可以找到一个相对较小的区间 ,这样一个区间的存在是一个可能的前兆的不可预测性在社交网络上的行为。从时间开始 ,雪崩microposts的大小将会出现。注意,这只不过是一个讨论所有可能的应用程序。进行这样的研究,有必要开发和测试等检测算法积分,但这超出了我们的研究范围。

拟议中的现象学社交网络自组织方程(9在绝热近似)(14)描述不仅SubC Twitter的功能,SOC, SupC州,但也的条件从一个临界状态过渡到另一个地方。后者显然是显示在表2


状态

SubC 1
SOC
SupC

SubC状态Twitter是一个典型的社交网络状态。事实上,网络由大量用户 ;每个遵循自己的策略,而不是与其他网络用户的策略有关。的强度波动每个自由度的相称( ),和反馈强度的指标( )= 1。网络所注入的战略导向的用户( )不改变网络运作模式定性。

必要条件的网络自组织临界状态的出现一定数量的用户 在遵循一定的策略,即。,acting in concert, involving random users as their subscribers. This is an instantaneous unstable state of the network that does not require pumping ( )。在这种状态下,随机苏之间的相互作用的强度增加显著( ),和简化过程影响Twitter的有条理的行为更强烈( )比如果Twitter SubC状态。

由于注入网络的战略导向的用户( ),网络移动到SupC状态。在这种状态下,随机苏之间的相互作用的强度

它根本上是重要的自组织临界状态发生的结果同意行动用户数量相对较小的一个策略。随机用户不能形成雪崩microposts各种规模的网络。

6。结论

总之,我们制定重要的问题,无法得到的答案在现象学的分析模型(12)绝热近似的Twitter自组织,我们也表示可能的方法来找到解决方案。

当讨论到Twitter的自组织临界状态(见节机制2.1),它是指出,一个可能的机制出现的SOC状态的形成网络的层次结构,通过它的雪崩microposts各种规模的出现在网络上。以下是简要概述的研究。

Moriano和合作者状态在他们的论文中(64年)“全球事件触发病毒信息瀑布,容易跨社区边界,因此可以被监控内部和民族间的通信。“他们显示,当一个全球性事件(波士顿马拉松轰炸)时,它像病毒一样传播,跨社区边界和生产更多的共同性。尽管我们正在谈论信息级联,没有证据表明在本文的自组织临界特性这一现象。存在的需要层次结构(用户、用户,用户的用户,等等)的出现提出了自组织临界状态(65年,66年]。莫尔斯和合作者67年考虑到持续的级联,即。,recurring patterns of communication among individuals, and relate them to hierarchical spreading of content, analogously to what we discuss in our study. Liu and co-authors [68年设计一个嵌入模型,利用多个hashtag-hashtag关系,hashtag-tweet, tweet-word, word-word关系基于分层异构网络。

斯特拉和合作者69年)在Twitter上检测级联率和大小之间的幂律关系在投票活动和他们说明社会机器人被人类用户能够创建microposts雪崩。他们显示,“在线社交互动在大规模的选举事件可以用来建立一个准确的映射现实世界的政党和选举排名为意大利在2018年的选举。:“他们提供证据表明,信息流和集体的关注往往是由一种特殊类的高度影响力的用户,谁利用数以千计的自动化的工作人员,也被称为机器人,增强他们的网络的影响。,“此外,他们表现出有影响力的用户生成深度信息的级联与新闻媒体和其他广播公司相同的程度,虽然他们统一在确定群体的全面渗透。“很明显,高影响力的用户,他们利用成千上万的自动代理是苏。Rizoiu和合作者状态在他们的论文中(70年),“Socialbots Twitter-starting更多转发瀑布更活跃,多转发它们比人类更有影响力的2.5倍,和更多的政治参与。“有研究社会机器人的角色信息级联的出现被认为是(例如,看到工作(71年,72年])。

Gonzalez-Bailon和合作者73年研究”在Twitter网络招聘模式,找到证据的社会影响力和复杂的蔓延。“他们发现参与者(即早期的网络位置。,the leaders of the recruitment process) and of the users who acted as seeds of message cascades (i.e., the spreaders of information). They found that early participants cannot be characterized by a typical topological position, but spreaders tend to be more central in the network.

最后,让我们考虑谁可以作为苏或劳斯。应该注意的是,苏的识别和/或劳斯,时间序列分析的microposts是不够的。一个更有意义的情感数据分析等超出了我们的研究范围。

在第一节课,正如我们先前所讨论的,有个苏。在政治选举的情况下,苏可能是网络政治机器人或“僵尸网络”,一致行动和使用Twitter作为一个平台的形成microposts的雪崩。例如,Kollanyi和合作者74年),分析Twitter数据集在2016年美国总统选举,发现“政治机器人达到最高记录为2016年的竞选活动。“抗议运动的情况下,苏,如领导人或抗议活动的组织者,可以协调用户使用Twitter作为一个平台,鼓励他人抗议。王:表示在75年]“Twitter是一个工具主要用于共享目标,物流信息,连同意见,建立一个统一的社区和动员个人参与抗议的物理空间。最后,在自然灾害的情况下,我们假设苏可以最活跃,但noncoordinated Twitter用户。例如,这些用户可以使用Twitter传播的当前状态的信息在他们的社区环境,剩下的水在最近的食品等。

然而,它更有趣的考虑可能的用户的本质在第二课。我们的分析显示,只有在这些数据集:劳斯(1)项2016年底美国政府推特档案库。原来的微博是由3000用户与联邦政府的美国政府机构。我们假设这些用户行为相互不一致和发布内容。没有一致的行为在他们的行动,比如勾结。因此,他们是劳斯。(2)2018年冬季奥运会。显然,很多不同的用户使用Twitter平台广告内容;然而,所有用户追求他们自己的利益。例如,每个运动员使用Twitter作为自己品牌的广告平台。在这种情况下,他们是劳斯。(3)美国政府。原来的微博是由3400用户与联邦政府的美国政府机构。以前,这些tweet一般内容和没有统一到一个共同的目标,所以这些用户是劳斯。(4)新闻媒体。基本的微博是由新闻机构。然而,每个机构都有自己的主题,以及自己的方式呈现的新闻。此外,每个机构促进新闻在不同的时间,有时,支持不同的冲突,例如。我们认为这可能是最合理的描述为什么这些新闻机构是劳斯。(5)第115届美国国会。原来的微博是由535年,国会成员和他们的官方代表。2018年冬季奥运会的例子,每个成员使用Twitter作为平台来分享他的想法,但他们不是统一到一个共同的目标。在这种情况下,他们是劳斯。

数据可用性

之前报道的Tweet id数据被用来支持这项研究,可以在[https://doi.org/10.7910/DVN/PDI7IN,https://doi.org/10.7910/DVN/5ZVMOR,https://doi.org/10.7910/DVN/TQBLWZ,https://doi.org/10.7910/DVN/QRKIBW,https://doi.org/10.7910/DVN/5CFLLJ,https://doi.org/10.7910/DVN/DVLJTO,https://doi.org/10.7910/DVN/YMJPFC,https://doi.org/10.7910/DVN/2N3HHD,https://doi.org/10.7910/DVN/2FIFLH,https://doi.org/10.7910/DVN/AEZPLU,https://doi.org/10.7910/DVN/UIVHQR,https://doi.org/10.7910/DVN/PYCLPE]。这些先前的研究(和数据)是在相关地方引用文本中引用(43- - - - - -54]。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这部分工作是由俄罗斯基础研究基金会资助(批准16-07-01027)。

引用

  1. p . Sen和b . ChakrabartiSociophysics:介绍英国牛津,牛津大学出版社,2013年。
  2. r·库特纳m . Ausloos d·格雷奇·t·迪马特奥,c . Schinckus h·e·斯坦利,“经济物理学和sociophysics:里程碑和挑战。”自然史答:统计力学及其应用卷,516年,第253 - 240页,2019年。视图:出版商的网站|谷歌学术搜索
  3. m·纽曼,“物理网络”,今天的物理,卷61,不。11日,33-38,2008页。视图:出版商的网站|谷歌学术搜索
  4. s . n . Dorogovtsev a . v . Goltsev和j·f·f·门德斯,“在复杂网络临界现象”,现代物理学的评论,卷80,不。4、1275 - 1335年,2008页。视图:出版商的网站|谷歌学术搜索
  5. p . Fronczak a . Fronczak和j·a . Hołyst“相变在社交网络上,”欧洲物理期刊B卷,59号1,第139 - 133页,2007。视图:出版商的网站|谷歌学术搜索
  6. 公元前欧盟”,不可逆过程热力学非平衡态统计力学,物理学的基本理论(国际书系列物理学的基本理论:澄清),“发展和应用卷。93年,12-54,1998页。视图:谷歌学术搜索
  7. p . Bak, c . Tang和k . Wiesenfeld”自组织临界性:1 / fnoise的解释,“物理评论快报卷,59号4、381 - 384年,1987页。视图:出版商的网站|谷歌学术搜索
  8. p . Bak, c . Tang和k . Wiesenfeld“自组织临界性,”物理评论一个,38卷,不。1,第374 - 364页,1988。视图:出版商的网站|谷歌学术搜索
  9. d·马尔科维奇和c·格罗斯,”法和自组织临界性理论和自然的力量,”物理的报告,卷536,41 - 74,2015页。视图:出版商的网站|谷歌学术搜索
  10. 塔迪奇,m . m . Dankulov和r . Melnik”机制自组织临界性的社会知识创造的过程,”物理评论E文章ID 032307卷,96年,2017年。视图:出版商的网站|谷歌学术搜索
  11. 问:k .孟”,自组织临界性在小世界网络中基于社会平衡的动态,“中国物理快报ID 118901条,卷。28日,2011年。视图:出版商的网站|谷歌学术搜索
  12. p·a·诺埃尔·c·D·Brummitt和r . m . D’索萨,“自底向上的模型的自组织临界性网络,”物理评论E文章ID 012807卷,89年,2014年。视图:出版商的网站|谷歌学术搜索
  13. a . Mollgaard和j . Mathiesen”紧急twitter上的用户行为建模的随机微分方程,”《公共科学图书馆•综合》文章ID e0123876卷。10日,2015年。视图:出版商的网站|谷歌学术搜索
  14. m·阿奎莱拉得越多,x Barandiaran et al .,“量化政治自组织在社会媒体。分形图案在西班牙15 m运动在twitter上,”学报》第12届欧洲会议上人工生命,页395 - 402年,底特律,美国,2013年9月。视图:谷歌学术搜索
  15. l . Kirichenko诉Bulakh, t . Radivilova”分形时间序列分析社交网络活动,”《IEEE 4日国际Scientific-Practical会议Infocommunications的问题哈尔科夫,页456 - 459年,乌克兰,2017。视图:谷歌学术搜索
  16. t . De Bie, j . Lijffijt C . C Mesnage et al .,“检测twitter趋势时间序列,”IEEE学报》26日国际研讨会在机器学习信号处理2016年,页1 - 6,萨勒诺,意大利。视图:谷歌学术搜索
  17. r·p·d·r·Bild y . Liu迪克et al .,“总描述用户行为的Twitter和retweet图的分析,“ACM网上交易技术,15卷,不。4、2015。视图:出版商的网站|谷歌学术搜索
  18. c·雷米n . Pervin f . Toriumi et al .,“twitter上的信息扩散:每个人都有机会,但机会是不平等的,”《IEEE国际会议Signal-Image技术和网络系统2013年,日本京都。视图:谷歌学术搜索
  19. j·p·格里森和r . Durrett网络时间的雪崩,”自然通讯,8卷,p。1227年,2017年。视图:出版商的网站|谷歌学术搜索
  20. c·刘,x。詹,Z.-K。张,G.-Q。太阳,下午回,“事件确定传播模式:信息传输通过内部和外部的影响在社交网络上,“新物理学杂志,17卷,不。11日,ID 113045条,2015年。视图:出版商的网站|谷歌学术搜索
  21. p•贝克大自然是如何工作的。自组织临界性的科学斯普林格出版社,纽约,纽约,美国,1996年。
  22. r·阿尔瓦雷斯d·加西亚y莫雷诺et al .,“情绪瀑布在15米运动”EPJ数据科学,4卷,不。6、2015。视图:出版商的网站|谷歌学术搜索
  23. m . s . Pramanik问:Wang Danisch et al .,“模拟级联形成在twitter中提到和转发,“社会网络分析和挖掘7卷,1-41,2017页。视图:出版商的网站|谷歌学术搜索
  24. m . m . Uddin m·伊姆兰·h·萨贾德,“理解类型的用户在twitter上,”第六日月光半导体学报》在社会计算国际会议美国CA,斯坦福大学,2014年。视图:谷歌学术搜索
  25. 人工智能Olemskoi”superdiffusion分层模式”,实验和理论物理快报》杂志上,卷71,不。7,285 - 288年,2000页。视图:出版商的网站|谷歌学术搜索
  26. e . Bakshy a·阿伯w·a·梅森et al .,“每个人都是一个影响者:量化影响在twitter上,”诉讼WSDM的11第四ACM国际会议网络搜索和数据挖掘,页65 - 74,香港,中国,2011。视图:出版商的网站|谷歌学术搜索
  27. e . Himelboim m·a·史密斯·l·雷尼et al .,分类Twitter Topic-Networks使用社会网络分析,社交媒体+社会,纽约,纽约,美国,2017年。
  28. d . Antoniades和c . Dovrolis”协同进化动力学在社交网络:一个案例研究的推特,“计算社交网络,卷2,21,2015页。视图:出版商的网站|谷歌学术搜索
  29. j . Portugali“自组织和城市”百科全书的复杂性和系统科学施普林格,纽约,纽约,美国,2009年。视图:出版商的网站|谷歌学术搜索
  30. j . w . Kantelhardt“分形和多重分形时间序列,”数学的复杂性和动力系统施普林格,纽约,纽约,美国,2012年。视图:出版商的网站|谷歌学术搜索
  31. a . Clauset c . r . Shalizi, m·e·j·纽曼“幂律分布在经验数据,”暹罗审查,51卷,不。4、661 - 703年,2009页。视图:出版商的网站|谷歌学术搜索
  32. A.-L。巴巴斯和r·阿尔伯特”出现随机网络的扩展,“科学,卷286,不。5439年,第512 - 509页,1999年。视图:出版商的网站|谷歌学术搜索
  33. m . Boguna r . Pastor-Satorras, a . Vespignani”和有限尺寸效应在无标度网络,”欧洲物理期刊B,38卷,第209 - 205页,2004年。视图:出版商的网站|谷歌学术搜索
  34. j·s·安德拉德,赫曼·h·j·r·f·安德拉德et al .,“阿波罗网络:同时无尺度,小世界,欧几里得,空间填充,和匹配图,“物理评论快报卷,94年,第1871 - 1870页,2005年。视图:出版商的网站|谷歌学术搜索
  35. w .意愿、男性d艾德森和j·c·道尔”数学和互联网:巨大的困惑和巨大的潜力,”AMS的通知,56个卷,第599 - 586页,2009年。视图:谷歌学术搜索
  36. 梅丝洛夫,m . Marcon k . p . Gummadi et al .,“测量和在线社交网络的分析,”学报》第七届ACM SIGCOMM互联网会议上测量2007年美国圣地亚哥CA。视图:出版商的网站|谷歌学术搜索
  37. h . Thomas j . m .阅读,l . Danon et al .,“测试优先连接社交网络形成的假说,“EPJ数据科学卷,4 p。13日,2015年。视图:出版商的网站|谷歌学术搜索
  38. 答:巴斯网络科学英国剑桥,剑桥大学出版社,2016年。
  39. m·p·h·Stumpf m·a·波特,“对权力法律至关重要的真理,”科学,卷335,不。6069年,第666 - 665页,2012年。视图:出版商的网站|谷歌学术搜索
  40. m·o·杰克逊和b·w·罗杰斯“会议陌生人和朋友的朋友:社交网络是随机的?”美国经济评论,卷97,不。3、890 - 915年,2007页。视图:出版商的网站|谷歌学术搜索
  41. 公元Broido和a . Clauset”无标度网络是罕见的。”自然通讯,10卷,p。1017年,2019年。视图:出版商的网站|谷歌学术搜索
  42. m·奥特曼Gerlach和e . g .“测试统计法律在复杂的系统中,”物理评论快报文章ID 168301卷,122年,2019年。视图:出版商的网站|谷歌学术搜索
  43. l . Wrubel j·利特曼,d . Kerchner“tweet id、美国总统大选”2016。视图:谷歌学术搜索
  44. j·利特曼和美国公园,“女性的tweet id 3月,2017年。视图:谷歌学术搜索
  45. 李曼荣j . d . Kerchner, l . Wrubel”术语2016年底美国政府推特档案库,”2017年。视图:谷歌学术搜索
  46. j·利特曼,”哈维和厄玛飓风tweet id”, 2017。视图:谷歌学术搜索
  47. j·利特曼”,移民和旅行禁令tweet id”, 2018。视图:谷歌学术搜索
  48. j·利特曼,”夏洛茨维尔tweet id”, 2018。视图:谷歌学术搜索
  49. j·利特曼”,2018年冬季奥运会tweet id”2018。视图:谷歌学术搜索
  50. 李曼荣j . d . Kerchner, l . Wrubel”美国政府tweet id, 2017。视图:谷歌学术搜索
  51. j·利特曼,l . Wrubel d Kerchner et al .,“新闻出口tweet id”, 2017。视图:谷歌学术搜索
  52. l . Wrubel j·利特曼,D . Kerchner D,”美国国会选举tweet id, 2019。视图:谷歌学术搜索
  53. j·利特曼”,第115届美国国会tweet id”, 2017。视图:谷歌学术搜索
  54. j·利特曼,“爱尔兰八tweet id”, 2018。视图:谷歌学术搜索
  55. h·e·赫斯特,“水库的长期存储容量美国土木工程师协会的事务卷,116年,第799 - 770页,1951年。视图:谷歌学术搜索
  56. C.-K。彭,s . v . Buldyrev s Havlin m·西蒙斯h·e·斯坦利和a . l . Goldberger“马赛克组织DNA的核苷酸,”物理评论E卷,49号2、1685 - 1689年,1994页。视图:出版商的网站|谷歌学术搜索
  57. m·李”分形时间a系列教程审查”,数学问题在工程文章ID 157264卷,2010年,2010年。视图:出版商的网站|谷歌学术搜索
  58. 美国诉Buldyrev, a . l . Goldberger s Havlin et al .,“编码和非编码DNA序列的长程相关性属性:基因库分析,“物理评论E,51卷,不。5,5084 - 5091年,1995页。视图:出版商的网站|谷歌学术搜索
  59. 人工智能Olemskoi和a . v . Khomenko带三个参数的相变动力学。”理论和实验物理学杂志》上卷,83年,第1192 - 1180页,1996年。视图:谷歌学术搜索
  60. 人工智能Olemskoi”与奇异乘法噪声随机系统理论”,Physics-Uspekhi第41卷。。3、269 - 301年,1998页。视图:出版商的网站|谷歌学术搜索
  61. ai Olemskoi, a . v . Khomenko, d . o . Kharchenko“内自组织临界部分洛伦兹计划,”自然史答:统计力学及其应用卷,323年,第293 - 263页,2003年。视图:出版商的网站|谷歌学术搜索
  62. d .窄小的街道和f·塔肯斯,”湍流的本质。”通信的数学物理,20卷,不。3、167 - 192年,1971页。视图:出版商的网站|谷歌学术搜索
  63. a•德米特里诉Kornilov, s . Maltseva”微博社交网络的复杂性现代非线性科学的框架下,“复杂性卷,2018篇文章ID 4732491, 2018。视图:出版商的网站|谷歌学术搜索
  64. p . Moriano j . Finke, y安,“以社区为基础的时间中的事件检测网络,”科学报告,9卷,p。4358年,2019年。视图:出版商的网站|谷歌学术搜索
  65. j·p·格里森j·a·沃德k·p·奥沙利文et al .,“Competition-induced临界模型的meme流行,”物理评论快报文章ID 048701卷,112年,2014年。视图:出版商的网站|谷歌学术搜索
  66. j·p·格里森k . p . O ' sullivan, r . a . Banos y莫雷诺,“网络结构的影响,竞争在社会传播现象和记忆时间,“物理评论X》第六卷,ID 021019条,2016年。视图:出版商的网站|谷歌学术搜索
  67. s .莫尔斯·m·c·冈萨雷斯,n . Markuzon“持续瀑布扩散的作用,”物理评论E卷,99年,第12331 - 12323页,2019年。视图:出版商的网站|谷歌学术搜索
  68. j·刘,z .他和黄y”Hashtag2Vec:学习标签表示与关系层次嵌入模型,”二十七学报》国际联合会议上人工智能,页3456 - 3462,斯德哥尔摩,瑞典,2018年7月。视图:谷歌学术搜索
  69. m·斯特拉·m·Cristoforetti和m . De Domenico”的影响,增强人类在投票活动,网上交流”《公共科学图书馆•综合》文章ID e0214210卷。14日,2019年。视图:出版商的网站|谷歌学术搜索
  70. M.-A。Rizoiu, t·格雷厄姆·r . Zhang et al .,“DEBATENIGHT: socialbots在twitter上的作用和影响在第一个2016年的美国总统辩论,”第十二学报》国际AAAI会议网络和社会化媒体(ICWSM 2018),页300 - 309,帕洛阿尔托,加州,美国,2018年6月。视图:谷歌学术搜索
  71. m·t·巴斯托斯和d . Mercea brexit僵尸网络和用户意见空前的新闻。”社会科学计算机审查,27卷,2017年。视图:谷歌学术搜索
  72. c .邵g . l . Ciampaglia o . Varol et al .,“社会机器人low-credibility内容的传播,”自然通讯,9卷,p。4787年,2018年。视图:出版商的网站|谷歌学术搜索
  73. s Gonzalez-Bailon j . Borge-Holthoefer a . Rivero和y Moreno”抗议招聘通过在线网络的动力学,”科学报告,卷1,1 - 7,2011页。视图:出版商的网站|谷歌学术搜索
  74. b . Kollanyi p . n .霍华德,s . c·伍利机器人和自动化Twitter在美国大选期间,数据备忘录计算,项目宣传,牛津大学,英国,2016年。
  75. 王z和k:“ben berkowitz:分析twitter使用在抗议活动中,“社交网络,5卷,不。4、101 - 117年,2016页。视图:出版商的网站|谷歌学术搜索

版权©2019年安德烈Dmitriev等。这是一个开放分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点1352年
下载744年
引用

相关文章

文章奖:2020年杰出的研究贡献,选择由我们的首席编辑。获奖的文章阅读