文摘

近年来非线性科学的发展导致了一个新的范式叫做范式的形成的复杂性。自组织临界性理论构成了这种模式的基础。估计一个微博的社交网络的复杂性,我们使用的一个概念方案的范式,即关键的迹象的系统的外部表现的复杂性系统无论其内部结构。我们的研究显示所有关键的迹象microposts数量的时间序列的复杂性。我们提供一种新的模式的微博社交网络作为一个非线性随机动力系统三维相空间的加性噪声。实现该模型的绝热近似拥有所有关键信号的复杂性,使得该模型合理的微博社交网络的演化模型。绝热近似允许我们模型的使用微博社交网络作为非线性随机动力系统与乘法噪声与一维相空间中的幂律。

1。介绍

社交网络研究的时间比任何其他类型的网络。是显著的迹象之一网络complexity-a节点的度分布的幂律(1)是在1965年第一次经验由d .价格制定的社会网络。1999年,a·l·巴斯大学的物理学家巴黎圣母院(美国),和他的研究生r·艾伯特决定(2,3),对许多网络,而不是预期的泊松概率分布的节点的度(即。,the number of connections a node has to other nodes), the distribution they obtained approximately followed a power law as all critical states do. In many real networks, a small number of nodes have a large number of connections, whereas a large number of nodes have just a few connections. Such networks are called scale-free networks. This name was not invented specifically for this type of networks. It came from the theory of critical phenomena, where fluctuations in critical states also follow a power law. The theory of scale-free networks is considered to be one of the scenarios complex systems follow when they come into a critical state. As of late, such networks are more often called complex networks.

一些其他相关作品在这方面的参考文献。(4- - - - - -8]。

大量研究建模的社交网络的结构和功能是可用的。本研究有两个方向。第一方向与社交网络的分析数据(见一个最新的评论(9]),而第二个问题的结构模型的发展,动态,和社交网络的进化。之间的区别这两个方向有点武断,因为在大多数情况下,这些方向重叠(见,例如,10,11])。

从下半年开始 世纪,物理学的思想和方法往往渗透到自然科学和传统的人文学科。物理建模的方法常常是用于人口统计等领域的科学、社会学和语言学。因此,sociophysical社交网络的模型,如伊辛模型(12- - - - - -15],玻色-爱因斯坦凝聚态模型[3,16),量子游走模型(17],基态和社区检测[18,19)等。

尽管有各种sociophysical模型,非线性科学的成果和理论,一些除外(见,例如,20.,21]),不使用社交网络的演化模型。首先,我们正在谈论的复杂性和自组织临界性理论描述复杂性的机制(22- - - - - -24]。机制提出了自组织临界性的社会知识创造过程在文献[25]。值得注意的是系统的复杂性的关键标志无论其内部结构,即。它完全基于一个外部特征,在这一理论的框架下制定。根据这一理论,一个系统被认为是复杂的,如果它能够产生意想不到的和/或不寻常的事件(例如,在时间序列的值)。这激励我们的研究。这项研究的目的是一个非线性的动力学解释微博网络的复杂性和发展一个合适的网络模型,该模型可以解释其复杂性使用非线性科学的第三范式叫做复杂性范式。另一个动机的研究中给出的结果(26- - - - - -31日)的时间序列的microposts特点是大多数系统复杂性的关键信号(详细描述的关键系统的复杂性提出了部分的迹象2)。

本文组织如下。部分2处理的关键信号系统的复杂性根据复杂性范式。部分3提出了分析结果的经验时间序列microposts,包括计算的结果的关键复杂的迹象。部分4微博社交网络的模型非线性确定性动力系统包括其功能和限制。部分5提出了一种广义的微博社交网络模型,考虑修改的随机源和减少参数的顺序,以及分析在绝热近似的结果。部分6包含的主要研究和讨论的结果。

2。复杂性的非线性动力学解释

任何科学分支的发展导致的制定模式,即初步概念方案、模型问题的语句,和解决方案的问题。在这个时候,三个非线性科学的范式已经开发出来。第一个范式是自组织。第二个是确定性混沌的范式。非线性科学的最新发展与第三范式密切相关,这可能被定义为一个范式的复杂自组织临界性理论作为其基础。范式的复杂性在于结的前两个范例。如果前两个模式处理秩序和混乱,分别第三通常被描述为“生活在混沌的边缘”(32]。

因为它是不可能严格定义的复杂性,我们的研究仅限于考虑的关键信号系统的复杂性在出版物中定义的每贝克和合作者22- - - - - -24),他们的应用程序来解释微博社交网络的复杂性。正如简介中提到的,首先,我们考虑外部系统的复杂性表现无论内部结构。为本研究的目的,我们定义“外部系统表现”信号的时间序列(microposts)生成的微博社交网络的重要的相互作用在一个非常大的池的用户。

复杂性的一个重要标志是其倾向的发生灾难性events-either意想不到的(即。非凡,nonpredictable)或(即。,prominent among similar events), or both. Importantly, in either case we can conclude that the system that has generated such an event is complex. From simple systems, we could expect predictability and similarities in their behavior. As for the signals of a microblogging system, such events qualitatively correspond to considerable bursts seen on a plot of value increments of the time series of a number of microposts. One of the quantitative criteria of the existence of catastrophic events is the existence of power low of the probability density function (PDF) for the values of the time series. It is worth mentioning that, in the majority of cases, the occurrence of such events on the network signal level corresponds to the qualitative restructuring of the system, i.e., a transition from a polycentric state to a monocentric state, and vice versa (such transitions are thoroughly described in [33])。

另一个关键复杂性是尺度不变性的迹象,这意味着事件或对象缺乏自己的特征维度,时间,精力,等等。在微博网络的外部表现,尺度不变性意味着microposts数量的时间序列分形或多重分形时间序列(这类时间序列(详细描述34])。

在一般情况下,一个低功率PDF是一个时间序列的统计尺度不变性的表达: 通常在哪里 PDF (1)属于类厚尾的pdf文档。灾难性事件的统计描述,PDF (1)是一个规则,几乎没有例外。PDF (1)不同于紧凑的分布(例如高斯分布),因为事件对应的尾部分布不够罕见的被忽视。PDF (1)反映了一个强大的相互依存的事件。例如,这样的分布可能是由于一个遗憾microposts数量的增加在网络的“连锁反应”由新任命的。

尺度不变性的另一个表现时间序列的功率谱密度(PSD)的存在特定的闪烁噪声: 在哪里 PSD的存在(2)意味着相当一部分的能量与非常缓慢的过程。微博网络,PSD的存在(2)意味着它是不可能预测的时间序列的行为很多microposts不考虑全球信息交换过程。

PDF和PSD的上述特征尺度不变性的并不是唯一标准。除了PDF和PSD,我们使用一个分形维数和赫斯特指数以及其他定量措施和标准。重要的是要强调,尺度不变性和倾向的灾难是典型的只对系统远离平衡。因此,系统的非平衡状态,因此,非线性的必要条件是系统的复杂性。

最后,第三个关键说明描述复杂系统是其完整性。系统的整体性能通常由幂律空间和时间相关性统计描述。这些相关性被称为遥远的空间和时间相关性。遥远的存在时间相关性或长记忆时间序列的特征是自相关函数(ACF)在以下表格34]: 在哪里 关系的存在3)意味着缺乏特征时间的前面的事件可能会丢失信息。灾难性的行为和完整性以以下方式连接:灾难性的行为,系统的一部分应该能够在协调功能。微博网络,一个遗憾microposts数量的增加是可能的,当一个用户和他的追随者,追随者的追随者,等等,在协调工作。完整性是可能的在复杂系统自组织的过程。这里我们讨论粗尺度系统的属性,因为小系统参数的变化不影响其完整性。

因此,微博网络是一个复杂的系统当所有上面列出的关键信号的复杂性感到满意。这个表述形式的基础研究和建设的关键是一个微博网络的演化模型。

3所示。从Twitter的经验数据分析

用于我们的研究经验数据的样本超过300万microposts(微博、转发和链接)大约2016年前美国总统辩论。示例包括microposts发布超过100万用户13:45 - 9月26日,2016年9月27日11:00 2016秒的增量。

1显示的总数microposts与时间(Twitter时间序列, )。很容易看到 有非凡的事件和意外事件(爆发)。

估计相关维度( )和嵌入维数( ),我们使用了Grassberger-Procaccia算法(35]。我们获得的

因此,这个过程导致的 系列不是随机;这取决于有限数量的关键参数(36]。的 系列不是随机;它是混乱的。例如,对于随机系列对应的高斯噪声, ,如果对应广义布朗系列,那么噪音

利用R / S分析,我们得到了赫斯特指数( )。计算时间序列的分形维数( )我们提出的算法用于37]。我们得到以下结果: , 因此, 是一个分形时间序列的分形维数不是整数,超过时间序列的拓扑维数)。此外, 是持续的;即时间序列trend-resistant ( )。这样一个时间序列长记忆,倾向于跟随趋势(38]。

2显示PDF的增量(回报) 时间序列和PDF的正态分布。

经验概率之外的正常间隔的PDF 这意味着沉重的尾巴存在。达的k方测试(39)也证实了可能拒绝零假设的正常分布统计时在0.01的显著性水平 另一个沉重的尾巴存在的证据提出了遵循幂律分布的概率分布。图3显示PDF和互补累积分布函数(CCDF)。两个函数近似的线性函数。

让我们确定噪声的类型(参数 在PSD ) 计算 ,我们使用了去趋势波动分析方法(DFA) [40]。计算后,我们获得了标度指数 和PSD参数 价值获得对应,而闪烁噪声( )比任何其他类型的噪音。的值 获得的DFA方法伴随着值获得通过时间序列的近似PSD线性函数。运用快速傅里叶变换获得的PSD 如图4在对数刻度。一个线性适应产量

自相关函数( )对于一个 时间序列描述幂函数下降(3)指数 因此,长期以来,这个函数内存。

5礼物 在对数尺度及其线性近似。一个线性适合使

4所示。微博社交网络作为一个非线性确定性动力系统

4.1。主要的假设模型

社交网络是一个宏观的系统。这样一个系统的用户数量 对Twitter这种假设是合理的,因为,根据现有的估计, ~ 108。在提出的模型中,所有可能的自由度,我们选择和考虑几个宏观自由度(或动态阶段变量对应于水动力模式在物理)。这样可以减少的协同作用的从属原则。这一原则,在进化过程中,水动力模式抑制微观行为的自由度和完全确定系统的自组织。结果,系统的合作行为是由若干水动力变量代表水动力模式的振幅。这样我们不需要无限的微观自由度和不需要彻底研究微观社交网络的用户之间的交互。

一个社交网络是自治动力系统建模为一个点。这个模型被选中,是因为可以比较结果与Twitter提供的经验数据时间序列。每个用户的社交网络可以在两个可能状态之一:要么被动( - - - - - -州)或活动( - - - - - -状态)。Twitter用户在 - - - - - -国家可以发送microposts其他网络用户。在这种状态下,网络用户有足够的信息发送microposts。如果一个用户 - - - - - -状态(用户没有足够的信息),他或她不能发送microposts。

一个微博的社交网络是一个开放的非平衡系统。一个社交网络能够与环境信息交换。来流外部(系统)信息进入系统从不同的来源,例如,从其他大众媒体。这个流源网络与信息和创建一个逆人口国家的网络用户: ,在哪里 网络用户的数量吗 - - - - - -状态, 网络用户的数量吗 - - - - - -状态。

Twitter用户的分布可以由玻耳兹曼分布具有良好的准确性: 在哪里 用户的信息量在吗 - - - - - -国家拥有, 用户的信息量在吗 - - - - - -国家拥有, 是一个参数描述的平均强度随机网络用户之间的交互。一个简单的分析4)允许我们定义两个宏观网络状态:稳定状态和非平衡状态。如果 ,然后 在这种情况下,网络处于稳定状态。如果 ,然后 在这种情况下,网络处于非平衡状态。因为社交网络是美联储不断的信息,它是不断地处于非平衡状态,创建microposts雪崩。由于常数提要的信息,几乎从不可以达到稳定状态。是非常重要的,混沌状态的存在,是一个开放的非平衡系统的基本属性。

4.2。阶段变量和它们之间的关系

让我们定义阶段变量的动力系统。这些变量将被用于Twitter作为一个开放的非平衡系统模型。这些变量如下: 的偏差microposts的数量( )从相应的平衡值( 是在稳态microposts)的数量; 是聚合的偏差intrasystem信息( )的网络用户拥有相应的平衡值( 是聚合intrasystem信息网络用户拥有Twitter是在稳定状态); 此刻的时间是瞬时的区别吗 数字之间的战略导向的社交网络用户(用户在一个特定的策略) - - - - - - - - - - - -州。如果 之间的区别是用户的总数吗 - - - - - - - - - - - -州,然后 面向用户行为随机(随机的用户)。

根据(41),业务用户和垃圾邮件用户可以被视为战略面向用户。

业务用户在Twitter上关注营销和商业议程。概要描述强烈描绘他们的动机,可以观察到类似的行为在他们的微博行为。垃圾邮件发送者主要是发布恶意推高利率。自动计算机程序(机器人)主要运行在垃圾邮件配置文件和随机跟踪用户,期待一些用户跟随。

面向个人用户和专业用户可以被认为是随机的用户。个人用户是普通家庭用户创建他们的Twitter为了好玩,学习,新闻,等。这些用户都强烈提倡任何类型的业务或产品,也没有配置文件隶属于任何组织。一般来说,他们有个人概要文件和显示低温和的社会互动行为。专业家庭用户和专业用户意图在Twitter上。他们分享关于特定主题的有用信息,包括在健康相关讨论他们感兴趣的领域和专业知识。

让我们确定动态变量及其之间的关系的改变。

的速度偏差的数量确定microposts放松的一个社交网络到一个稳定状态( )和偏差的变化聚合intrasystem信息从平衡值( ): 这个词 在情商。5)是由于放松的社交网络作为一个非平衡系统。根据勒夏特列原理,系统偏离稳态时,产生“力量”,尝试恢复系统回到稳定状态。如下从情商。5),没有这个词 方程采用以下形式: 情商的解决方案。6)是由函数 因此, (《社交网络》倾向于稳定状态)。在情商。6), 是时候放松的稳定状态。

这个词 在情商。5)可以很容易地解释道:随着聚合intrasystem信息偏差的增加,速度偏差的microposts数量的增加。

的速度聚合intrasystem信息平衡的偏差值是由放松的一个社交网络对稳定状态( )和产品 : 这个词 在情商。7)也用勒夏特列原理来解释,在情商。6)。这个词 出现,因为每个用户的信息量的一个社交网络获得流microposts偏差的数量成正比microposts,取决于用户在社交网络的状态。换句话说,聚合的平均贡献偏差intrasystem信息产品的偏差成正比microposts数量和用户的数量之间的差异 - - - - - - - - - - - -州。

最后,第三个方程描述了战略上的人口变化反演面向用户,可以编写如下: 在哪里 相应的弛豫时间, 是战略面向用户的初始数量(这个值反映了社交网络的强度信息)。换句话说, 之间的区别是战略导向的一个社交网络用户的数量是 - - - - - - - - - - - -当时的状态 这个词 反映了一个流的有效功率microposts适用于创建聚合intrasystem信息在一个社交网络。这种力量可以积极或消极的。

因此,一个微博的社交网络的发展可以被描述为著名的洛伦茨方程组:

4.3。非线性动力系统的协同作用的解释

系统的自洽方程(9)是一个众所周知的方法来描述一个自我组织的系统。洛伦茨协同作用的模型第一次被开发成一个水动力方程的简化描述大气中的瑞利热对流;现在是一个经典的混沌动力学模型。洛伦兹系统进一步的研究提出了一系列出版物证明系统提供一个适当的动能的粒子的合作行为在任何宏观动力系统潜在订单的实现是可能的。流程在这种非平衡自组织复杂系统状态导致的选择少量的参数变量的完整描述系统;所有其它自由度调整对应于这些选择参数。中使用的术语协同理论后,这些参数的顺序参数( ),共轭字段( ),和控制参数( )。根据Ruelle-Takens定理,我们可以观察到一个非凡的自我组织和奇怪吸引子如果选择自由度的数量是三个或更多。

方程组(9) 是一个系数,正的常数 , 在一个社交网络的反馈措施。功能 , , 描述自主放松microposts数量的偏差,偏差的聚合信息,反演的人口战略导向的一个社交网络用户的固定值 , , 与放松时间 , ,

情商。10)考虑,在自治政权,上述参数的变化一个社交网络是耗散。此外,勒夏特列原理是非常重要的:自增长的控制参数 是自组织的原因,值吗 必须改变,以防止的增长 形式上,这一事实可以解释为秩序之间的反馈参数的存在 和共轭场 最后,有序参数之间的正反馈 和控制参数 导致共轭的增长领域 是非常重要的,因为这个反馈是自组织的原因。

4.4。功能和限制的确定性模型解释社会网络的复杂性

首先,我们必须注意,情商。9)在1963年首次通过爱德华·洛伦兹由于某些简化的液体从下面层加热的问题。在这个问题上情商。9)获得的流速和温度初始水动力系统提出了二维傅里叶级数截断和布辛涅斯克近似。一层的对流问题,洛伦茨方程作为一个粗略的,不是很准确的近似。只有足够的常规模式,即均匀旋转对流细胞观察。混乱的政权典型的情商。9)不描述湍流对流。然而,洛伦茨方程成为一个合适的模型来描述各种性质的系统和流程:在一个封闭的循环对流,单模激光,水轮旋转,金融市场,交通流,耗散与非线性激振荡器,和一些其他人。

有多可靠的模型(9)的描述一个微博的社交网络的进化?我们将考虑模型“可靠的”如果有良好的相关性理论预测和实际观察到的关键系统的复杂性的迹象。的结果比较关键的迹象的复杂性的理论基础偏差microposts的数量 和相应的经验数据列在下面。

如图所示(见Eq。早些时候(4)),网络的稳定状态几乎是不可能实现由于常数信息提要。从理论上讲,一个动力系统(9)有一个渐近稳定零驻点的节点 在这种情况下, , 作为 然而,在实践中,一个微博网络作为一个开放的非平衡系统总是有一个非零差异战略面向用户的数量 - - - - - -国家和 - - - - - -当时的状态 因此,尽管理论可行性的一个社交网络的稳定状态,这种状态在实践中无法实现。当战略面向用户的数字之间的区别的 - - - - - -国家和 - - - - - -当时的状态 达到某个临界值 ,情商。9)进入一个混乱的政权,会出现一个奇怪吸引子。一个过渡状态对应 在实践中无法实现。

我们将考虑 作为长时间常数理论和比较不同的措施( ,系统的解决方案(9在混乱的政权)和经验数据 社交网络的模型的形式(9)解释了观测到的分形和混沌性质 : 然而,模型(9)无法解释观察到的一个社交网络的复杂性的关键标志。理论 构成时间序列没有内存( 指数下降);PSD是常数(白噪声, );PDF是综合“截尾”(见图6)。

密实度和多模的分布是由三个静止点的存在的动力系统(9)。

因此,洛伦兹系统(9)并不是一个可靠的模型描述的微博社交网络的进化是一个复杂的系统。

5。微博社交网络作为一个非线性随机动力系统

如图所示,非线性动态模型(9)解释了实证呈不规则碎片形和混乱的本质 以及系统的耗散特性。另一方面,情商。9)无法解释一些其他现象中发现的经验数据,首先,关键的一个社交网络的复杂性的迹象:PDF的幂律, - - - - - -噪音,和长期记忆。让我们考虑不同的方法改善(泛化)情商。9)为了充分描述一个微博的社会网络。

自相关维度和经验时间序列嵌入维数( , )超过相应的理论值( , ),提高情商的方法之一。9)是增加数量的阶段变量的动态系统。另一种方法来提高情商。9)是考虑订单的有条理的行为参数,结合领域,和控制参数考虑的噪声为每个参数。不同的概括的情商。9)已经提出并研究了亚历山大Olemsky和合作者42- - - - - -44尤其是],其应用程序的上下文中研究连续的自组织,金融市场和社会经济结构的演变,活性粒子的合作行为和自组织临界性。

考虑随机条款和订单的fractionality参数,情商。9)以下形式: 在情商。10), 为每个阶段噪声强度变量; 是白噪声,在哪里 , ; 随机动态系统(RDS) (10)是一个泛化的确定性动力系统(9)随机源的添加,反馈是削弱,订单参数是放松。订单的替代参数 通过一个较小的值 ( )意味着订购过程中影响系统的有条理的行为在较小程度上,而不是在理想的情况下

为方便分析情商。10我们将把它变成一个无量纲的形式。那么时间 ,偏差的数量microposts ( ),偏差的聚合intrasystem信息( ),战略面向用户的数字之间的差异在不同的国家( ),和相应的噪声强度( )将比例如下: 现在情商。10)可以写如下: 让我们分析RDS (12)在绝热近似的特征松弛时间的microposts网络大大超过相应的松弛时间聚合intrasystem信息和战略面向用户的数量: 这意味着聚合intrasystem信息 和战略面向用户的数量 根据偏差的变化microposts的数量( )。 ,从属原则允许我们集 在情商。12),即。,to disregard the fluctuations in

微博的社交网络功能作为一个开放的非平衡系统,绝热近似意味着当外部信息提要趋向于零,microposts流慢慢减少,同时聚合intrasystem信息和战略导向的用户活动状态的数量减少。

绝热近似是一个三维的变换RDS的必要条件与加性噪声(12带乘性噪声)一维RDS的下列形式: 情商的条款。13)对应于漂移和扩散(混沌源强度)有以下形式: 朗之万方程(13)有无穷组随机的解决方案 它们的概率分布( )由福克尔普朗克方程给出: 在静止的情况下( )分布 是由以下关系: 因此,固定偏差的概率分布密度的数量microposts从相应的均衡价值有以下形式: 在哪里 是归一化常数。

在我们得出任何结论分布(18),让我们直接关注一个重要事实,区分理论与实践。分布的系统和流程不管他们的自然不可能无限的期望值和方差。因此,幂律pdf文档 ( 被选为目的的分析表达式(18)近似和无效 PDF对应的指数减少中间渐近,在实践中而不是沉重的反面我们应该半重型反面(见分布在图2): 的尺度函数 大约是恒定的 并迅速降低时 这里的“沉重的尾巴”转向中间范围 值。因此,无量纲偏差microposts的数量 比例为 作为一个扩展变量 在(19)。由于积分情商。16)定期在 ,有一个幂律形式获得的PDF。

PDF的幂律的偏差microposts的数量 ,相当于 大时代,获得和合理的分析。然而,我们不能获得对PSD解析表达式, ,或者和分形维度的相关性。因此,我们提出以下数值计算的结果为一个家庭RDS的实现(13) 基于算法的研究和使用。

让我们确定噪声的典型的类型 我们使用了DFA方法来计算 我们获得了标度指数 获得的价值 对应,而闪烁噪声( )比任何其他类型的噪音。的值 获得的DFA方法接近的值通过拟合PSD线性函数时间序列。应用快速傅里叶变换获得的PSD 呈现在图7在对数刻度。一个线性适合使

的时间序列 减少遵循幂律(3)指数 因此内存的两倍。图8显示 在对数刻度。

估计相关维度( )和嵌入维数( ),我们使用了Grassberger-Procaccia算法。我们获得的 因此,导致这一系列的过程 不是随机的;它是由有限数量的关键控制参数。该系列 是混乱的而不是随机。

利用R / S分析的结果我们确定的赫斯特指数( )。计算时间序列的分形维数( )我们使用中描述的算法(20.]。我们获得的 , 因此, 是一个持续的分形时间序列。这种时间序列长期记忆和倾向于遵循趋势。

因此,广义洛伦兹系统(12)充分模型微博社交网络的进化是一个复杂的系统。的特点 - - - - - -RDS的实现(12)是定量接近相应的经验时间序列的特征。

6。结果与讨论

为方便进一步讨论,表1礼物的结果计算复杂系统的主要特征和属性(即。,系统往往意想不到的和/或不同寻常的事件)。

microposts的经验时间序列复杂性的所有关键属性:一个幂律的PDF文件,声音接近闪烁噪声,与长记忆时间相关性,尺度不变性microposts的时间序列。破裂的时间序列的存在microposts(见图1)让我们得出这样的结论:微博网络是一个复杂的系统,它是远离平衡。时间序列microposts具有尺度不变性;即。,it is a fractal time series. Such time series, in particular, are characterized by power-law PDFs caused by an avalanche-like increase of the number of microposts (see bursts in Figure1)在一个新任命的“连锁反应”。数量的增加遗憾microposts是可能的如果用户坐标他的行为与他的追随者,追随者的追随者,等等。这定义了一个灾难性的行为之间的联系和微博网络的完整性。

对微博网络的演变的描述,非线性动力系统模型(9)是一个粗略的,不是很准确的近似。首先,模型没有预测的发生灾难性的值在一个时间序列的数量microposts这将意味着微博网络的复杂性,或者存在长记忆时间序列的趋势跟随趋势。尽管这一缺陷,情商。9研究社交网络的)允许一个远离平衡(见分布(4)和评论上),这也解释了动态混沌时间序列中存在的以及他们的呈不规则碎片形。

非线性随机动力系统(10)是一个综合的模型(9),占外部随机源和订单的fractionality参数(订单的反馈和放松的弱化参数)。该模型充分描述了微博系统的演变。

量化模型的特点10在绝热近似接近相应的经验时间序列的特征microposts(见表1)。绝热近似让我们减少了一个三维随机绝热系统加性噪声(10)一维随机动力系统与指数乘法噪声(13)。

7所示。结论

本研究的主要结果是通过分析单个时间序列的microposts值然而构成具有代表性。类似的实证结果的分析提出了微博网络的时间序列(24- - - - - -29日]。我们不能认为时间序列由美国或其他研究者研究的样本是有代表性的,这将是必不可少的一个泛化的结果到整个普通人群。在这种方法的框架,有必要分析microposts所有可用的数据和用户收集自微博网络。然而,这一步可以避免,如果我们认为社交网络的尺度不变性。这让我们浮想联翩,插入网络分析的结果在任何大型或小型。因此,样品的呈不规则碎片形预定的整个网络的呈不规则碎片形。尺度不变性的理由推特提出了(45]。因此,结论对微博网络的复杂性范式的框架的复杂性是有道理的。

下面的事实的微博网络是复杂的?我们可以给这个问题的两个答案。第一个是与二阶相变的可能性在微博网络;第二个担忧microposts的时间序列的分析和预测。让我们详细讨论每一个答案。

它已经建立了时间序列的microposts具有远程时间相关性。这是真的为经验时间序列和随机动力系统的实现(13)。上面讨论的时间序列的长程相关性和其他特征的典型关键二阶相变等现象。

为简单起见,让我们考虑相变动力学的微博网络的框架模型(9)考虑到提要的特性转化(战略面向用户的初始数量的差异在主动和被动状态 )。在这种情况下,它可以显示(详细证明是超出了本文的范围), 增加和超过某一临界值时,显示微博网络的发展战略选择的数量相对较小的战略面向用户。上述遗憾microposts发生的数量增加。的临界值 是由几何平均数的和战略面向用户的数量的关键值。形式主义导致上述结果提出了(42]。

本文获得的结果从理论和实践的观点是有价值的。首先,他们表明,该系统在考虑(在本例中microposts)是决定性的尽管噪声组件(即。他们不是随机)。这允许我们使用动力系统的理论和分析的时间序列microposts以不同的方式,使用维度理论和动态系统理论。其次,获得的不变量的值可以帮助解决这个问题的预测。例如,嵌入维度显示了多少的时间序列确定下一项,而关联熵和最大李雅普诺夫指数允许我们估计的时间系统的可预测性。

总之,我们要提到存在许多有趣的问题没有研究,如在微博网络的自组织临界现象分析的基础上的非线性随机动态系统(10)。这将是我们未来研究的主题。

数据可用性

保湿获得的数据列表包含3183202标识符的tweet的12集标识符列表由哈佛大学提供。这个列表是关于2016年美国总统选举:«2016年美国总统大选Tweet id»(2016)。列表是由李曼荣贾斯汀,劳拉Wrubel,丹尼尔Kerchner。使用的作者列表SocialFeed服务收集数据在第一次辩论。微博在随后的争论并不包括在样本。获得的样本有100万个空条目。这是因为一些用户的标识符在初始列表后删除了他们的微博或私人。由此产生的样本具有以下特点:micropost可以对应一个或几个标签标签(#辩论,#辩论,# debatenight, # debate2016, # debates2016);micropost的存在的作者列表中的一个或多个用户的追随者(CPD (@debates),希拉里•克林顿(Hillary Clinton) (@HillaryClinton)и唐纳德·j·特朗普(@realDonaldTrump));2290855 microposts;934656用户; 76,458 time intervals; one-second increments. After the list of tweets was received, the information was extracted in id:original_id format. Here id is a unique identifier of the user who made the retweet; the original_id is a unique identifier of the user who made the initial tweet. If a tweet is not a retweet, id and original_id coincide.

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项工作是支持的俄罗斯基础研究基金会(批准16-07-01027)。