2.1。有效信息量化网络的依赖性
这项工作扩大到网络之前的研究在使用有效的信息来测量信息的机制或状态之间的因果关系的系统。最初,<我nline-formula>
E米米l:mi>
我米米l:mi>
介绍了捕获两个子集之间的因果影响神经元的一步的计算综合信息在大脑中(
13 ]。后,系统的版本<我nline-formula>
E米米l:mi>
我米米l:mi>
显示捕捉基本因果属性在布尔逻辑门的网络,特别是他们的决定论和简并度
11 ]。
我们现在从第一原理的推导<我nline-formula>
E米米l:mi>
我米米l:mi>
为网络相当于这个系统范围的定义(SM V B),最初是基于干预系统状态。例如,如果一个系统在一个特定的状态,<我talic>
一个我talic>,总是转换状态<我talic>
B我talic>之间的因果关系<我talic>
一个我talic>和<我talic>
B我talic>可以表示为一个node-link图中两个节点-<我talic>
一个我talic>和<我talic>
B我talic>——通过一个有向箭头,表示<我talic>
B我talic>取决于<我talic>
一个我talic>。这可能是一对节点在一个“因果图”(通常表示为一个有向无环图,或一个<我talic>
DAG我talic>)如在使用
14 ,
15 )来表示干预和因果关系。在这种情况下,信息之间的因果关系<我talic>
一个我talic>和<我talic>
B我talic>可以通过干预评估随机<我talic>
一个我talic>
做米米l:mtext>
一个米米l:mi>
=米米l:mo>
H米米l:mi>
马克斯米米l:mtext>
和测量的影响<我talic>
B我talic>。的<我nline-formula>
E米米l:mi>
我米米l:mi>
会之间的互信息<我talic>
一个我talic>和<我talic>
B我talic>在这种随机化:<我nline-formula>
我米米l:mi>
做米米l:mtext>
一个米米l:mi>
=米米l:mo>
H米米l:mi>
马克斯米米l:mtext>
,米米l:mo>
B米米l:mi>
(
16 ]。
这个框架扩展到网络,我们放松这个干预需求通过假设中的元素<我nline-formula>
W米米l:mi>
我米米l:mi>
出米米l:mtext>
总和为1。在这种情况下,一个“干预”可以理解为网络上随机沃克。例如,如果网络代表一个DAG或马尔可夫链,然后把一个随机沃克在一个节点上<我nline-formula>
v米米l:mi>
我米米l:mi>
就相当于<我nline-formula>
做米米l:mtext>
v米米l:mi>
我米米l:mi>
。熵的转换随机步行者和分布式定义了这些转换<我nline-formula>
E米米l:mi>
我米米l:mi>
的网络。在这个广义配方,只有在网络节点和边实际上代表动力学,交互,或联轴器<我nline-formula>
E米米l:mi>
我米米l:mi>
表示因果关系的信息。边缘的情况下代表相关性,或者在什么节点或边缘代表是未定义的,<我nline-formula>
E米米l:mi>
我米米l:mi>
只是一个结构属性中包含的信息的行为假设的随机行走(然而,这种情况是没有不同于其他分析方法,依靠随机行走)。
在这里我们描述这个广义结构<我nline-formula>
E米米l:mi>
我米米l:mi>
财产的行为共同的网络模型,要求对之间的关系网络的基本问题<我nline-formula>
E米米l:mi>
我米米l:mi>
和它的大小、密度和结构。这些调查允许详尽的分类和量化的信息包含在真实网络的连通性。它是直观的<我nline-formula>
E米米l:mi>
我米米l:mi>
随着网络的发展网络将增加的大小。一般来说,添加更多的节点应该增加熵,进而增加的信息量。然而,在随机性而不是结构的情况下,<我nline-formula>
E米米l:mi>
我米米l:mi>
应该反映这随机性。我们发现这确实是如此。
图
1(一) 显示之间的关系网络<我nline-formula>
E米米l:mi>
我米米l:mi>
及其大小的几个参数化下Erdős-Renyi (ER)随机图(
17 ,
18 ]。作为一个ER网络规模的增加(同时保持常数将连接任意两个节点的概率,<我nline-formula>
p米米l:mi>
),其<我nline-formula>
E米米l:mi>
我米米l:mi>
收敛于一个值<我nline-formula>
−米米l:mo>
日志米米l:mi>
2米米l:mn>
p米米l:mi>
。也就是说,在随机网络,<我nline-formula>
E米米l:mi>
我米米l:mi>
是完全由任意两个节点连接的概率,一个关键的发现表明,在某个点之后,一个随机网络结构不包含更多的信息随着规模的增加。这种转变发生在ER网络约<我nline-formula>
k米米l:mi>
=米米l:mo>
日志米米l:mi>
2米米l:mn>
N米米l:mi>
,这也是我们可以期待所有节点的点在一个巨大的组件(
1 ]。这一发现表明,网络连接必须非随机增加的信息量在节点之间的关系(参见SM V C 1推导)。注意,如果一个网络密度最大限度(即。一个完全连接网络,self-loops),<我nline-formula>
E米米l:mi>
我米米l:mi>
=米米l:mo>
0.0米米l:mn>
。然而,我们希望这种密集的低收入<我nline-formula>
E米米l:mi>
我米米l:mi>
结构是罕见的,因为在自然界发现的网络结构和社会往往是稀疏的
19 ]。
图1
有效的信息取决于网络结构。(一)Erdős-Renyi (ER)网络,我们看到网络的<我nline-formula>
E米米l:mi>
我米米l:mi>
水平在<我nline-formula>
E米米l:mi>
我米米l:mi>
=米米l:mo>
−米米l:mo>
日志米米l:mi>
2米米l:mn>
p米米l:mi>
作为<我nline-formula>
N米米l:mi>
,网络的规模,增加对数尺度(如图所示)。(b)<我nline-formula>
E米米l:mi>
我米米l:mi>
网络下的优先连接机制,取决于优惠附件指数,<我nline-formula>
α米米l:mi>
。在这个网络经济增长模式下,新节点添加他们<我nline-formula>
米米米l:mi>
边(在这里,<我nline-formula>
米米米l:mi>
=米米l:mo>
1米米l:mn>
)对现有网络中节点的概率成正比<我nline-formula>
k米米l:mi>
α米米l:mi>
。仅次线性优惠附件<我nline-formula>
α米米l:mi>
<米米l:mo>
1。0米米l:mn>
允许的连续增长<我nline-formula>
E米米l:mi>
我米米l:mi>
随着网络的发展。丝带代表标准差的数据100年之后的模拟。
(一)
(b)
我们报告的另一个关键网络的连通性和其之间的关系<我nline-formula>
E米米l:mi>
我米米l:mi>
在图
1 (b) 。我们再一次把<我nline-formula>
E米米l:mi>
我米米l:mi>
网络的规模,专注于网络下不同的优惠附件模型的参数化
20. ,
21 ]。优惠附件增长模式下,一个新节点添加到网络在每个时间步,做贡献<我nline-formula>
米米米l:mi>
新的边缘网络;这些<我nline-formula>
米米米l:mi>
已经在网络边缘连接节点,<我nline-formula>
v米米l:mi>
j米米l:mi>
的概率成正比<我nline-formula>
k米米l:mi>
j米米l:mi>
α米米l:mi>
。在这里,<我nline-formula>
k米米l:mi>
j米米l:mi>
节点的程度吗<我nline-formula>
v米米l:mi>
j米米l:mi>
和<我nline-formula>
α米米l:mi>
曲调优惠附件的数量。的值<我nline-formula>
α米米l:mi>
=米米l:mo>
0.0米米l:mn>
对应于每个节点有一个平等的机会(即接收一个新节点的链接。,没有优惠附件)。经典的Barabasi-Albert网络对应线性优惠附件,<我nline-formula>
α米米l:mi>
=米米l:mo>
1。0米米l:mn>
(
21 ]。在字行上面的优惠附件,<我nline-formula>
α米米l:mi>
>米米l:mo>
1。0米米l:mn>
创建网络越来越少<我nline-formula>
E米米l:mi>
我米米l:mi>
,最终像星一样结构推导(见SM V C 2)。如图
1 (b) ,只有在次线性优惠附件的情况下,<我nline-formula>
α米米l:mi>
<米米l:mo>
1。0米米l:mn>
网络的<我nline-formula>
E米米l:mi>
我米米l:mi>
继续增加它的大小。当<我nline-formula>
α米米l:mi>
=米米l:mo>
0.0米米l:mn>
——形成一个随机树中的网络的<我nline-formula>
E米米l:mi>
我米米l:mi>
增加对数随着规模的增加。
最大可能的<我nline-formula>
E米米l:mi>
我米米l:mi>
网络中的<我nline-formula>
N米米l:mi>
节点<我nline-formula>
日志米米l:mi>
2米米l:mn>
N米米l:mi>
。中可以看到这样的一个有向环网络,每个节点有一个传入链接和一个外向链接,每个重量为1.0,所以每个节点有一个节点唯一连接到它。在这样一个网络中,每个节点的贡献为零的不确定性,因为<我nline-formula>
H米米l:mi>
W米米l:mi>
我米米l:mi>
出米米l:mtext>
=米米l:mo>
0.0米米l:mn>
,<我nline-formula>
H米米l:mi>
W米米l:mi>
我米米l:mi>
o米米l:mi>
u米米l:mi>
t米米l:mi>
=米米l:mo>
日志米米l:mi>
2米米l:mn>
N米米l:mi>
,因此,它的<我nline-formula>
E米米l:mi>
我米米l:mi>
总是<我nline-formula>
日志米米l:mi>
2米米l:mn>
N米米l:mi>
。一般来说,<我nline-formula>
E米米l:mi>
我米米l:mi>
无向的晶格是固定的完全由它的大小和环晶格的维数(例如,<我nline-formula>
d米米l:mi>
=米米l:mo>
1米米l:mn>
是一个无向的戒指,<我nline-formula>
d米米l:mi>
=米米l:mo>
2米米l:mn>
是一个金牛座等等。
22 ),所以这样的晶格<我nline-formula>
E米米l:mi>
我米米l:mi>
=米米l:mo>
日志米米l:mi>
2米米l:mn>
N米米l:mi>
−米米l:mo>
日志米米l:mi>
2米米l:mn>
2米米l:mn>
d米米l:mi>
推导(见SM V C 2)。
从照片上可以看出<我nline-formula>
E米米l:mi>
我米米l:mi>
网络的连通性和增长密不可分(甚至网络图案,如SM V D所示),因此网络科学的基础。有固定数量的随机网络<我nline-formula>
E米米l:mi>
我米米l:mi>
,scale-freeness<我nline-formula>
α米米l:mi>
=米米l:mo>
1。0米米l:mn>
代表了开往的发展至关重要<我nline-formula>
E米米l:mi>
我米米l:mi>
。一般来说,密集的网络和星状网络更少<我nline-formula>
E米米l:mi>
我米米l:mi>
。下一个部分将探索如何<我nline-formula>
E米米l:mi>
我米米l:mi>
解释这些关联的组件。
年代ec>
2.2。决定论和简并度
决定论我talic>和<我talic>
简并度我talic>是两个基本的组成部分<我nline-formula>
E米米l:mi>
我米米l:mi>
(
11 ]。他们都是基于网络的连接(见图
2(一个) 视觉的解释),特别是在网络的重叠程度。决定论和退化是来自输出的不确定性和不确定性在这些输出是如何分布,分别为:
(2)米米l:mtext>
决定论米米l:mtext>
=米米l:mo>
日志米米l:mi>
2米米l:mn>
N米米l:mi>
−米米l:mo>
H米米l:mi>
W米米l:mi>
我米米l:mi>
出米米l:mtext>
,米米l:mo>
简并度米米l:mtext>
=米米l:mo>
日志米米l:mi>
2米米l:mn>
N米米l:mi>
−米米l:mo>
H米米l:mi>
W米米l:mi>
我米米l:mi>
出米米l:mtext>
。米米l:mo>
图2
比较决定论和简并度。(一)左栏:三个例子票数向量,<我nline-formula>
W米米l:mi>
我米米l:mi>
出米米l:mtext>
,一个给定的节点,<我nline-formula>
v米米l:mi>
我米米l:mi>
。最大限度确定的向量(左上角,<我nline-formula>
W米米l:mi>
一个米米l:mi>
出米米l:mtext>
对应节点<我nline-formula>
一个米米l:mi>
插图中网络主题)是当一个随机沃克<我nline-formula>
v米米l:mi>
我米米l:mi>
转换到一个邻国概率为1.0,而非决定论时发生<我nline-formula>
v米米l:mi>
我米米l:mi>
有一个统一的访问网络中的任何节点的概率下一个时间步。右:重量向量到给定的三个例子<我nline-formula>
v米米l:mi>
j米米l:mi>
。最大限度地退化向量,<我nline-formula>
W米米l:mi>
我米米l:mi>
出米米l:mtext>
(右上角,以嵌入网络主题),是每一个即将离任的优势在网络连接到一个节点,而最小的退化发生在每个值<我nline-formula>
W米米l:mi>
我米米l:mi>
出米米l:mtext>
是统一<我nline-formula>
1米米l:mn>
/米米l:mo>
N米米l:mi>
。(b)的决定论和简并通过比较规范的网络结构,我们发现大量的异构性在不同的网络模型的决定论和堕落之间的比率。简并度高的特点是星型拓扑(如星形网络的情况下。网络高决定论特点是时间平均路径长度,如环晶格的情况下。
(一)
(b)
在最大限度确定的网络中所有节点只有一个输出,<我nline-formula>
w米米l:mi>
我米米l:mi>
j米米l:mi>
=米米l:mo>
1。0米米l:mn>
决定论是<我nline-formula>
日志米米l:mi>
2米米l:mn>
N米米l:mi>
因为<我nline-formula>
H米米l:mi>
W米米l:mi>
我米米l:mi>
出米米l:mtext>
=米米l:mo>
0.0米米l:mn>
。从概念上讲,这意味着一个随机沃克将确定性从任何节点。简并度是连接丢失的信息量通过重叠在输入重量(例如,如果多个节点输出相同的节点)。完全非简并的系统中所有节点有相同输入重量、简并度是零<我nline-formula>
H米米l:mi>
W米米l:mi>
我米米l:mi>
出米米l:mtext>
=米米l:mo>
日志米米l:mi>
2米米l:mn>
N米米l:mi>
。在一起,决定论和简并可用于定义<我nline-formula>
E米米l:mi>
我米米l:mi>
:
(3)米米l:mtext>
E米米l:mi>
我米米l:mi>
=米米l:mo>
决定论米米l:mtext>
−米米l:mo>
简并度米米l:mtext>
这两个量提供清楚解释为什么不同的网络<我nline-formula>
E米米l:mi>
我米米l:mi>
他们做的事。例如,随着Erdős-Renyi随机网络规模的增加,其简并趋于0,这意味着<我nline-formula>
E米米l:mi>
我米米l:mi>
随机网络驱动的只有网络的决定论,这是反过来的负对数连接的概率,<我talic>
p我talic>。同样,在<我talic>
d我talic>维环晶格网络、简并度项永远是零,这意味着<我nline-formula>
E米米l:mi>
我米米l:mi>
环的晶格结构也降低了决定论的结构。环网络平均度<我nline-formula>
k米米l:mi>
将有一个更高的<我nline-formula>
E米米l:mi>
我米米l:mi>
比ER网络具有相同的平均程度,因为环网络将有一个更高的确定性价值。对于明星网络,简并度项单独支配的衰变<我nline-formula>
E米米l:mi>
我米米l:mi>
这样hub-and-spoke-like结构迅速成为可借鉴性的因果关系(见SM V C推导关于这些情况下)。一般而言,这意味着可以以规范化网络决定论比简并度(见图
2 (b) )。
年代ec>
2.3。有效的信息在现实网络
到目前为止,我们已经是不可知论者网络下分析的起源。如前所述,测量<我nline-formula>
E米米l:mi>
我米米l:mi>
一个网络,一个可以创建<我nline-formula>
W米米l:mi>
我米米l:mi>
出米米l:mtext>
每个节点正常化的票数向量和1.0。不管什么节点代表之间的关系,反映出网络的决定论的大于目标节点(和更有针对性的网络链接拥有更高<我nline-formula>
E米米l:mi>
我米米l:mi>
),而简并捕获的目标节点的重叠。高<我nline-formula>
E米米l:mi>
我米米l:mi>
反映了更大的特异性的连接,而低<我nline-formula>
E米米l:mi>
我米米l:mi>
表明缺乏特异性(如图
2(一个) )。这概括我们的结果以多种类型的表示,尽管起源的归一化网络时应牢记解释的价值衡量。
自<我nline-formula>
E米米l:mi>
我米米l:mi>
网络将改变取决于网络的大小,我们使用的标准化形式<我nline-formula>
E米米l:mi>
我米米l:mi>
被称为<我talic>
有效性我talic>以比较<我nline-formula>
E米米l:mi>
我米米l:mi>
真正的网络。有效范围从0.0到1.0,被定义为
(4)米米l:mtext>
有效性米米l:mtext>
=米米l:mo>
E米米l:mi>
我米米l:mi>
日志米米l:mi>
2米米l:mn>
N米米l:mi>
。米米l:mo>
随着网络的决定论和简并增加他们的最小和最大可能值,分别0.0网络将趋势的有效性。不管其规模,网络中每个节点都有一个确定的输出到一个独特的目标有一个1.0的有效性。
在图
3 84年,我们检查的有效性数据对应不同的网络真实的系统。这些网络选择主要从Konect网络数据库(
23 ),因为它使用网络是公开的,范围从几十到成千上万的节点,通常有一个合理的解释是基于节点之间的相互作用,和他们是不同的,从社交网络、电力网络、代谢网络。我们定义感兴趣的四类:生物、社会、信息和技术。我们选择网络通过使用所有可用的网络(低于40000节点由于计算约束)在每个类别对应的域内Konect数据库,它是合适的,网络存储库(
24 ]。材料与方法部分中看到和SM表
二世 这个选择过程的完整描述。
图3
真实网络的有效信息。网络的有效性<我nline-formula>
E米米l:mi>
我米米l:mi>
归一化的<我nline-formula>
日志米米l:mi>
2米米l:mn>
N米米l:mi>
(
11 ),84个真实网络的Konect网络数据库(
23 ),分组域的起源。进一步观察的名称和域名的网络问题,看到SM V<我talic>
E我talic>网络在不同的类别有不同的效果<我talic>
t我talic>以及,意味着比较)。
低效率值对应于结构,要么高简并(在右列,图
2(一个) )或低决定论(在左栏,图
2(一个) )或两者的结合。我们测量在网络、生物网络平均效率值较低,而技术网络平均效率最高。这一发现将直观地与我们了解之间的关系<我nline-formula>
E米米l:mi>
我米米l:mi>
和网络结构,它还支持长期假设的角色冗余、简并度,噪声在生物系统
25 ,
26 ]。另一方面,像电网技术网络,自主系统,或航空公司网络平均与更高的效率值。一个能够解释这种差异是人造技术网络的效率往往创建稀疏的,非简并与更高的平均效率,网络中节点关系是更具体的目标。
也许这是令人惊讶的发现进化网络如此低效率。但是,正如我们将显示,低效率可以表明,有信息差异(大规模)系统中连接。即低效率能反映生物系统通常包含差异结构,我们证明在以下部分。
年代ec>
2.4。因果出现在复杂的网络
这个新的全球网络测量,<我nline-formula>
E米米l:mi>
我米米l:mi>
,提供了一种有原则的方式来回答一个重要问题:规模,抓住了一个复杂的系统的连通性最好?解决这个问题是很重要的,因为科学分析不同系统在不同时空尺度上的结构,通常更愿意进行干预,观察系统的水平远高于微尺度(
12 ]。这可能是因为在微尺度关系非常嘈杂的,因此不提供信息的,和粗粒度的可以减少噪音
11 ]。事实上,这种噪音最小化实际上是建立在克劳德·香农的噪声信道编码定理
10 ),在尺寸减少操作代码,可以使用更多的通道的能力(
16 ]。更高层次的因果关系往往对低层执行纠错关系,因此产生了额外的有效信息在这些更高的尺度。测量这种差异提供了一个原则性的方法决定何时更高尺度更丰富(出现)或更高尺度无关时,附带现象的,或有损(减少)。
将这些问题带给网络科学,我们现在可以问,表示会减少不确定性存在于网络?我们通过检查<我talic>
因果关系出现我talic>在尺寸上时,这是减少网络包含更多信息连接,高的形式<我nline-formula>
E米米l:mi>
我米米l:mi>
比原来的网络。注意,如前所述,<我nline-formula>
E米米l:mi>
我米米l:mi>
可以解释只作为一般的网络结构属性。因此,虽然我们仍将这一现象称为“因果”出现,因为它具有相同的数学形式化在布尔网络和马尔可夫链(以前的工作
11 ,
12 ,
16 ),在这里,我们专注于如何可以用来确定网络的信息更高尺度不管这些网络代表什么。
值得注意的是,这一现象可以通过重铸网络在高尺度测量和观察<我nline-formula>
E米米l:mi>
我米米l:mi>
变化,这一过程识别网络的高尺度是否添加信息,超越低尺度。
年代ec>
2.5。网络宏观尺度
首先,我们必须引入如何重塑网络,<我nline-formula>
G米米l:mi>
,在一个更高的规模。这是由一个新的网络,<我nline-formula>
G米米l:mi>
米米米l:mi>
。在<我nline-formula>
G米米l:mi>
米米米l:mi>
,micronode呈现在原始的一个节点<我nline-formula>
G米米l:mi>
,而一个macronode被定义为一个节点,<我nline-formula>
μ米米l:mi>
,代表了子图,<我nline-formula>
年代米米l:mi>
我米米l:mi>
,从最初的<我nline-formula>
G米米l:mi>
(更换网络内的子图)。从最初的网络一直在尺寸上减少节点分组在一起,<我nline-formula>
G米米l:mi>
米米米l:mi>
总是会有更少的节点比<我nline-formula>
G米米l:mi>
。
一个macronode<我nline-formula>
μ米米l:mi>
是由一些定义<我nline-formula>
W米米l:mi>
μ米米l:mi>
出米米l:mtext>
来源于各个节点的边的权值在它所代表的子图。能想到的一个macronode作为底层子图的行为的汇总统计,统计数据采用某种形式的一个节点。最终有许多代表子图的方法,即建立一个macronode,和某些方面比其他人更一致的捕获子图的行为,根据连通性。这里我们强调一般应该大规模的网络<我talic>
一致的我talic>与他们的潜在的微尺度的动力学。虽然这从未被评估网络或系统内一般来说,有了先前的研究向结构方程模型的宏观尺度是否符合所有可能的干预措施的效果(
27 ]。
这里,决定是否一个macronode总结其底层子图是一致的,我们形式化的一致性来衡量是否随机行人的行为完全相同<我nline-formula>
G米米l:mi>
和<我nline-formula>
G米米l:mi>
米米米l:mi>
。我们这样做是因为随机漫步常常用来表示动态网络(
9 ),因此,许多重要的分析和算法(PageRank来确定节点的中心(
28 社区发现[]或InfoMap
29日 )——基于随机漫步。
具体来说,我们定义的<我talic>
不一致我talic>宏观尺度的Kullback-Leibler散度(
30. )之间的预期分布随机行走<我nline-formula>
G米米l:mi>
vs。<我nline-formula>
G米米l:mi>
米米米l:mi>
,鉴于一些相同的初始分布。预期的分布<我nline-formula>
G米米l:mi>
在未来的某个时间,<我nline-formula>
t米米l:mi>
,是<我nline-formula>
P米米l:mi>
米米米l:mi>
t米米l:mi>
,而分布<我nline-formula>
G米米l:mi>
米米米l:mi>
在未来的某个时间<我nline-formula>
t米米l:mi>
是<我nline-formula>
P米米l:mi>
米米米l:mi>
t米米l:mi>
。比较两个,分布<我nline-formula>
P米米l:mi>
米米米l:mi>
t米米l:mi>
在宏观尺度求和是相同的节点<我nline-formula>
G米米l:mi>
米米米l:mi>
,导致分布<我nline-formula>
P米米l:mi>
米米米l:mi>
米米米l:mi>
t米米l:mi>
(微尺度考虑到宏观尺度)。我们可以定义宏观尺度不一致在一系列的步伐<我nline-formula>
T米米l:mi>
作为
(5)米米l:mtext>
不一致米米l:mtext>
=米米l:mo>
∑米米l:mo>
t米米l:mi>
=米米l:mo>
0米米l:mn>
T米米l:mi>
D米米l:mtext>
K米米l:mi>
l米米l:mi>
P米米l:mi>
米米米l:mi>
t米米l:mi>
P米米l:mi>
米米米l:mi>
米米米l:mi>
t米米l:mi>
。米米l:mo>
这种一致性测量地址的一个随机动态过程的微尺度拓扑将重现在尺寸上减少拓扑(这是如何应用在我们的分析中,见材料和方法)。
什么是一致的宏观尺度取决于子图的连通性,分为macronode,如图
4 。的<我nline-formula>
W米米l:mi>
μ米米l:mi>
出米米l:mtext>
可以构建基于集体<我nline-formula>
W米米l:mi>
出米米l:mtext>
子图(如图
4(一) )。例如,在某些情况下,可以通过使用其平均只粗粒度的子图<我nline-formula>
W米米l:mi>
出米米l:mtext>
随着<我nline-formula>
W米米l:mi>
μ米米l:mi>
出米米l:mtext>
的一些新的macronode<我nline-formula>
μ米米l:mi>
(如在图
4 (b) )。然而,它可能是子图依赖关系没有被这样一个粗粒度的。事实上,这类似于近期发现构造网络的数据时,常常需要通过高阶显式模型高阶依赖节点的动态随机漫步忠于原始数据(
31日 ]。因此,我们引入<我talic>
高阶macronodes我talic>(霍姆斯),利用类似的技术来不断将子图表示为单节点(
31日 ]。
图4
Macronodes。(一)最初的网络,<我nline-formula>
G米米l:mi>
连同它的邻接矩阵(左)。阴影椭圆表明子图<我nline-formula>
年代米米l:mi>
成员节点<我nline-formula>
v米米l:mi>
B米米l:mi>
和<我nline-formula>
v米米l:mi>
C米米l:mi>
将组合在一起,形成一个macronode,<我nline-formula>
μ米米l:mi>
。所有macronodes有些原始邻接矩阵的转换通过重铸它作为一个新的邻接矩阵(右)。这个重铸的方式取决于macronode的类型。(b) macronode的最简单形式是什么时候<我nline-formula>
W米米l:mi>
μ米米l:mi>
出米米l:mtext>
平均的吗<我nline-formula>
W米米l:mi>
我米米l:mi>
出米米l:mtext>
每个节点的子图。(c) macronode代表一些路径依赖性,如输入<我nline-formula>
一个米米l:mi>
。在平均来创建<我nline-formula>
W米米l:mi>
μ米米l:mi>
出米米l:mtext>
的大于节点<我nline-formula>
v米米l:mi>
B米米l:mi>
和<我nline-formula>
v米米l:mi>
C米米l:mi>
加权的输入来自哪里<我nline-formula>
v米米l:mi>
一个米米l:mi>
。(d) macronode表示通过网络子图的输出是静止的动力学。每个节点有关联<我nline-formula>
π米米l:mi>
我米米l:mi>
的概率<我nline-formula>
v米米l:mi>
我米米l:mi>
在网络的平稳分布。的<我nline-formula>
W米米l:mi>
μ米米l:mi>
出米米l:mtext>
的<我nline-formula>
μ米米l:mi>
π米米l:mi>
macronode是由权重<我nline-formula>
W米米l:mi>
我米米l:mi>
出米米l:mtext>
micronodes的子图<我nline-formula>
年代米米l:mi>
通过<我nline-formula>
π米米l:mi>
我米米l:mi>
/米米l:mo>
∑米米l:mo>
k米米l:mi>
∈米米l:mo>
年代米米l:mi>
π米米l:mi>
k米米l:mi>
。(e)与一个步伐macronode输入之间的延迟<我nline-formula>
μ米米l:mi>
j米米l:mi>
和它的输出<我nline-formula>
μ米米l:mi>
π米米l:mi>
使用相同的技术,每个构建的组件。然而,<我nline-formula>
μ米米l:mi>
j米米l:mi>
总是确定性输出<我nline-formula>
μ米米l:mi>
π米米l:mi>
。看到完整的SM V方程执政的创建<我nline-formula>
W米米l:mi>
μ米米l:mi>
出米米l:mtext>
每个不同的霍姆斯。
(一)
(b)
(c)
(d)
(e)
不同的子图连接性需要不同类型的霍姆斯一直代表他们。例如,霍姆斯可以基于输入macronode权重,采取的形式<我nline-formula>
μ米米l:mi>
j米米l:mi>
。在这些情况下,<我nline-formula>
W米米l:mi>
μ米米l:mi>
j米米l:mi>
出米米l:mtext>
是一个加权平均每个节点的<我nline-formula>
W米米l:mi>
出米米l:mtext>
在子图,重量是基于输入的重量子图中的每个节点(图
4 (c) )。另一种类型的力宏,通常导致macronodes一致时<我nline-formula>
W米米l:mi>
μ米米l:mi>
出米米l:mtext>
基于固定子图的输出到其他网络,我们代表哪一个<我nline-formula>
μ米米l:mi>
π米米l:mi>
(图
4 (d) )。这些类型的霍姆斯可能有轻微不一致给某些初始状态,但几乎总是完美的一致性的趋势随着网络稳态动力学方法(部分中概述
4 )。
子图与复杂的内部动力学可能需要一个更复杂的类型的HOM为了保持macronode的一致性。例如,在这种情况下,子图之间有一个延迟他们的输入和输出,这可以由一个组合表示<我nline-formula>
μ米米l:mi>
j米米l:mi>
和<我nline-formula>
μ米米l:mi>
π米米l:mi>
,结合时捕获延迟(图
4 (e) )。在这些情况下,macronode<我nline-formula>
μ米米l:mi>
由两部分组成,其中一个作为缓冲步伐。这意味着macronodes可以拥有记忆,即使由网络,在微尺度是无记忆的,事实上,这种类型的HOM持续捕获微尺度动力学有时是必要的。
我们提出这些类型的macronodes不是一个详尽的清单的所有可能的霍姆斯,而是如何构造高尺度的例子在网络子图表示为节点和有时也使用高阶相关性来确保这些节点是一致的。这种方法提供了一个完整的泛化对粗粮(以前的工作
11 )和黑盒(
16 ,
32 ,
33 ),同时解决以前没有解决的问题的宏观尺度一致性通过使用高阶相关性。macronodes的类型也由子图提供实质性的信息网络,如网络的宏观尺度是否具有内存或路径依赖性。
年代ec>
2.6。因果关系出现了网络的规模
网络具有信息大规模重塑网络时,<我nline-formula>
G米米l:mi>
米米米l:mi>
(大规模)更多<我nline-formula>
E米米l:mi>
我米米l:mi>
比原来的网络,<我nline-formula>
G米米l:mi>
(微量)。一般来说,较低的网络(低有效性<我nline-formula>
E米米l:mi>
我米米l:mi>
鉴于其大小)出现等有更高的潜力,因为他们可以重塑减少不确定性。搜索在分组允许识别或近似最大化的宏观尺度<我nline-formula>
E米米l:mi>
我米米l:mi>
。
检查所有可能的组合是难以计算的最小的网络。因此,为了找到macronodes增加<我nline-formula>
E米米l:mi>
我米米l:mi>
,我们使用贪婪算法组节点一起检查<我nline-formula>
E米米l:mi>
我米米l:mi>
增加。通过选择一个节点,然后配对迭代与周边节点我们可以长macronodes直到配对不再增加<我nline-formula>
E米米l:mi>
我米米l:mi>
,然后转移到一个新节点(有关详细信息,请参阅材料与方法部分在这个算法)。
通过生成无向优先连接网络和不同程度的优惠附件,<我nline-formula>
α米米l:mi>
,我们观察到的一个至关重要的优惠附件和因果之间的关系出现。中央导致网络科学之一,是“无尺度网络的识别(
21 ]。我们的结果表明,网络不是“无尺度”可以进一步分为微观、中间和宏观尺度取决于他们的连接。这种规模可以确定根据其程度的因果关系(图出现
5(一个) )。在次线性的情况下优惠附件<我nline-formula>
α米米l:mi>
<米米l:mo>
1。0米米l:mn>
、网络缺乏更高的尺度。线性优惠附件<我nline-formula>
α米米l:mi>
=米米l:mo>
1。0米米l:mn>
生成无标度网络,即优惠附件区之前网络发展更高的尺度。这样的高尺度只存在于超线性的优惠附件<我nline-formula>
α米米l:mi>
>米米l:mo>
1。0米米l:mn>
。和过去的<我nline-formula>
α米米l:mi>
>米米l:mo>
3所示。0米米l:mn>
网络开始收敛于一个大规模,几乎所有的节点分组到单个macronode。最大数量的因果出现在中尺度网络,当<我nline-formula>
α米米l:mi>
在1.5和3.0之间,当网络拥有大批macronodes。注意,增加<我nline-formula>
E米米l:mi>
我米米l:mi>
在宏观尺度的分组<我nline-formula>
α米米l:mi>
>米米l:mo>
1。0米米l:mn>
如图
5(一个) 类似的减少<我nline-formula>
E米米l:mi>
我米米l:mi>
与高<我nline-formula>
α米米l:mi>
我们观察在图
1 (b) 。这是因为在<我nline-formula>
α米米l:mi>
>米米l:mo>
1。0米米l:mn>
的减少<我nline-formula>
E米米l:mi>
我米米l:mi>
微尺度的改进余地<我nline-formula>
E米米l:mi>
我米米l:mi>
在宏观尺度,分组的节点。
图5
在优惠附件网络规模的出现。(一)通过多次模拟网络与不同程度的优惠附件(<我nline-formula>
α米米l:mi>
值),<我nline-formula>
米米米l:mi>
=米米l:mo>
1米米l:mn>
新的边缘每新节点,通过贪婪算法(材料与方法中描述),我们观察一次独特的因果的峰值出现优惠附件上面的程度<我nline-formula>
α米米l:mi>
=米米l:mo>
1米米l:mn>
,不再是“无标度网络。”(b)原始网络的比例大小的日志,<我nline-formula>
N米米l:mi>
大规模网络的大小,<我nline-formula>
N米米l:mi>
米米米l:mi>
。较高的网络<我nline-formula>
α米米l:mi>
变得像星星一样networks-show大幅减少维度,事实上,最终都达到相同的<我nline-formula>
N米米l:mi>
米米米l:mi>
2。相比之下,随机树<我nline-formula>
α米米l:mi>
=米米l:mo>
0.0米米l:mn>
基本上没有信息维数减少。
(一)
(b)
相应的尺寸<我nline-formula>
G米米l:mi>
米米米l:mi>
减少,<我nline-formula>
α米米l:mi>
增加和网络发展的更高的规模,可以在大规模网络的比例大小,<我nline-formula>
N米米l:mi>
米米米l:mi>
最初的网络规模,<我nline-formula>
N米米l:mi>
(图
5 (b) )。正如前面所讨论的那样,网络生成的高值<我nline-formula>
α米米l:mi>
将越来越多的像星星一样。星状网络有更高的简并度,因此更少<我nline-formula>
E米米l:mi>
我米米l:mi>
,正因为如此,我们希望有更多的机会,增加网络的<我nline-formula>
E米米l:mi>
我米米l:mi>
通过分组节点macronodes。实际上,当恒星的理想的分组网络<我nline-formula>
N米米l:mi>
米米米l:mi>
=米米l:mo>
2米米l:mn>
和<我nline-formula>
E米米l:mi>
我米米l:mi>
=米米l:mo>
1米米l:mn>
一些。这个结果是类似于光谱粗粒度的最新进展,也观察到恒星的理想的粗粒度的网络崩溃成两节点网络,所有的辐条分组到单个macronode [
34 ),这是发生了什么明星网络刻画成宏观尺度。
我们的研究结果提供了原则和一般方法这样的社区检测通过询问是否有一个信息获得取代单个节点的子图。因此,我们可以定义<我talic>
因果社区我talic>是当一个集群节点,或某些子图,形成一个可行的macronode(注意,这个假设网络中的连接实际上代表可能的因果相互作用,但它也仅仅是一个拓扑属性)。从根本上说,因果社区代表噪声在微尺度。越接近子图是完整的噪声,增加越大<我nline-formula>
E米米l:mi>
我米米l:mi>
通过替换用macronode(见G SM V)。最小化给定网络的噪声也确定了最优规模代表网络。然而,必须有一些结构,可以发现噪音最小化放在第一位。在随机的情况下网络,形成一个大型组件缺乏任何此类结构、因果关系出现不出现(如SM V G)所示。
年代ec>
2.7。因果出现在真实的网络
的存在和忠实度宏观尺度应该在真正的网络不同,根据连通性。在这里,我们调查处理对因果真实网络在不同领域的出现。我们从同一组网络图进行了分析
3 的选择过程和细节,在材料和方法部分概述。网络尺寸跨度40000节点,从而使其不为他们每个人找到最好的宏观尺度。因此,我们特别关注两类,先前显示最大的分歧的<我nline-formula>
E米米l:mi>
我米米l:mi>
:生物技术。因为我们感兴趣的一般问题是否生物技术网络显示更大的性格或倾向于因果出现,我们通过计算近似出现因果因果出现采样子图的大小。每个样本被发现使用“滚雪球抽样”程序,在随机选择一个节点,然后找到一个指定大小的弱连通子图周围(
35 ]。这个子图分析了使用前面介绍的贪婪算法来发现macronodes最大化<我nline-formula>
E米米l:mi>
我米米l:mi>
在每一个网络。每个可用的网络采样对于每个大小从它的20倍。在图
6 ,我们展示了这些真实的因果出现网络区分我们增加采样子图的大小,在一系列50,100,150,最后200节点/样品。网络的大小之前提供充足的因果关系的证据出现在模拟网络,如图
5(一个) 。比较真实的两类网络,我们观察到一个明显更倾向于因果出现在生物网络,而这更清晰更大的样本。注意,构造一个随机零模型的网络(例如,配置模型)会创建网络以最小或微不足道的因果出现,ER网络(图一样
13 在G SM V)。
图6
因果倾向出现在真实的网络。增长雪球样本的两个网络域名之前显示最大的分歧<我talic>
有效性我talic>:技术和生物网络。在每一个雪球大小,<我nline-formula>
N米米l:mi>
年代米米l:mi>
,每个网络采样20倍。在这些样本,因果的总量出现对于一个给定的样本大小明显不同的两个域之间的(<我talic>
t我talic>以及,意味着比较)。
生物系统的子集显示高气质因果出现是一致的,甚至是解释,许多长期存在的假设周围噪音的存在和简并在生物系统
36 ]。这也解释了的困难理解生物系统的因果结构功能,因为它们是神秘的,包含确定性和不确定性在另一个在一个水平。
年代ec>
3所示。讨论
我们已经表明,信息在网络中节点之间的关系是固有的不确定性的函数连接以及这种不确定性是如何分配的。捕捉到这些信息,我们适应措施,有效的信息<我nline-formula>
E米米l:mi>
我米米l:mi>
,用于网络和分析了常见的网络结构,它揭示了几十年来科学家们已经研究了网络。例如,<我nline-formula>
E米米l:mi>
我米米l:mi>
往往一个ER随机网络<我nline-formula>
−米米l:mo>
日志米米l:mi>
2米米l:mn>
p米米l:mi>
,是否<我nline-formula>
E米米l:mi>
我米米l:mi>
优惠附件网络增长或萎缩的新节点被添加的函数是否优惠依恋的程度,<我nline-formula>
α米米l:mi>
大于或小于1.0。在网络或转换的机制是未知的,但是结构是已知的,<我nline-formula>
E米米l:mi>
我米米l:mi>
捕获网络中独特的目标的程度。在现实网络中,我们显示<我nline-formula>
E米米l:mi>
我米米l:mi>
生物网络往往是大大低于技术网络。
我们还说明,所谓“因果”出现可以发生在网络。这是获得<我nline-formula>
E米米l:mi>
我米米l:mi>
发生在一个网络,<我nline-formula>
G米米l:mi>
,重塑一个新的网络,<我nline-formula>
G米米l:mi>
米米米l:mi>
。找到这类信息较高的规模意味着平衡不确定性同时最小化最大化网络中节点的数量。这些方法可能是有用的在提高科学实验设计,大数据的压缩和搜索,模型的选择,甚至机器学习。重要的是,并不是每一个重塑网络,<我nline-formula>
G米米l:mi>
米米米l:mi>
将有一个更高<我nline-formula>
E米米l:mi>
我米米l:mi>
比<我nline-formula>
G米米l:mi>
它代表,这些技术可以确定情况下还原。最终,这是因为比较<我nline-formula>
E米米l:mi>
我米米l:mi>
提供了一个不同的网络表示为比较任何两个网络的有效性表示相同的复杂系统。这些技术允许的正式识别网络的规模。无标度网络可以看作是具有分形的连接模式(
37 ),我们的结果表明,网络的规模的断裂分形在一个方向或另一个注意,未来的研究领域是如何有效地识别这些信息更高的尺度,以及如何网络属性以外的EI跨尺度变化(
38 ]。
高阶结构网络的研究日益丰富的研究领域(
29日 ,
39 - - - - - -
42 ),通常专注于构建网络,更好地捕捉他们代表的数据。在这里,我们介绍一个正式和广义的方式重塑网络在更高的规模,同时保留随机漫步动力学。在许多情况下,大规模的网络一样一致的随机漫步动力学也拥有更大<我nline-formula>
E米米l:mi>
我米米l:mi>
。一些macronodes宏观尺度可能不同类型与不同的高阶属性。换句话说,我们展示了如何将一个低阶网络变成一个高阶网络。我们的工作是一个值得注意和相关方面演示系统是无记忆的微尺度可以拥有记忆在宏观尺度,表明系统内存是否规模的函数。
虽然一些(
43 )以前重塑子图作为单独的节点我们这里所做的,他们没有这样做的方式是基于噪音最小化和最大化的一致性,而不是关注收益通过压缩算法的速度。显式地创建macronodes减少噪声集中了网络的依赖性。这意味着因果出现在网络社区检测有直接关系,一个庞大的学科的分支,它将网络内稠密子图代表共享属性,会员,或函数(
44 ,
45 ]。然而,因果之间的关系出现和传统社区并不像看起来的直接检测。首先,因果是出现在网络与简并度高(即。与高度、网络中心,显示在图
5(一个) )。社区检测算法通常不选择这样的结构属性,而不是专注于稠密子图连接子图内的高度比外(
44 ]。在SM图
12 ,我们将展示一种随机块模型的因果网络及其相关值出现。事实上在网络高模块化[
46 )(例如,两个派系断开),我们观察到因果出现,但是只有当两个断开连接的派系<我talic>
不同的大小我talic>。这种区别是关键和地处网络显示因果出现在有意义的地方在复杂网络的研究。在光,macronodes提供一种社区检测的micronodes组成macronode社区和最终可以取代macronode,总结了他们的行为,同时减少子图的噪声。在这种解释下,群落结构的特征是噪声而不是共享会员。
年代ec>
4所示。材料和方法
4.1。选择真实的网络
网络被选出来代表感兴趣的四类:社会、信息、生物、和技术(见SM图
10 相同,我们详细信息,如图所示
3 ,还包括网络数据的来源除了每个网络的效率价值)。我们使用所有可用的网络下40000个节点(由于计算约束)Konect数据库中的所有域内反映我们感兴趣的类别。对于我们的社会范畴,我们使用了域<我talic>
人类接触我talic>,<我talic>
人类社会我talic>,<我talic>
社会我talic>,<我talic>
沟通我talic>。对于我们的信息类别,我们使用了域<我talic>
引用我talic>,<我talic>
共同创作我talic>,<我talic>
超链接我talic>,<我talic>
词汇我talic>,<我talic>
软件我talic>。为我们的生物类别我们使用了域<我talic>
营养我talic>和<我talic>
代谢我talic>。由于之间的重叠Konect数据库和网络存储库(
24 在这些领域,和其他生物数据的缺乏在Konect数据库中,我们也包括<我talic>
大脑我talic>域和<我talic>
生态我talic>域的网络存储库增加样本容量(再一次,这些领域内的所有网络包括在40000个节点)。对于我们的技术范畴,我们使用了域<我talic>
电脑我talic>和<我talic>
基础设施我talic>从Konect数据库。又由于重叠Konect数据库和网络库,我们还包括了<我talic>
技术我talic>和<我talic>
电网我talic>域的网络库。全表的网络使用在这项研究中,连同他们的来源和分类,见表
二世 。
年代ec>
4.2。创建一致的Macronodes
之前我们提出的方法用于创建macronodes不同类型一致。在这里,我们探讨实施,这就需要决定哪些宏观尺度是一致的。不一致性是衡量Kullback-Leibler背离预期的随机分布步行者在微尺度<我nline-formula>
G米米l:mi>
和宏观尺度<我nline-formula>
G米米l:mi>
米米米l:mi>
给定一个初始分布,在方程(
5 )。
测量不一致我们使用一个初始最大熵分布在节点之间共享<我nline-formula>
G米米l:mi>
和<我nline-formula>
G米米l:mi>
米米米l:mi>
,只剩下的节点集未归类<我nline-formula>
G米米l:mi>
米米米l:mi>
。同样,我们只分析预期micronodes分布在同一组。因为这样只分布在网络的一部分,每个分配到1.0规范化,我们包括一个概率代表所有非共享节点之间<我nline-formula>
G米米l:mi>
和<我nline-formula>
G米米l:mi>
米米米l:mi>
(表示当一个随机沃克macronode)。
我们专注于节点之间共享<我nline-formula>
G米米l:mi>
和<我nline-formula>
G米米l:mi>
米米米l:mi>
不一致的测量,因为(a)很容易计算算法搜索时是必要的,(b)除了不寻常的情况下,共享的节点上的矛盾仍反映了网络作为一个整体,甚至(c)在最极端的情况下宏观尺度(如当<我nline-formula>
α米米l:mi>
>米米l:mo>
4米米l:mn>
在图
5 ),还有节点之间共享<我nline-formula>
G米米l:mi>
和<我nline-formula>
G米米l:mi>
米米米l:mi>
。
这里,我们检查我们的方法使用高阶相关性macronodes为了证明这将创建一致的。我们使用1000个模拟优先连接网络,它被选为一个统一的参数之间的随机样本<我nline-formula>
α米米l:mi>
=米米l:mo>
1。0米米l:mn>
和2.0,<我nline-formula>
n米米l:mi>
=米米l:mo>
25米米l:mn>
35,<我nline-formula>
米米米l:mi>
=米米l:mo>
1米米l:mn>
或2。这些网络被分组通过在下一节中描述的算法。所有macronodes都的<我nline-formula>
μ米米l:mi>
π米米l:mi>
类型和他们的不一致是检查超过1000的步伐。这些macronodes普遍一致的动态,因为他们开始,或者因为他们的趋势,随着时间的推移,和1000年的网络,只有4 1000年之后有任何分歧大于0的步伐。在图
11 在SM V F,我们显示15这些模拟网络,以及它们的参数,macronodes和一致性。注意,即使在早期非零的情况下不一致,这总是很低的绝对位,和随机选择的15,没有一个不一致性的趋势。在500年之前在我们的观察中,大多数macronodes趋同步伐,所以在分析现实世界的网络使用<我nline-formula>
μ米米l:mi>
π米米l:mi>
macronode,我们检查所有macronodes一致性和只在500年拒绝那些不一致的步伐。更详细的算法寻找因果出现在下一节中可以找到。
年代ec>
4.3。贪婪算法对因果出现
贪婪算法用于寻找因果出现在网络结构如下:对于每个节点,<我nline-formula>
v米米l:mi>
我米米l:mi>
打乱节点列表中,最初的网络,收集相邻节点的列表,<我nline-formula>
v米米l:mi>
j米米l:mi>
∈米米l:mo>
B米米l:mi>
我米米l:mi>
,在那里<我nline-formula>
B米米l:mi>
我米米l:mi>
是<我talic>
马尔科夫毯我talic>的<我nline-formula>
v米米l:mi>
我米米l:mi>
(在图形化模型、马尔科夫毯<我nline-formula>
B米米l:mi>
我米米l:mi>
一个节点,<我nline-formula>
v米米l:mi>
我米米l:mi>
对应于“父母”、“孩子”和“孩子的父母”<我nline-formula>
v米米l:mi>
我米米l:mi>
(
47 ])。这意味着<我nline-formula>
v米米l:mi>
j米米l:mi>
∈米米l:mo>
B米米l:mi>
我米米l:mi>
由节点和边领先<我nline-formula>
v米米l:mi>
我米米l:mi>
,节点的边<我nline-formula>
v米米l:mi>
我米米l:mi>
导致,节点的边的out-neighbors领先<我nline-formula>
v米米l:mi>
我米米l:mi>
。为每个节点在<我nline-formula>
v米米l:mi>
j米米l:mi>
,该算法计算<我nline-formula>
E米米l:mi>
我米米l:mi>
大规模网络<我nline-formula>
v米米l:mi>
我米米l:mi>
和<我nline-formula>
v米米l:mi>
j米米l:mi>
组合成macronode,<我nline-formula>
v米米l:mi>
米米米l:mi>
根据图中的macronode类型之一
4 。如果由此产生的网络有更高<我nline-formula>
E米米l:mi>
我米米l:mi>
值,该算法商店这种结构性变化和,如果有必要,补充剂队列的节点,<我nline-formula>
v米米l:mi>
j米米l:mi>
,任何新的相邻节点<我nline-formula>
v米米l:mi>
j米米l:mi>
马尔科夫毯不已经<我nline-formula>
v米米l:mi>
j米米l:mi>
。如果一个节点,<我nline-formula>
v米米l:mi>
j米米l:mi>
,已被组合成一个macronode通过前一个节点的分组,<我nline-formula>
v米米l:mi>
我米米l:mi>
,那么它将不会被包括在新队列,<我nline-formula>
v米米l:mi>
j米米l:mi>
′米米l:mo>
,后来的节点检查。迭代算法结合等对节点到每个节点,<我nline-formula>
v米米l:mi>
j米米l:mi>
,在每一个节点,<我nline-formula>
v米米l:mi>
我米米l:mi>
马尔科夫毯,是考验。
年代ec>
数据可用性
这项工作中使用的所有数据都从Konect检索数据库(
23 )和网络存储库(
24 ),这是公开的。软件计算<我nline-formula>
E米米l:mi>
我米米l:mi>
在网络和寻找因果网络可以通过请求或在出现
https://github.com/jkbren/einet 。
年代ec>
信息披露
表达的观点在这个出版的作者(年代),不一定反映的观点邓普顿世界慈善基金会,公司。
年代ec>
的利益冲突
作者宣称没有利益冲突。
年代ec>
作者的贡献
的手段和再见构思的项目。的手段,再见写了篇文章。的手段进行了分析。
年代ec>
确认
作者感谢亨氏康纳,哈里森·哈特尔和亚历山德罗Vespignani见解对有效信息的符号和形式主义。这项研究受到了艾伦探索中心项目通过保罗艾伦前沿集团(12171)。这个出版成为可能通过的支持从邓普顿世界慈善基金会的资助,Inc . (TWCFG0273)。这项工作的部分也支持由国防科学与工程研究生奖学金(NDSEG)项目。
补充材料
补充材料
关键术语表。B:有效的信息计算。C:派生的有效信息共同的网络结构。D:网络主题为因果关系。艾凡:网络数据表。F: macronode一致的例子。G:紧急子图。
年代upplementary-material>
[
]1
巴巴斯年代urname>
A.-L。
网络科学我talic>
2016年
英国剑桥
剑桥大学出版社
[
]2
纽曼年代urname>
m·e·J。
网络:介绍我talic>
2010年
牛津大学,英国
牛津大学出版社
[
]3
阿马拉尔年代urname>
l . a . N。
Ottino年代urname>
j . M。
复杂网络
欧洲物理期刊B-Condensed问题我talic>
2004年
38
2我年代年代ue>
147年
162年
10.1140 / epjb / e2004 - 00110 5
2 - s2.0 - 2942659840
[
]4
Koseska年代urname>
一个。
Bastiaens年代urname>
p . I。
细胞信号作为一种认知过程
在EMBO杂志我talic>
2017年
36
5我年代年代ue>
568年
582年
10.15252 / embj.201695383
2 - s2.0 - 85011271342
[
]5
罗德里格斯年代urname>
f。
庇隆年代urname>
t·k·D。
霁年代urname>
P。
Kurths年代urname>
J。
Kuramoto模型在复杂网络
物理的报告我talic>
2016年
610年
1
98年
10.1016 / j.physrep.2015.10.008
2 - s2.0 - 84954199114
[
]6
Perra年代urname>
N。
Goncalves年代urname>
B。
Pastor-Satorras年代urname>
R。
Vespignani年代urname>
一个。
活动的驱动模型时变网络
科学报告我talic>
2012年
2
1
10.1038 / srep00469
2 - s2.0 - 84871233737
[
]7
巴塞特年代urname>
d S。
斯波恩年代urname>
O。
神经网络
自然神经科学我talic>
2017年
20.
3我年代年代ue>
353年
364年
10.1038 / nn.4502
2 - s2.0 - 85013742511
[
]8
巴巴斯年代urname>
A.-L。
Gulbahce年代urname>
N。
Loscalzo年代urname>
J。
网络医学:一个基于网络的人类疾病的方法
自然遗传学评论我talic>
2011年
12
1我年代年代ue>
56
68年
10.1038 / nrg2918
2 - s2.0 - 78650373804
[
]9
那一定很有意思年代urname>
N。
波特年代urname>
m·A。
Lambiotte年代urname>
R。
随机漫步,在网络上扩散
物理的报告我talic>
2017年
716 - 717
1
58
10.1016 / j.physrep.2017.07.007
2 - s2.0 - 85054407686
[
]10
香农年代urname>
c, E。
通信的数学理论
贝尔系统技术杂志我talic>
1948年
27
3我年代年代ue>
379年
423年
10.1002 / j.1538-7305.1948.tb01338.x
2 - s2.0 - 84940644968
[
]11
Hoel年代urname>
e . P。
Albantakis年代urname>
l
托诺尼年代urname>
G。
量化因果出现表明宏观能打败微观
美国国家科学院院刊》上我talic>
2013年
110年
49我年代年代ue>
19790年
19795年
10.1073 / pnas.1314922110
2 - s2.0 - 84889666451
[
]12
Hoel年代urname>
e . P。
Aguirre年代urname>
一个。
福斯特年代urname>
B。
Merali年代urname>
Z。
代理,原子以下:代理有原因地摆脱他们的基本粒子物理学
流浪的朝着一个目标:如何愚蠢的数学法则产生目标和意图吗?我talic>
2018年
柏林,德国
施普林格国际出版
63年
76年
[
]13
托诺尼年代urname>
G。
斯波恩年代urname>
O。
测量信息集成
BMC神经科学我talic>
2003年
4
1我年代年代ue>
31日
10.1186 / 1471-2202-4-31
2 - s2.0 - 2642566982
[
]14
珍珠年代urname>
J。
因果关系我talic>
2000年
纽约,纽约,美国
剑桥
10.1017 / CBO9780511803161
2 - s2.0 - 84922937176
[
]15
珍珠年代urname>
J。
因果图进行实证研究
生物统计学我talic>
1995年
82年
4我年代年代ue>
669年
688年
10.1093 / biomet / 82.4.669
2 - s2.0 - 77956888769
[
]16
Hoel年代urname>
E。
当地图比领土
熵我talic>
2017年
19
5我年代年代ue>
188年
10.3390 / e19050188
2 - s2.0 - 85019179804
[
]17
Erdős年代urname>
P。
Renyi年代urname>
一个。
在随机图
出版Mathematicae我talic>
1959年
6
290年
[
]18
Bollobas年代urname>
B。
随机网络的进化
事务的美国数学学会我talic>
1984年
286年
1我年代年代ue>
257年
10.2307 / 1999405
[
]19
德尔Genio年代urname>
c。I。
总值年代urname>
T。
Bassler年代urname>
k . E。
无标度网络都是稀疏的
物理评论快报我talic>
2011年
107年
1
10.1103 / physrevlett.107.178701
2 - s2.0 - 80054751596
[
]20.
Krapivsky年代urname>
p . L。
红肿年代urname>
年代。
Leyvraz年代urname>
F。
越来越多的随机网络的连通性
物理评论快报我talic>
2000年
85年
21我年代年代ue>
4629年
4632年
10.1103 / physrevlett.85.4629
2 - s2.0 - 0034310714
[
]21
巴巴斯年代urname>
A.-L。
艾伯特年代urname>
R。
宋年代urname>
H。
平均场理论无尺度随机网络
自然史答:统计力学及其应用我talic>
1999年
272年
1 - 2我年代年代ue>
173年
187年
10.1016 / s0378 - 4371 (99) 00291 - 5
2 - s2.0 - 18744421488
[
]22
美国瓦茨年代urname>
d . J。
“年代urname>
s . H。
“小世界”网络的集体动力学
自然我talic>
1998年
393年
6684年我年代年代ue>
440年
442年
10.1038/30918
[
]23
Kunegis年代urname>
J。
KONECT-the科布伦茨网络收集
《22日国际会议上万维网的伙伴
2013年5月
巴西里约热内卢
1343年
[
]24
罗西年代urname>
r。
艾哈迈德年代urname>
n K。
NetworkRepository:交互式数据存储库与多尺度可视化分析
美国29日AAAI会议上人工智能
2015年1月
美国奥斯汀,得克萨斯州
4292年
[
]25
埃德尔曼年代urname>
g . M。
吓唬年代urname>
j . A。
简并度和生物系统的复杂性
美国国家科学院院刊》上我talic>
2001年
98年
24我年代年代ue>
13763年
13768年
10.1073 / pnas.231499798
2 - s2.0 - 0035923604
[
]26
托诺尼年代urname>
G。
斯波恩年代urname>
O。
埃德尔曼年代urname>
g . M。
简并度和冗余在生物网络的措施
美国国家科学院院刊》上我talic>
1999年
96年
6我年代年代ue>
3257年
3262年
10.1073 / pnas.96.6.3257
2 - s2.0 - 0032980799
[
]27
鲁宾斯坦年代urname>
p K。
Weichwald年代urname>
年代。
Bongers年代urname>
年代。
因果关系的结构方程模型的一致性
2017年
https://arxiv.org/abs/1707.00819
[
]28
页面年代urname>
l
布林年代urname>
年代。
Motwani年代urname>
R。
Winograd年代urname>
T。
PageRank引文排序:将以网络
1998年
斯坦福,加州,美国
斯坦福Infolab
技术报告
[
]29日
Rosvall年代urname>
M。
Bergstrom年代urname>
c . T。
随机漫步的地图揭示复杂网络社区结构
美国国家科学院院刊》上我talic>
2008年
105年
4我年代年代ue>
1118年
1123年
10.1073 / pnas.0706851105
2 - s2.0 - 39549086558
[
]30.
封面年代urname>
t M。
托马斯。年代urname>
j . A。
信息理论的元素我talic>
2012年
美国新泽西州霍博肯
约翰威利& Sons
[
]31日
徐年代urname>
J。
Wickramarathne年代urname>
t . L。
乔拉年代urname>
n V。
代表高阶网络的依赖性
科学的进步我talic>
2016年
2
e1600028
10.1126 / sciadv.1600028
2 - s2.0 - 84986299897
[
]32
阿什比年代urname>
w·R。
介绍了控制论我talic>
1957年
英国伦敦
查普曼&大厅
[
]33
马歇尔年代urname>
W。
Albantakis年代urname>
l
托诺尼年代urname>
G。
黑盒和因果力量
PLoS计算生物学我talic>
2018年
14
1
10.1371 / journal.pcbi.1006114
2 - s2.0 - 85046350933
[
]34
劳伦斯年代urname>
E。
Doyon年代urname>
N。
杜布年代urname>
l . J。
Desrosiers年代urname>
P。
光谱降维的复杂动态网络
物理评论X我talic>
2019年
9
011042年
10.1103 / physrevx.9.011042
2 - s2.0 - 85063348866
[
]35
Heckathorn年代urname>
D D。
卡梅隆年代urname>
C。
网络抽样:斯诺鲍和多样性respondent-driven抽样
年度回顾社会学我talic>
2017年
43
1我年代年代ue>
101年
119年
10.1146 / annurev - soc - 060116 - 053556
2 - s2.0 - 85026765662
[
]36
托诺尼年代urname>
G。
埃德尔曼年代urname>
g . M。
斯波恩年代urname>
O。
大脑的复杂性和一致性:整合信息
认知科学趋势我talic>
1998年
2
12我年代年代ue>
474年
484年
10.1016 / s1364 - 6613 (98) 01259 - 5
2 - s2.0 - 0032401315
[
]37
巴巴斯年代urname>
A.-L。
Ravasz年代urname>
E。
Vicsek年代urname>
T。
确定无标度网络
自然史答:统计力学及其应用我talic>
2001年
299年
3 - 4我年代年代ue>
559年
564年
10.1016 / s0378 - 4371 (01) 00369 - 7
2 - s2.0 - 0035887972
[
]38
Griebenow年代urname>
R。
克莱因年代urname>
B。
Hoel年代urname>
E。
找到合适的网络规模:高效的识别因果通过光谱集群出现
2019年
http://arxiv.org/abs/1908.07565
[
]39
本森年代urname>
a。R。
Gleich年代urname>
d F。
Leskovec年代urname>
J。
高阶复杂网络的组织
科学我talic>
2016年
353年
6295年我年代年代ue>
163年
166年
10.1126 / science.aad9029
2 - s2.0 - 84979081053
[
]40
目前年代urname>
我。
当网络是网络吗?Multi-order图形模型选择的路径和时间网络
第23届ACM SIGKDD学报》国际会议上知识发现和数据挖掘
2017年8月
加拿大哈利法克斯
1037年
[
]41
阴年代urname>
H。
本森年代urname>
a。R。
Leskovec年代urname>
J。
高阶聚类在网络
物理评论E我talic>
2018年
97年
1
10.1103 / physreve.97.052306
2 - s2.0 - 85047411150
[
]42
Lambiotte年代urname>
R。
Rosvall年代urname>
M。
目前年代urname>
我。
从网络到最佳的高阶复杂系统的模型
自然物理我talic>
2019年
15
4我年代年代ue>
313年
320年
10.1038 / s41567 - 019 - 0459 - y
2 - s2.0 - 85063473600
[
]43
Gfeller年代urname>
D。
德洛里奥斯年代urname>
P。
光谱粗粒化的复杂网络。物理评论快报
2007年
99年
3我年代年代ue>
38701年
10.1038 / s41598 - 018 - 29174 - 3
2 - s2.0 - 85050344532
[
]44
Fortunato年代urname>
年代。
Hric年代urname>
D。
在网络社区检测:用户指南
物理的报告我talic>
2016年
659年
1
44
10.1016 / j.physrep.2016.09.002
2 - s2.0 - 84994116584
[
]45
Radicchi年代urname>
F。
可以见到效果年代urname>
C。
Cecconi年代urname>
F。
Loreto年代urname>
V。
帕里年代urname>
D。
定义和识别社区网络
美国国家科学院院刊》上我talic>
2004年
101年
9我年代年代ue>
2658年
2663年
10.1073 / pnas.0400054101
2 - s2.0 - 1542357701
[
]46
纽曼年代urname>
m·e·J。
Girvan年代urname>
M。
寻找和评估网络社区结构
物理评论E我talic>
2004年
69年
1
10.1103 / physreve.69.026113
2 - s2.0 - 37649028224
[
]47
Friston年代urname>
K。
我们知道它的生命
《英国皇家学会界面我talic>
2013年
10
20130475
10.1098 / rsif.2013.0475
2 - s2.0 - 84893349575