文摘

理解和控制传播的复杂网络,确定最具影响力的节点,可应用于疾病控制,病毒式营销,空中交通管制,和许多其他领域,具有十分重要的意义。通过信息熵的传播率的影响考虑在内,我们提出了一种改进的信息熵(IIE)方法。基准方法相比在六个不同的经验网络,国际教育协会的方法被发现具有更好的性能在肯德尔τ和不精确函数容易感染恢复(先生)模型。特别是在Facebook网络,肯德尔τ可以增长120%相比与原方法。,还有一个同样良好的性能的比较分析不精确的函数。国际教育协会的不精确的函数的值小于基准方法方法在六个网络。

1。介绍

传播在自然界中随处可见的现象(1- - - - - -7]。在自然界中许多活动可以被描述为传播(8- - - - - -13]。近年来,许多研究集中在传播过程中由于其理论意义和实践价值14,15),包括谣言控制(16- - - - - -18),信息扩散19- - - - - -22)、空中交通控制(23- - - - - -25),和病毒式营销26- - - - - -28]。其中,识别具有影响力的节点在复杂网络的研究是一个热点。理解的影响节点显示新的见解应用,如采矿的关键节点(29日- - - - - -34)和设计有效的策略来防止疫情传播或扩散加速信息。

影响力的节点的识别具有重要意义控制流行性和谣言、定向广告,和空中交通规划(35,36]。最近,许多研究人员已经提出了各种各样的中心的方法来处理这个问题以更有效的方式来识别这些节点。学位中心可以被视为一个典型的方法来处理前的问题考虑本地信息(37,38]。针对这一观点,陈等人提出了当地排名方法通过考虑第四邻居节点的顺序(39]。通过考虑网络中节点的位置信息,通过 - - - - - -壳牌分解方法,Kitsak et al。40)发现了一个事实,最具影响力的节点位于网络的核心。然后,基于很多改进的方法 - - - - - -壳牌分解(41- - - - - -43提出了确定有影响力的节点。亲密关系中心(44)和介数中心(45)是两种基于路径的方法。考虑到邻居的影响,任et al。46)提出了爱尔兰共和军的方法。基于爱尔兰共和军方法,钟等。47)提出了IIRA方法考虑传播特性。信息熵也作为一个重要的中心来评估节点的影响(48,49]。

最前面的方法假设节点的影响取决于其自身的重要性。但还有另一个不容忽视的关键因素,即邻居的重要性。基于这个想法,郭et al。50)提出了一种信息熵方法(IE)考虑到邻居的信息数量。然而,IE方法的性能也受到传播特性的影响。在这个例子中网络呈现在图1节点1和6的影响,不能准确地确定的方法。在这种情况下,我们认为邻居的数量和扩散率可能会在目标节点上有积极的作用。基于这个想法,我们提出了一种改进的信息熵(IIE)方法的目标节点的信息熵可能传播特性的影响。与基准方法相比在六个真实网络,国际教育协会的方法被发现具有更好的性能在肯德尔τ和不精确函数容易感染恢复(先生)模型(51,52]。

2。国际教育协会的方法

最初的IE方法假定节点的影响应该通过信息熵的邻居。国际教育协会的方法,我们认为,传播率和邻居的数量可以调整初始信息熵。我们可以满足识别的有影响力的节点通过最后的信息熵,也就是说,国际教育协会的方法。国际教育协会方法可以解释下面的细节。

一般来说,一个无向网络 可以被描述为一个相邻矩阵 ,在哪里 代表节点和数量 代表边的数量。如果节点 连接到节点 , ;如果不是这样, 我们认为传播率和邻居的数量可以调整目标节点的信息熵。因此,国际教育协会任何节点的价值 可以通过计算 在哪里 是提供的信息数量的 , 代表传播特性的影响,传播率 , 表示的邻居节点数 ,同样的表达

方程(1)可以写成 在哪里 表示节点 阶的邻居。如果 ,它表明节点 的直接邻居。

详细描述国际教育协会的方法,我们集 考虑到网络图的例子2。的黑色节点(节点1),改进的信息熵(IIE)然后计算节点1

3所示。结果

3.1。数据描述

有六个经验网络用来评估国际教育协会的性能的方法。美国空军网络(53)是美国空中交通网络的一个组成部分。Polblogs网络作为网络政治博客在美国与政治的关系。web上的数据是可用的。

电子邮件网络(54)是指一个电子邮件网络在西班牙的一所大学。Soc-hamsterster网络是一个社交网络,节点之间的边表示友谊或家庭关系。Facebook是来自Facebook的在线社交网络平台,及其边缘表示人际关系。LastFM网络(55)是源自一个调频广播平台为亚洲用户的边缘代表节点之间存在的友谊。上面列出的六个网络的统计属性表1

3.2。测量

对于本文来说,节点传播的影响与爵士模型模拟(52]。这个系统由三个部分组成,即易感个体(年代),感染者()和恢复个人(R)。在爵士的每个时间步模型中,每一个感染的易感的邻居节点节点随机感染有一定概率 在这段时间里,每个被感染节点将恢复有一定概率的 并将不再被感染。一个节点的传播影响感染节点的范围 指节点感染初始感染节点的数量在整个网络。感染节点的范围 从平均计算吗 实验。

肯德尔的τ56)和不精确函数可以用来评估国际教育协会方法的优越性。肯德尔的τ(−1,1)之间,这个函数可以用来评估两个排名列表之间是否存在相关性。肯德尔的τ价值越高,两个排名列表之间的相关性越强。肯德尔的τ 可以表示为

作为符号函数;如果 ,的图 等于1;如果 ,的图 等于−1;而且,如果 ,的图 等于0。 表示列表中的节点数,也就是说,在网络。计算中心的方法, 的订单值的排名列表节点 而且, 的订单值的排名列表节点 这是真正的传播所产生的影响。如果 ,这意味着有一个大的两个不同的排名列表之间的相关系数。

不精确的函数 评价中心方法的性能计算的平均传播能力最高排名的关键节点中心获得的方法。 应该表示为 在哪里 是一个比例的节点被选中, , 代表节点的数量, 代表了最高的平均传播影响 节点中心的方法,获得的排名 可以作为最高的平均传播影响力 节点计算的排名先生模型。如果 更接近于 , 更小。这意味着传播影响力 由中心节点计算方法更接近于传播的影响 节点与真正的传播能力。这也表明,中心方法的准确性更高。

3.3。仿真结果

在本文中,我们选择六个真实网络测试国际教育协会的方法。根据不同的网络,我们集 在爵士模型中。

首先,我们测试不同的值的影响 国际教育协会的表现方法。 表示节点之间的距离。如果 ,量的直接邻居的信息将提供给目标节点。而且,如果 ,目标节点的信息数量将由二阶邻国。参数的影响 国际教育协会方法如图6个网络3,

从图3,我们能算出的效果 肯德尔的τ 由国际教育协会法计算在不同的网络。很明显,当我们设置的距离 ,肯德尔的τ 可以在美国最大的空气,Polblogs,电子邮件,和LastFM网络。它表明,国际教育协会方法更准确的生成的其他值 在这四个网络。然而,有不同的现象Soc-hamsterster和Facebook网络。当 ,肯德尔的τ是最大的,而国际教育协会方法的计算时间大幅增加。此外,我们知道从TDI理论57),个人只影响相对较小范围的邻居。因此,我们组 在以后的实验。

国际教育协会的效率的方法,检查 - - - - - -壳,学位中心,接近中心,中间性中心,IE方法与国际教育协会选为基准的方法比较方法在六个网络。我们设置 , ,和距离 从图可以看出46网络,肯德尔τ 国际教育协会的方法获得的远远大于得到的基准方法。这表明,国际教育协会法优于基准法。它还可以看到从图4在美国,空气和LastFM网络,肯德尔的τ的价值 国际教育协会的方法获得的逐渐增加以及传播率 相反,在Soc-hamsterster和Facebook网络,肯德尔的τ的价值 国际教育协会获得的方法减少传播速度的增长 然而,发散现象存在于Polblogs和电子邮件网络。的传播速度 增加,肯德尔的τ ,由国际教育协会的方法,计算得到了先增加然后减少。

5说明了改进的比率 肯德尔的τ是国际教育协会之间的比较方法和基准的方法。我们定义 作为 在哪里 代表肯德尔的τ国际教育协会获得的方法。 是肯德尔τ 计算了不同基准的方法。显然,如果 ,这意味着国际教育协会方法的性能要好得多。图5清楚地表明,当国际教育协会方法与基准方法相比,肯德尔τ 大大增加。6网络,国际教育协会的方法比另一个更精确的基准方法识别影响力的节点。我们也可以发现,与IE方法相比,最大的价值 可以增长80%。同样,肯德尔的τ 显示了显著增加时,国际教育协会方法与其他基准方法相比在美国航空网络。这意味着国际教育协会方法优于基准的方法。同样的现象也出现在其他不同的网络。特别是,在Facebook网络与IE方法相比,最大的价值 可以增长120%

从图可以看出6,不精确的功能 提出了每种方法的和令人印象深刻的成果已经通过国际教育协会方法六网络。在美国空军和电子邮件等小型网络,国际教育协会方法的结果明显优于其他基准方法。例如, 远低于基准的方法,这意味着传播国际教育协会预测的方法的结果比基准建立的更可靠的方法。在大型LastFM网络, 远低于 这个结果表明,国际教育协会方法执行更准确地比原来的IE方法确定最具影响力的节点。值得注意的是,什么时候 小,国际教育协会方法显示出更好的性能比其他基准的方法。这些现象表明国际教育协会的理性方法考虑到目标节点的传播特性。

4所示。结论

控制传播的过程,其中的一个基本任务是估计传播影响力和识别有影响力的节点。通过考虑目标节点的信息熵和传播速度,我们提出了一种改进的信息熵(IIE)方法。国际教育协会的方法需要传播率和目标节点的邻居的数量考虑在内。主导新信息,这些信息熵。根据仿真结果,国际教育协会方法达到一个更好的性能比IE方法,以及国际教育协会方法( )不添加任何参数或增加计算复杂度。6网络,国际教育协会方法执行基准比另一种更好的方法,如 - - - - - -shell ( ),学位中心( ),亲密关系中心( ),中间性中心( ),和IE方法。尤其是在Facebook网络与IE方法相比,最大的改进的比率 上升到120%。,也存在一个同样良好的性能的比较分析不精确的功能。6网络, 远低于基准的方法。这些结果表明,国际教育协会的方法是确保识别影响力节点比基准的方法更精确。的重要组成部分,国际教育协会方法可以利用其他中心。例如,国际教育协会的信息熵方法也可以获得的邻居的 - - - - - -壳牌公司的价值观。

6网络的基准方法相比,国际教育协会方法的准确性可以更满意的识别有影响力的节点上,尽管它带来了一些不可避免的挑战。的一个挑战是,国际教育协会方法仅仅需要目标节点的传播率的影响考虑在内,忽视了影响从目标节点的邻居。的距离 邻居的应该更加关注,对其价值影响国际教育协会的性能的方法。我们应该找出哪些因素影响的价值 颞网络已经被越来越多的关注,这就要求我们设计一个先进的信息熵方法。它仍然是一个有趣的和开放式的问题。

数据可用性

本研究中使用的数据集可从第一作者在合理的请求((电子邮件保护))。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是由中国国家自然科学基金(没有。U1733203),中国民航的安全基金会(没有。AQ20200019)和CAFUC(没有的基础。j2020 - 084)。