研究文章|开放获取
周明阳,廖浩,熊文满,吴向阳,魏宗文那 “复杂网络中的连接模式激发链路预测“,复杂那 卷。2017年那 文章ID.8581365那 12 页面那 2017年. https://doi.org/10.1155/2017/8581365
复杂网络中的连接模式激发链路预测
摘要
链路预测利用观测到的数据来预测复杂网络中未来或潜在的关系。一个基本的假设是,如果两个节点有许多共同特征,那么它们连接在一起的可能性就很高。关键问题是开发不同的相似性评估方法。然而在本文中,我们通过对已有链接和不存在链接相似度评分的差异进行表征,发现了一个有趣的现象,即具有特定低相似度评分的两个节点也有很高的概率连接在一起。因此,我们提出了一个新的框架,利用一个最优的单变量函数来调整两个节点的相似度评分。理论分析表明,我们的方法可以在不降低准确性的前提下,正确预测出更多相似度较低的链接(长链)。在真实网络中的实验表明,我们的框架不仅显著提高了精度,而且比最先进的方法预测更长的连接,这加深了我们对复杂网络结构的理解。
1.介绍
现代科学和工程技术增加了我们对各种数据的可用性,包括在线社交网络、科学协作网络和电网网络[1-5.].从这些网络中可以发现许多有趣的现象。例如,通过分析Facebook和Twitter的数据,只计算他们共同的朋友,就可以帮助找到失去的朋友。6.那7.]及网上商店的推荐系统[8.那9.].受仪器准确性和其他障碍的限制,我们只获得了一小部分或完整网络的快照[10那11],鼓励我们在复杂的网络中过滤信息[12-14].链接预测是一种通过预测缺失的链接和区分虚假链接来检索网络的直接方法[15-17].因此,近年来人们在链路预测方面做了很大的努力[16那18].链接预测用于不同类型的网络,包括单部网络和二部网络,其中单部网络由相同类型的节点组成(如社会网络和神经网络),二部网络由两种类型的节点组成(如用户-对象购买网络和用户-电影网络)[19那20.].
在古典链路预测方法中,首先计算相似性分数用于两个断开的节点,然后在分数列表顶部中的不存在链路被预测为潜在的链接[16].因此,关键问题是搜索有效的分数分配方法,这些方法主要分为三类[16那21]:基于相似性的算法、贝叶斯算法和最大似然算法。首先,基于相似性的算法[22-24假设相似的节点连接在一起的概率很高。相似性通过共同邻居、随机行走资源分配以及其他局部和全局指标来评估。二、贝叶斯算法[25-27]抽象出观测网络的联合概率分布,然后利用条件概率估计不存在链路的可能性。第三,最大似然算法[28那29,假设一些基本原则支配着网络的结构,详细的规则和具体的参数通过极大似然估计得到。通过这些原则的细节,可以获得大量不存在的链接。这些方法大多倾向于预测相似度高的链接,而在检测相似度低的长程链接时表现不佳。
在上述方法中,两个相似度评分高的节点连接在一起的可能性高的基本假设缺乏深入的说明。最近的研究表明,远程链路广泛存在于复杂网络中,并在路由、流行病扩散和其他动力学中发挥重要作用[30.那31].然而,在实践中,远程链路的终点通常具有弱相互作用和低相似性[30.],防止用传统方法检测远距离链路[32那33].因此,研究网络的结构模式具有重要意义。
我们的研究采用了不同但互补的方法来链接预测问题。通过分别分析现有和不存在的链接的分数分布,我们发现现有和不存在的链接在其相似度分数各自的不同连接模式下遵循不同的连接模式。然后,由精密召回曲线启发[34-36],我们提出了一个名为精度噪声比(PNR)的指标,以描述区分不同分数潜在链接的能力。PNR描述给定的一组具有相同评分的链路的局部精度。在PNR的基础上,提出了一种新的框架,该框架投射单变量函数对给定方法的分数进行调整。该框架充分利用了传统链路预测方法的能力,找到了最优变换函数,提高了传统链路预测方法的精度和检测性能。在六个真实网络中的实验证明了我们的方法的有效性。
本文的其余部分组织如下。节2,我们首先简要介绍链路预测问题,然后介绍我们提出的方法。节3.,比较了该方法与经典方法的性能。最后给出结论。
2。材料和方法
本节给出了链接预测公式2.1和本节中的基线方法2.2.本节介绍了我们提出的框架2.3.
2.1。网络形成和指标
鉴于网络 那 和 如果节点连接到 ;除此以外, .在评估预测性能时,我们通常将链接随机分为 训练集和探针集( ), 和 和 .目标是通过使用培训集中的信息来准确地预测探测器中的链接。
我们首先给每个不存在的链接打分,然后选择最高的链接L.分数为潜在的。可以利用最先进的相似性评估方法来执行链路预测,包括公共邻居(CN),JAccard索引(JB),资源分配索引(RA),局部路径索引(LP)和结构扰动方法(SPM)(见一部分基线和[38])。
有两个流行的指标,以表征精度:接收器操作特性曲线下的区域(AUC)[39]和精度[40那41].AUC可以解释为一个随机选择的缺失环节(即,一个在)的得分高于随机选择的不存在的链接。然后,AUC需要独立比较的次数。我们随机选择一个真实的链接和一个不存在的链接来比较他们的分数。后不同的比较,我们记录下来实际链接得分更高的时间两种链接的时间具有相同的分数。最终的AUC计算为 如果所有的分数都是由独立且相同的分布给出的,那么AUC应该在0.5左右。AUC越高,预测越准确。
另一个指标是精度,它描述了给定预测列表中正确预测链接的比例。也就是说,如果预测列表的长度是 那其中链接是正确的潜在链接,那么精度是 显然,更高的精度意味着更高的预测精度。直观地说,精度越高,AUC和精度也就越高。在实验中,我们可以看到精度与AUC的相关性很小,提高精度不一定会导致AUC的提高。
2.2.基线预测方法
在链路预测问题中,存在大量的分数分配方法。所有这些方法都可以引入到我们的框架中。虽然我们只研究了一些最先进的分数分配方法,但结果和结论也适用于其他的分数分配方法。五种评分方法[6.那16如下所示。
(i)公共邻居(CN)。度量假设如果两个节点和有更多共同的邻居,他们更有可能联系在一起。两个节点的邻域重叠情况如下: 在哪里是一组节点集和 表示集合的大小。CN的缺点是它有利于大程度的节点。虽然两个大度节点的相似性低,但它们仍然有许多常见的邻居。
(ii)Jaccard系数(JB)。Jaccard是一种传统的相似性度量,旨在抑制大度节点的影响,即 由于相似度是通过两个节点的邻居的并集大小来归一化的,所以即使两个大节点有很多共同的邻居,它们之间的相似度仍然很低。
(iii)资源分配。该指标是受到复杂网络中资源分配动态的启发。给定一对不相连的节点和 那假设节点需要分配一些资源 那使用公共邻居作为发射机。每个发射器(共同的邻居)从一个单一的资源单元开始,然后将其平均分配给所有邻居。之间的相似性和可以计算为从其常见邻居收到的资源量: 与Jaccard方法相比,RA也能抑制大度节点的影响,但更具体。不同的邻居对相似性的贡献是不同的。如果两个节点更倾向于连接低度节点,则意味着他们有更高的概率共享共同的兴趣或特征。然而,许多对节点具有共同的高度邻域,导致高度节点在评价相似度时发挥的作用较弱。在此基础上,利用该方法得到了Adamic-Adar (AA)指数代替在(5.).
(iv)局部路径(LP)。CN考虑了邻域的交集,实际上是利用单路径邻域来描述相似性。LP通过考虑双路径邻居来综合考虑路径: 在哪里网络的邻接矩阵是和吗是一个小的正数。LP假设单路径邻居与两条路径邻居相似的相似性贡献更多。LP是KATZ方法的低阶部件( ),但计算复杂度却低得多。
(v)结构扰动方法(SPM)。Lü等[6.假设网络结构在某些随机扰动后遵循一致性。在SPM,培训集分为一小部分扰动组剩下的集合( ).有相似的特征向量 那但是不同的特征值。为的第一大特征值和 那 在哪里特征向量是 那对应 .相似度矩阵 是
SPM首先将网络划分为训练集和探测集,再将训练集划分为扰动集和剩余集。对于给定的训练和探测集的划分,我们计算10次独立模拟的平均值(8.)作为相似矩阵。
除了上面介绍的五个相似度指标外,对于更多相似性 - 评估方法,请参阅[42那43].
2.3.该方法
我们从重新研究精确度的定义开始我们的框架。假设是节点的相似性评分吗和通过预测方法获得仅基于训练集 那 训练集中随机选择的已有链接的相似度分布是否有分数 那和训练集中随机选择的不存在链接的相似度分布是否有分数 .由于训练集和探测集的随机划分,根据大数定律,探测集中的链路在高置信度下应与训练集具有相同的相似度分布[44那45].因此,在接下来的文章中,我们不会区分训练集和探测集中已有链接的相似度分布。根据统计理论,如果样本规模趋近于无穷,这个假设是合理的[44那45].由于经典方法只预测高分链接,因此该方法的估计精度较高被编写为 在哪里的大小 那 是一个常数,而且是所有可能链接的整套( ).是最高分。在实际方案中,预测列表的长度通常是探测器的大小[16),这就需要主持 .如果 在 ,精确度 .否则, 产生高精度。因为只有顶部的链接 -L.最高分数被预测为潜在链接,精度可以通过(2)[6.那16].方程(2)是比(更容易描述精度的公式。9.).
以前的链接预测方法大多只预测相似度高的链接。我们推广(9.),通过考虑不同相似点之间的联系。假设这与分数有关 作为潜在环节进行预测,其精度为: 在哪里 .限制预测列表的长度,前提是需要的 .注意,在最先前的作品中, 和等式(10)减少为(9.).我们的广义精确方程(10)考虑与高分和低分的联系。
主要问题是选择合适的集合在(10)以使精度最大化。我们提出了精度噪声比(PNR)来确定 那 在内线衡量与相同分数区分真实联系的能力。请注意,培训集中的非出版链接可以是探测集中的现有链接。给定具有相似性的训练中的一个不存在的链接 那它是探针集中存在的概率(即,精度)是 ,在那里 是一个常数。
我们框架的核心问题是使用预订号码以确定最佳得分集 .首先,采用传统方法仅根据训练集计算各环节的相似度。第二, 那 那和pnr.计算。第三,我们重新分配每个链接的分数 ,在那里为第一步得到的原始相似度评分。最后,我们按降序对链接进行排序并与顶部-链接L.分数被预测为潜在的联系[16那18].最佳得分集对应重新分配的分数排名在前-的原始相似度分数L.得分列表。
该框架可以引入不同类型的相似度评价。以CN相似度法为例,我们的框架如下:(1)将网络链接划分为 训练集和探头设置随机。(2)只根据训练集,用CN方法计算所有存在和不存在链接的相似度。(3)计算的内线 .将分数分成统一容器,并计算现有的容器数量()和不存在()链接位于每个容器中(即,计算离散 ).然后我们得到 .注意,如果 ,我们定义 .(4)获得训练集中不存在的环节的重新调整得分 .(5)通过选择链接来确定预测列表 最高分数 那并计算精度。
数字1描述了基于CN方法的框架。在得到链接的相似度分数后(图1(一)→1(b)),传统的CN方法根据分数直接预测潜在链接(图1(b)→1(d)),而建议的框架进行计算(数据1(b)→1(c)),然后根据修改后的分数预测潜在的链接(图1(c)→1(d))。
这个框架的一个重要性质是是根据 那也就是说, ,精确度可以充分利用给定的相似度评估方法的能力。是最佳变换功能 .这意味着无论我们如何用其他单变量函数转换相似度, ,精度性能不能优于所提出的方法 .来证明最优解 那请参阅补充资料中的第一部分。
3.实验结果
我们首先在Section中描述六个真实的网络3.1.本节给出了本方法与基线方法的精度比较3.2.最后,本节对不同方法预测的链路特性进行了研究3.3.
3.1.数据集
为了验证所提出的方法的有效性,我们衡量了我们在各种学科和背景的六个经验网络中衡量我们的框架:(1)电子邮件[46]:安然电子邮件通信网络涵盖了大约50万封电子邮件数据集内的所有电子邮件通信;网络节点是电子邮件地址,如果是地址发送至少一个电子邮件到地址 那该图包含来自的无向链接来 ;(2) PDZBase [47]:来自PDZBase的无向网络的蛋白质 - 蛋白质相互作用;(3)欧洲加载[48]:主要位于欧洲的国际电子公路网络;网络是无向的,节点代表城市,链接代表两个城市之间的电子道路;(4)神经(49的有向加权神经网络秀丽隐杆线虫;(5) USair [6.: 2010年美国各机场之间的直航网络;每条线路代表2010年从一个机场到另一个机场的连接;(6)蛔虫(49的代谢网络秀丽隐杆线虫.
不同的真实网络包含有向或无向、加权或非加权链接。为了简化这个问题,我们把所有的环节都看成是无向的和不加权的。此外,只考虑了这些网络中巨大的连接组件。这是因为,对于位于两个不相连组件中的一对节点,根据大多数预测方法,它们的相似度评分都是零。桌子1显示这些网络的基本统计数据。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.2.精度评价
在实验中,我们设置 这意味着网络被随机分为90%的训练集和10%的探测集。所有的实验都是50个独立模拟的平均值。
数字2显示USAir网络中五种不同方法的AUC和精度。在图中2而RA方法与CN、JB和SPM方法的AUC相似,但精度低得多。除了USair网络,其他真实网络中也存在AUC与精度的偏差(见图)。S1在补充资料中)。主要原因是AUC描述的是整个网络中存在的和不存在的链接之间的得分差异,而precision只计算top-的链接L.高的分数。具体来说,从分数分布的角度来看, .与(10),这两个指标的定义完全不同,导致它们之间几乎没有关联。
数字3.用CN方法显示了USair网络的PNR和现有和不存在链接的得分分布。在图中3(a),存在与不存在环节得分基本服从幂律分布。高分有时对应较低的PNR,尤其是在 (见图3 (b)).然而,一些较低的分数会达到较高的PNR,这表明对于训练集中不存在的链路,使用这个特定的分数,该链路很可能是探测集中已经存在的链路。对于得分高、PNR低的训练集中不存在的链路,探测集中不存在链路的概率很大。类似的现象在其他网络中也存在(见图)。S2在补充资料中)。因此,传统方法假设相似节点形成链接的可能性很大,而传统方法的基础在精确预测相似度低的链接方面面临着巨大的挑战。
(一)
(b)
数字6.显示所提出的PNR方法与基线方法之间的精度差异。我们所提出的方法在大多数情况下与原始方法相比,显着增强了精确度。由于网络大小有限,这些方法存在一些波动。桌子2给出了六种网络的最大精度增量。在表2,精度通过最大的传统方法获得方法,即和 .我们的方法在这六个网络中比最先进的方法更有效。此外,图4.显示探针集大小对精度性能的影响。结果表明,该方法优于传统方法 ,除JB方法外时 .其他网络也有类似的结果(见图)。S3在补充资料中)。然而,根据理论分析(见补充材料第一部分),我们的方法应该比经典方法更好,或至少与经典方法相同。原因是我们假设网络结构不受训练和探测集的随机划分的影响。因此,训练子网络应具有与原始网络相似的结构。这个假设是合理的很小。如果大小由于探测集较大,训练集与整个网络有很大的差异,这违背了我们方法的假设。因此,当探测集的比例很小时,我们的方法性能很好。
|
||||||||||||||||||||||||||||||||||||||||||
3.3.预测链接的特征
长链在网络动力学中起着重要的作用,对长链的预测具有重要意义[32那50].数字5.对Usair网络中JB和相应PNR方法的预测链接进行了比较。在图中5.,我们的方法预测了不同社区中遥远节点之间更多的链接,而原来的JB方法只预测了亲密节点之间的链接。[中的社区检测方法37]在图中使用5..然而,仅根据社区划分很难评价长期联系。由于长程链接通常距离较长,相似度较低,因此我们将使用我们提出的框架来研究预测链接的平均距离和平均相似度。
(一)
(b)
(c)
(d)
(e)
(f)
的距离的链接节点之间的最短距离是多少和仅基于训练集。由于预测链路的端点不直接连接, .预测链接的平均距离为 类似地,预测链接的平均相似度为 在哪里是节点的相似性吗和在培训集中。
数字7.显示通过PNR方法获得的平均距离和相应的原始方法的差异。通常,PNR方法比六个网络中的相应原始方法实现更高的平均距离,特别是对于电子邮件网络中的SPM和USAir网络中的LP,而对于许多情况,PNR和原始方法具有相同的平均距离 .这是因为大多数未连接节点的距离为2,说明最常用的方法倾向于预测三角形的边。因此,我们的方法对平均距离的影响很小。而对于神经网络和USair网络等稀疏网络,该框架提高了平均距离,特别是对于USair网络中的LP。以往的工作表明,长链的两个端点通常有很高的距离或很低的相似性。由于PNR框架可以增加预测链路的平均距离,因此可以推测预测的是更长的链路。此外,整合数据6.和7.,我们可以发现,我们的框架可以正确地预测更长期的联系。
(一)
(b)
(c)
(d)
(e)
(f)
此外,图8.显示了PNR方法得到的平均相似度与相应的原始方法的差异。在图中8.,PNR方法达到比六个网络中的相应原始方法更低的平均相似性,除了蛔虫网络中的RA方法。原因是由于网络的尺寸有限,PNR具有很大的波动,从而引起了蛔虫网络中RA的不寻常现象。类似于平均距离的分析,我们表明PNR方法有利于预测远程链路,这与图中的结论同意7..
(一)
(b)
(c)
(d)
(e)
(f)
4.结论
综上所述,我们系统地研究了基于相似度的链路预测方法的不足之处,并指出一些基于相似度的链路预测方法具有较高的AUC,但精度较低。基于现有链路和不存在链路相似度分布的差异,提出了一个度量指标(PNR)来解释AUC高而精度低的问题。两个得分特别低的节点之间也有很高的可能性形成联系。进一步证明了PNR是调节链接似然值的最优单变量函数。在实际网络中的实验证明了该方法的有效性,并大大提高了算法的精度。此外,该框架还可以降低预测链路的平均相似度,增加预测链路的平均距离,表明该框架可以正确检测出更多缺失的远程链路。
虽然所提出的方法调查单一网络中的链路预测,但它也可以推广到二分和其他类型的网络。更重要的是,我们的方法提供了一种新颖的方式来探索可能激发未来其他更好分数分配方法的真实网络的连接模式。
的利益冲突
两位作者宣称没有相互竞争的经济利益。
致谢
作者感谢Alexandre Vidmer博士富有成果的讨论和评论。国家自然科学基金项目(no . 61703281, no . 11547040);广东省自然科学基金博士启动基金项目(no . 2017A030310374, no . 2016A030313036);深圳市科技创新委员会项目(no . JCYJ20160520162743717, no . JCYJ20150625101524056, no . JCYJ20150625101524056)。JCYJ20140418095735561、jcyj2015073160834611、JCYJ20150324140036842、SGLH20131010163759789)、深圳市科技基金(JCYJ20150529164656096、JCYJ20170302153955969)、深圳大学自然科学基金青年教师创业基金、腾讯开放研究基金。
补充材料
在补充资料中,我们证明了PNR为第1节的最优传递函数。不同网络下AUC与精度的偏差见第2节。第3节给出了不同方法在不同网络中的PNR性能。在第3节中,我们首先绘制旅客订座号码然后在图S3中显示探针集大小对精度的影响。图S1(彩色在线),AUC和精度六个真实世界的网络(见表2)通过五种不同的流行方法。结果是50个独立模拟的平均值。在实验中,P.H= 0.1表示我们利用90%的现有边作为训练集来预测另外10%的边(探针集)。图S2(彩色在线),6个网络的五种不同方法的PNR。(一)电子邮件网络。(b) PDZBase网络。(c) Euroad网络。(d)神经网络。(e)蛔虫网络。(f) USair网络。结果是50个独立仿真的平均值,仅根据训练集得到。对于不同的方法和不同的网络,评分归一化到0~1S.新=(年代-S.最小值)/ (S.马克斯 −S.最小值).图S3 (Color online),精度差ΔP.作为探测器尺寸的函数P.H=信用证|E.|在四个网络,其中ΔP.这五种经典的PNR方法与相应的PNR方法的区别是ΔP.=P.的内线 −P.原始.δ.P.> 0表示我们的方法优于原始方法。在面板中,当P.H> 0.85,ΔP.> 0。(补充材料的)
参考文献
- J. Esquivel-Gómez, R. E. Balderas-Navarro, P. D. Arjona-Villicaña, P. Castillo-Castillo, O. Rico-Trejo, J. Acosta-Elias,《复杂网络中的岛屿的出现》,复杂,2017年。视图:谷歌学术搜索|MathSciNet
- W. X. Wang,Y.C.Lai和C.Grebogi,“基于数据的非线性和复杂动态系统的识别和预测”物理报告,第644卷,第1-76页,2016。视图:出版商的网站|谷歌学术搜索
- A.-L。巴斯“网络科学”,英国皇家学会哲学汇刊A:数学、物理与工程科学,第371卷1987年,货号。0375年,2013年。视图:出版商的网站|谷歌学术搜索
- t·g·刘易斯,网络科学:理论与应用,第8卷,约翰·威利和儿子们,2011。
- G. Chen, R. Mao, K. Lu,“大数据的并行计算框架”,计算机科学的前沿,第11卷,第5期。4, pp. 608-621, 2017。视图:出版商的网站|谷歌学术搜索
- L. Lü, L. Pan, T. Zhou, Y. C. Zhang, H. E. Stanley,“复杂网络的链接可预测性”,美国国家科学院学报,第112卷,第112期。8, pp. 2325-2330, 2015。视图:出版商的网站|谷歌学术搜索|MathSciNet
- 王,M. Y. Zhou和Z.Q.Fu,“基于节点普及的发展网络中的链接预测”。视图:出版商的网站|谷歌学术搜索
- L. Sharma和A. Gera,《推荐系统调查:研究挑战》,国际工程趋势与技术杂志(IJett),第4卷,第4期。第5页,1989-1992,2013。视图:谷歌学术搜索
- 卢建军,吴德胜,毛明生,王伟,张国光,“推荐系统应用发展综述”,决策支持系统,第74卷,第12-32页,2015。视图:出版商的网站|谷歌学术搜索
- W.-X。王的研究。“基于压缩感知的进化博弈数据的网络重构,”物理评论X, vol. 1, no. 12、文章编号021021,pp. 1-7, 2011。视图:出版商的网站|谷歌学术搜索
- z沈,W.-X。王玉琴,范玉琴,狄振中,杨玉琴。赖,“重建具有自然多样性的传播网络并识别隐藏的来源,”自然通信,卷。5,物品号。5323,2014。视图:出版商的网站|谷歌学术搜索
- 廖慧,曾安,周明,毛蕊,王博,“基于非线性评价投影的加权复杂网络的信息挖掘,”非线性科学与数值模拟通讯, vol. 51, pp. 115-123, 2017。视图:出版商的网站|谷歌学术搜索
- “基于信息理论的半监督特征选择算法”,《中国科学:信息科学》,2018年第4期。模式识别, vol. 61, pp. 511-523, 2017。视图:出版商的网站|谷歌学术搜索
- A. L.Barabási,网络科学,第四卷,剑桥大学出版社,2016年。
- 毛锐,张鹏,李旭东,刘旭东,“矩阵空间索引的主元选择”,国际机器学习与控制论杂志,第7卷,第5期2, pp. 311-323, 2016。视图:出版商的网站|谷歌学术搜索
- L. Lü和T. Zhou,“复杂网络中的链接预测:一项调查”,物理A:统计力学及其应用第390期6, pp. 1150-1170, 2011。视图:出版商的网站|谷歌学术搜索
- A. Zeng和G. Cimini,《消除复杂网络中的虚假互动》,物理评论E:统计、非线性和软物质物理,卷。85,否。3,2012年第ID 036101,2012。视图:出版商的网站|谷歌学术搜索
- V. Martínez, F. Berzal和j . c。Cubero,“复杂网络中链路预测的调查”,ACM计算调查,第49卷,第49期。4,货号。69年,2016年。视图:出版商的网站|谷歌学术搜索
- A. Javari和M. Jalili,“解决推荐系统多样性-准确性挑战的概率模型”,知识和信息系统,第44卷,第5期。3, pp. 609-627, 2015。视图:出版商的网站|谷歌学术搜索
- A. Javari和M. Jalili,“准确和新的建议:一种基于人气预测的算法”美国计算机学会智能系统与技术汇刊,第5卷,第5期。4、2015。视图:谷歌学术搜索
- 张鹏,王旭东,肖建军,“噪声环境下链路预测算法的鲁棒性度量,”科学报告,卷。6,第18881,2016项。视图:出版商的网站|谷歌学术搜索
- Z.Huang,X. Li,H. Chen,“联系预测方法协同过滤”第五届ACM/IEEE-CS联合会议论文集,第141页,美国科罗拉多州丹佛,2005年6月。视图:出版商的网站|谷歌学术搜索
- D. K. Lin,“相似度的信息理论定义”,刊于第15届机器学习国际会议的诉讼程序(ICML '15), 1998年第98卷,第296-304页。视图:谷歌学术搜索
- E. A. Leicht,P. Holme和M. E. J. Newman,“网络的顶点相似之处”,物理评论E:统计、非线性和软物质物理,第73卷,第2期2、文章ID 026120, 2006。视图:出版商的网站|谷歌学术搜索
- 刘Q.-M z。张磊Lü,周涛,“复杂网络中的链接预测:一个局部naïve Bayes模型,”EPL (Europhysics字母),第96卷,第2期4、文章ID 48007, 2011。视图:出版商的网站|谷歌学术搜索
- D. Heckerman, C. Meek,和D. Koller,“概率实体-关系模型,prms,和板块模型”统计相关学习导论,页201-238,2007。视图:谷歌学术搜索
- Yu K. Yu, W. Chu, V. Tresp, and Z. Xu,“随机关联模型在判别关联预测中的应用”,in chinese第20届神经信息处理系统年会(NIPS '06)的诉讼程序,第1553-1560页,2006年12月。视图:谷歌学术搜索
- A. Clauset, C. Moore, M. E. J. Newman,《阶层结构和网络中缺失环节的预测》,自然第453期7191页,98-101页,2008。视图:出版商的网站|谷歌学术搜索
- C. Zhou, L. Zemanová, G. Zamora, C. C. Hilgetag, J. Kurths,“由复杂大脑网络的功能连接揭示的等级组织”,物理评论快报第97卷第1期23、Article ID 238103, 2006。视图:出版商的网站|谷歌学术搜索
- P. De Meo, E. Ferrara, G. Fiumara和A. Provetti,“在facebook上,大多数关系都很弱,”ACM的通信(第57卷)11, pp. 78-84, 2014。视图:出版商的网站|谷歌学术搜索
- S. Aral,“弱关系的未来”,美国社会学杂志号,第121卷。第6页,1931-1939,2016。视图:出版商的网站|谷歌学术搜索
- 王旭东,陆伟,王超,陈超,“强关系与弱关系的社会推荐”第25届ACM信息与知识管理国际会议论文集,CIKM 2016,第5-14页,美国,2016年10月。视图:出版商的网站|谷歌学术搜索
- A. L.卡瓦诺,D. D.里斯,J. M.卡罗尔,M. B.罗松,《网络社区中的弱联系》,信息社会第21卷第2期2,页119 - 131,2005。视图:出版商的网站|谷歌学术搜索
- B. Ozenne,F. Subtil和D. Maucort-Boulch,“精密召回曲线克服罕见疾病中接收器操作特征曲线的乐观态度”临床流行病学杂志,卷。68,不。8,pp。855-859,2015。视图:出版商的网站|谷歌学术搜索
- J. M. Lobo,A.Jiménez-valverde和R. Real,“AUC:预测分布模型的性能的误导性衡量标准”全球生态和生物地理,卷。17,不。2,pp。145-151,2008。视图:出版商的网站|谷歌学术搜索
- J. Davis和M. Goadrich,“精度回忆和ROC曲线之间的关系”,刊于第23届国际机器学习会议(ICML’06)论文集,第243-275页,ACM,美国纽约,2006年6月。视图:谷歌学术搜索
- R. lambitte J. C. Delvenne和M. Barahona,网络中的拉普拉斯动力学与多尺度模块化结构、物理、2008。
- 廖H., M. s. Mariani, M. s. Medo, y . c。张,M.-Y。周,“在不断演化的复杂网络中的排名”,物理报告, vol. 689, pp. 1-54, 2017。视图:谷歌学术搜索|MathSciNet
- J. a . Hanley和B. J. McNeil,“接受者工作特征(ROC)曲线下面积的含义和使用”,放射学,第143卷,第2期。1,页29-36,1982。视图:出版商的网站|谷歌学术搜索
- I. R.邓斯莫尔和S.盖瑟,《预测推理:导言》,皇家统计社会杂志。A系列(社会统计)第158卷第1期1,第191页,1995。视图:出版商的网站|谷歌学术搜索
- J.L. Herlocker,J.A.Konstan,L. G. Terveen和J.T. Riedl,“评估协作过滤推荐系统”,“信息与系统安全学报,卷。22,没有。1,pp。5-53,2004。视图:出版商的网站|谷歌学术搜索
- L. Getoor和C. P.Iehl,“链接采矿:调查”,SIGKDD探索时事通讯,第7卷,第5期2,第3-12页,2005。视图:出版商的网站|谷歌学术搜索
- M. A. Hasan和M. J. Zaki,“社交网络中的链接预测调查”社交网络数据分析, pp. 243-275,施普林格,美国纽约,2011。视图:谷歌学术搜索|MathSciNet
- C. C. Heyde, "强大的大数定律的补充"应用概率杂志,第12卷,173 - 175,1975年。视图:出版商的网站|谷歌学术搜索|MathSciNet
- K. L. Chung,《强大的大数定律》启荔涌作品选集,页145-156,2008。视图:出版商的网站|谷歌学术搜索
- J. Leskovec, K. J. Lang, A. Dasgupta,和M. W. Mahoney,“大型网络中的社区结构:自然集群规模和大型定义明确集群的缺失”,互联网上数学,第6卷,第2期1,页29-123,2009。视图:出版商的网站|谷歌学术搜索|MathSciNet
- T. Beuming, L. Skrabanek, M. Y. Niv, P. Mukherjee,和H. Weinstein,“PDZBase: pdz域的蛋白质-蛋白质相互作用数据库”,生物信息学第21卷第2期6,第827-828页,2005。视图:出版商的网站|谷歌学术搜索
- L. Subelj和M. Bajec,“使用平衡传播的健壮网络社区检测”,欧洲的物理杂志B,卷。81,没有。3,pp。353-362,2011。视图:出版商的网站|谷歌学术搜索
- 科布伦茨-兰道大学,"科布伦茨网络收藏,"http://konect.uni-koblenz.de/networks/.视图:谷歌学术搜索
- 王旭峰、陈刚,“复杂网络:小世界、无尺度和超越”,IEEE电路和系统杂志,第3卷,第2期。1,页6-20,2003。视图:出版商的网站|谷歌学术搜索
版权
版权所有©2017 Ming-Yang Zhou等人。这是分布下的开放式访问文章创意公共归因许可证,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。