文摘

研究社交网络上的峰值在当前大数据的时代,尤其是在计算机领域的研究。链接预测在社交网络吸引了越来越多的研究人员。然而,大多数的研究都集中在可见的预测用户之间的关系,忽略了无形的存在关系。可见的关系一样,无形的关系也是社交网络不可或缺的一部分,他们可以发现更多潜在用户之间的关系。为了更好地理解无形的关系,定义、类型和特点,本文介绍了无形的关系。也是一个影响算法推测用户之间无形的边缘的存在。该算法是基于三个指标,即偶尔的接触程度,感兴趣的重合度,流行的用户和需要的影响作为参考。通过与阈值比较, ,提前定义,用户比的关系 被视为拥有无形的关系。算法的可行性和准确性还通过大量的数值试验证明与一个著名的和广泛使用的方法,即。,常见的邻居(CN)。

1。介绍

科技的进步使沟通更方便,特别是即时通讯软件和移动网络的发展。人们可以与他人分享和发布他们的经验交流。真正实现自动生成的数据和大数据时代已经到来1]。作为一个伟大的应用程序在大数据时代,社交网络吸引了很多忠实用户的强大的社会功能。通过分析社交网络中的数据,用户可以获得的信息可以帮助为用户提供更好的个人服务,例如,推荐的网页或货物或预测的新链接(2]。在这些应用中,预测潜在的问题联系近年来吸引了越来越多的关注(3- - - - - -5]。然而,现有的研究在可见的链接预测主要集中在预测用户之间的关系,忽略了无形的存在关系。看不见的关系是一种秘密的关系存在于社交网络,不希望被发现。的发现为特殊用户看不见的关系是一个警告,但重要价值的其他用户的社交网络。例如,两个人,从事特殊工作,总是通过公众传递信息(例如,广告牌)或参与一些常见的话题,但他们从来没有直接相互作用。如果它们之间无形的关系发现,这可能会暴露自己的真实身份和导致一些可怕的后果。然而,如果这些用户恶意,暴露他们的无形的关系可以帮助为真正的用户提供一个更安全的网络。因此,无形的关系的预测可以帮助建立一个安全的环境,更好地保护真正的用户在社交网络。

理解和预测无形的在社交网络上的关系,我们首先介绍的定义、类型和特点,无形的关系。然后,我们提出一种新颖的算法,推测影响无形的存在关系。特别是提出了三项指标计算两个用户之间的影响,即。,偶尔的联系程度、兴趣重合度和用户的欢迎。

总结了本文的主要贡献如下:(1)不同于现有的链路预测方法,重点放在可见的在社交网络上的关系,我们首先存在看不见的定义不同的用户之间的关系。无形的关系的预测是一个重要的补充预测在社交网络上的链接,可以帮助提高社交网络的安全(2)预测不可见的用户之间的关系,我们提出一个基于三项指标的影响算法,即。,偶尔的联系程度、兴趣重合度和用户的欢迎。

剩下的纸是组织如下。”相关工作”介绍了相关工作对个人的影响和链接预测。”看不见的关系“描述了定义、类型和特点的无形的关系。”影响算法“提出了一个影响算法预测无形的用户之间的关系。实验结果和分析报告”实验设计与分析”。“结论“总结提出无形的关系和预测算法,并讨论了未来的工作。

个人影响的研究主要集中在程度上,亲密,中间性[6,7]。Chintakunta et al。8)提出了届社会资本市场的方法来找到有影响力的节点在一个社交网络。在这种方法中,分配值表示个人社会资本。Subbian et al。9)提出了一种矩阵该方法测量节点的影响。刘等人。10]介绍了trust-oriented社会影响力的方法来评估个人的影响力。邓et al。11)评价不同节点的影响通过结合时效性方面与节点的特点。王等人。12]研究了微博意见领袖的影响分析和建模的信息传播。曹et al。13)提出了一个名为MFP的识别算法(多功能PageRank),用于识别意见领袖。

研究链接预测可以分为不同的类别。以前的工作的主要方法是基于马尔可夫链(14,15和机器学习16]。目前,研究方法基于网络结构可分为三类,即。相似,最大似然估计、概率算法。Jaccard指数(17,18)是最早的本地链接Jaccard在1901年提出的预测算法。2003年,亚当的et al。19]提出了基于逆相似性方法对数频率发生用户和预测之间的关系的相似性。接下来,Liben-Nowell [20.]提出了著名的共同邻居指数(CN)。周et al。21]提出了RA(资源配置)相似性度量来预测失踪链接网络。最近,徐et al。22)提出了CRA指数算法来预测基于节点属性的隐藏链接和本地信息。王等人。23)提出了一个新颖的索引链接预测基于拓扑信息和社会信息。该方法计算的可能性之间的联系两个断开连接的节点的相似性指数。太阳et al。24)提出了一种新颖的相似性指数叫拉斯维加斯方法,认为不仅共同的邻居节点,而且他们的社区结构。穆尼斯et al。25)结合上下文、时间和社交网络拓扑信息的链接预测。徐et al。26]分析了不同节点之间的交互的动态属性,提出了一种分布式时间链接预测方法,它使用的标签传播更新标签的相似度值。Das et al。27链接预测提出了马尔可夫预测模型。该方法考虑了影响的时间尺度和预测基于时变图像的链接。王等人。28)提出了一种融合概率矩阵分解框架来预测隐藏链接,既考虑对称度量和不对称的度量。商等。29日,30.)讨论时间的作用,提出了在进化网络链路预测的方法。Rafiee et al。31日]提出了CNDP)方法链接预测基于共同邻居处罚程度,决定了相似性得分相结合的共同邻居两个节点和网络的聚类系数。此外,Zhang et al。32]讨论了两偶图链接预测和提出了一个新颖的方法基于属性提取和相似度计算的节点。

从上面的研究。这项研究的好处旨在探索社交网络用户之间的关系,介绍了无形的关系和相关的概念定义和详细解释。此外,偶尔的联系程度,利益重合度,人气和用户定义来衡量无形的关系。链接的随机性可以表示为偶尔的联系程度,和兴趣重合度类似于同质性暗示的谚语“物以类聚,鸟以群分,物以类聚”和用户可以通过用户之间共同的邻居了。获得的无形的用户之间的关系可以通过分析偶尔的联系程度,利益重合度,和用户欢迎。该理论可以广泛应用于许多领域的社交网络,包括浓缩和完美的用户之间的关系。

3所示。看不见的关系

讨论方便,社交网络被表示为无向无环图,表示 ,在哪里 代表的网络节点和边的集合,分别。

3.1。定义

无形的关系不同于可见关系广泛在先前的研究学习。要理解无形的关系,给出了两种关系的定义如下:

定义1。可见的关系。这指的是真正的连接关系,一个用户在社交网络测量。这些用户被称为可见边缘之间的边缘,指出 并表示为公式(1)如下: 在哪里 代表用户的朋友收集节点v。

可见关系是普遍的社交网络用户之间的联系。作为人际关系的扩展和反映在现实生活中,社会网络通常显示可见的与亲戚和朋友的关系,在某种程度上,他们交朋友可以满足用户的需求。

然而,看不见的存在关系将为用户提供更多的潜在联系。

用户在社交网络的经验,一些可能有其他用户的意见和想法与自己的想法,或由其他未知的用户就能满足他们的需求。这是一个似乎不存在的关系是无形的关系。此外,社交网络正变得越来越开放,展示一个奇怪的社会矛盾和社会网络关系。以微信为例。微信会添加到活动,一样的宴会。熟悉和陌生人之间的差别逐渐消失。没有朋友的“朋友圈”和“人际关系”消失。

无形的关系可以视为一个弱关系在某种意义上。

定义2。看不见的关系。这指的是用户之间的关系,并不代表社会网络图,但这可以帮助一个人的社会生活。

用户之间的关系是一个内在和薄弱环节。

边缘用户之间无形的关系被称为无形的边缘,指出 和计算方程(2)如下: 在哪里 代表用户的影响强度建立无形的关系;一个特定的定义将在下一小节中介绍。 是一个预定义的阈值。

此外,为了有一个无形的关系的深刻理解,从不同的观点,看不见的边缘由以下给出的两种意思:

图论的观点。没有直接表示在社会网络拓扑测量,但它会影响用户的行为,从而使链接用户建立新的链接(不一定有直接的联系,类似于同一社会群体用户可以相互通信,如QQ群)。这样的边缘可以被称为无形的边缘。

视图的用户目标。之间没有连接或直接连接用户,但有一个共同目标或共同利益,能够实现目标,最终实现“双赢”的局面。这些用户之间的边缘被称为无形的边缘。

看不见的关系的概念引入社会网络在这一节中,因此,社交网络图的链接设置可以扩展和丰富详细的分类。然后,边集 社会网络图 可以表示为公式(3)如下:

3.2。类型

有形的和无形的目标用户之间的关系。拥有更多的潜在价值的用户看不见的关系连接。他们不仅能反映潜在朋友关系也是用户的个人信息(例如,潜在的类型和利益的朋友,和有针对性的用户可能会影响到什么样的朋友)。更好地研究无形的关系,根据不同的表现,我们将看不见的关系分为三种类型,即三角形关系,共同利益和demand-interest类型。

3.2.1之上。三角关系类型

在社交网络链路预测的研究中,一个三角形结构是常见的拓扑图形。相似三角形结构,一个三角形关系类型(也叫普通朋友类型)是最简单的形式的无形的关系。也就是说,可能会有看不见的用户共同的朋友之间的关系。

如图1、节点一个,B,C是三个不同的用户在社交网络。用户一个是一种常见的用户的朋友吗BC(图中的实线所示,下同)。然后,用户之间可能存在一种无形的边缘BC(图中虚线所示,下同)。普通朋友的无形的关系类型是容易理解的,但考虑到相似三角形结构可见关系,用户与用户等共同的朋友BC更有可能建立可见的关系。这是无法突出无形的存在关系。因此,更多的是注意以下类型。

3.2.2。共同利益类型

人们的社会生活产生的社会群体。随着社会生活的延伸,社交网络也不例外。同质性暗示的谚语“物以类聚,鸟以群分”也适用于社交网络。是相同的同质性,使得用户的兴趣倾向于建立无形的关系。共同利益的无形的关系类似于社会利益,但细节是不同的。用户属于兴趣社交将建立连接,在某些方面,例如,一个在线社区。看不见的用户之间的关系是内在的,清单的无形的关系问题,建立连接。

此外,即使建立了一个社区,如果用户之间没有直接的联系,它仍然可以被认为是一种无形的关系。也就是说,无形的概念是比利益更大、更具体的社会关系。

如图2、利息1和兴趣2是两个不同的利益集团(为了简化表示,我们只画出无形的关系的兴趣1)。用户一个BDE分别是朋友。

由于各种原因,如地理位置、用户B,C,E和用户一个,C,D没有直接接触,但属于同一个组命名的兴趣1。因此,用户BECD可能看不见的关系(也可能用户一个C;在的关系图仅仅是一个例子)。

共同利益是最常见的一种无形的关系类型。在科学研究中,在社交网络链接预测作为一个例子,有一个无形的关系研究人员而言,对这个方向很感兴趣。一个共同的研究兴趣可以让研究人员相互交流和讨论,如有关报纸的发行量和召开专题会议。

3.2.3。Demand-Interest类型

我的敌人的敌人是我的朋友。从共同的目的,demand-interest类型的无形的关系。例如,如果用户一个是用户的敌人B和用户C与用户吗B由于某种原因(如利益和纠纷),还有一个看不见的用户之间的关系C和用户一个

demand-interest类型定义的视图的用户的目标无形的关系。一个释放他或她的需求,完成其他用户有能力或只是对它感兴趣。这些用户完成自己的最终目标,每个需要他所需要的。具体的形式显示在图3

由于缺乏能力和兴趣,用户F在利益集团的利益2需要问其他用户指导和帮助完成一个任务。用户E有能力来满足需求。然后,有一种demand-interest无形的用户之间的关系E和用户F

与常见的朋友类型相比,demand-interest类型相对较少,但这也是一个常见的无形的关系。在线开放课程的教师和用户之间的关系是一个典型的demand-interest关系。老师的讲座感兴趣;与此同时,用户需要这门课程可以获得相关的专业知识。

3.3。特征
3.3.1。普遍性

一切都是相关的,人们在社会生活一样。根据小世界的原则(也叫6度分割理论)33),世界上任何两个陌生人在六人可以建立一个连接。也就是说,一个人可以知道任何陌生人通过五人最多。

例如,对于整个世界,可能没有直接连接在两个特定的人(比如中国和中国以外)。然而,生活在地球村是一种看不见的两个人之间的关系尽管泛化。因此,无形的关系是无处不在的,这就是为什么它有以下特点。

普遍性是无形的存在关系的前提和基础。

3.3.2。弱连接

用户看不见的相互关系是相对独立和共同需要,,每个人都需要他或她所需要的。有必要指出,“弱”(类似于[疲软的领带34)这是相对于可见关系的“强大”。弱连接的固有属性无形的关系。

弱连接的存在,使朋友常见的用户有一个较低的可能性拥有无形的关系。

3.3.3。随机性

用户建立无形的关系有强烈的主观意识。他们会根据他们的需要与他人建立联系或利益,甚至是突发奇想。

随机性是用户的主观意识的反映。随机性是不可或缺的无形的关系的属性。

3.3.4。瞬态

看不见的边缘可以存在”。“当他们使用时,他们出现;否则,他们是隐式的。边缘在链接预测是真实的或将存在。这无形的边缘的显著特性是明显不同于可见边缘。

集资”就是一个典型的例子。有看不见的集资”的发起人和参与者之间的关系。后出现在集资”和消失集资”的关系。许多集资”参与者之间的关系也有这个特点。

无形的关系的猜想在社交网络是链接推理和预测之间的问题。无形的和可见的内在关系是用户之间的连接。相对于后者,前者是不稳定的,所以有必要推断它们的存在。因此,他们的属性链接推理。用户看不见的关系更容易建立直接联系。因此,他们也有链接预测的属性,与无形的建立用户之间的链接关系的问题可以看作是无形的边缘的显式表示。

因此,无形的关系的猜想可以引用或使用链接推理和链接预测方法和算法。

本文关注共同利益的无形的关系,在一个相关的概念,设计了一个方法来推测其存在。

4所示。影响算法

推测存在的无形的关系,基于以前的链接推理和预测研究,考虑随机性和弱连接用户的同时,提出了三个指标:偶尔的接触程度,感兴趣的重合度,用户的受欢迎程度。此外,猜想无形的关系的影响算法建立了基于综合指数三个指标,即。影响因素。

4.1。偶尔的接触程度

看不见的关系的建立具有随机性。的偶尔的接触程度是用来衡量这随机性。

定义3。偶尔的接触程度 这是指用户之间建立随机连接的可能性uv在一个社交网络。也就是说,用户之间友谊的随机性是衡量

随机性是用来反映用户的主观意识,这通常是由随机数的算法。因此,偶尔的接触程度用户之间可以通过生成随机数;它可以表示为公式(4)如下: 在哪里 是间隔值生成, 区间的下限和吗 是上界, 分别代表矩阵的行和列。 表示随机用户之间的联系的可能性,所以 初始化0, 初始化1。为了确保用户连接之间的平等的概率,让 是一个矩阵服从均匀随机分布。

偶尔的接触程度是第一步来衡量用户之间的联系。这是一个反映用户的主观意识。因为看不见的关系的普遍性,偶尔的接触程度被设置为一个随机的统一矩阵为了避免巨大差异。

4.2。感兴趣的重合度

用户感兴趣的程度可以看出他对它的理解。和理解的程度反映在用户的描述。

顾名思义,感兴趣的重合度措施之间的相似用户感兴趣的观点。度的用户 感兴趣的东西可以衡量吗

定义4。感兴趣程度 这指的是用户 有兴趣在一个特定的事情。它可以测量的总观点比描述的除以所有用户用户的观点 他形容它。具体表达式见方程(5)如下:

在方程(5), 代表了视图描述的用户 是感兴趣的, 是一组视图所描述的所有用户感兴趣一样。类似于盲人和大象, 是一个盲人摸大象的一部分,例如,耳朵,而 是指部分盲人所感动,包括耳朵,尾巴,和鼻子。

事实上, 可以看作是用户感兴趣的点。因此,感兴趣的重合度被定义为以下几点:

定义5。感兴趣的重合度 这指的是产品的利益点不同的用户对同一件事重叠,他们注意到它。如果有超过一个有趣的事情,他们必须添加。的感兴趣的重合度任意两个用户之间可以通过公式(表示6)如下: 在哪里 代表比例,用户之间的重叠数量的兴趣点u和用户v需要在所有用户的兴趣点和用户表示关注u支付的事情 它将在以下部分中定义。很明显,

根据公式(6),很容易看到,当用户uv完全不同的利益集团,是吗感兴趣的重合度他们之间是0,符合实际情况。

感兴趣的重合度第二步是猜想无形的用户之间的关系。它可以用来衡量不同的用户之间建立一种对话的可能性。度越小,越少的共同利益的可能性。的感兴趣的重合度是一种共同利益的重要体现无形的关系。

4.3。用户的受欢迎程度

是否一个人受欢迎的评论可以反映在他周围的人。用户的受欢迎程度是用来分析用户之间的影响。也就是说,其他用户的认识程度和评论的目标用户。

定义6。用户的受欢迎程度受欢迎的。这指的是用户v对用户产生影响u或程度的用户v熟悉用户u。此外,受欢迎的的用户u见公式(7)如下: 在哪里 受欢迎的的用户u, 意味着的数量u的学位。用户的受欢迎程度可以通过用户之间的共同朋友的数量u和用户v除以受欢迎的的用户u。因此,受欢迎程度该用户u用户很受欢迎v可以被定义为公式(8)如下: 在公式(8), 意味着用户之间共同的朋友的数量uv

用户的受欢迎程度了解目标用户是一个重要的方法通过测量共同朋友的影响。

即使在同一组,对不同的用户有不同的影响,所以它是必要的,以确定具体的目标用户在计算用户的受欢迎程度

4.4。影响算法

之间有一定的逻辑先进性偶尔接触程度、兴趣重合度,和用户欢迎。

为用户一个B,偶尔的联系程度时使用的用户一个需要知道用户的存在B和想知道B。然后,如果用户使用的兴趣重合度一个需要知道一些关于用户的信息B判断他们是否有一些共同点。接下来,用户普及用于知道目标用户的评论,这是由用户的共同朋友一个B

众所周知,链路预测是一个复杂的过程,它需要用户确认,用户之间一定有一些共同点。因此,我们设置一个指数用影响平衡的三个指标来衡量无形的关系。

定义7。影响因素 这是指用户间建立连接的影响因素,考虑到随机性,同质性、和受欢迎程度建立链接。这是一个综合指数用来衡量用户看不见的关系,这是偶尔的接触程度的妥协,重合度,和用户欢迎,表示为公式(9)如下:

在公式(9),参数 设置为3基于邓巴的研究[35)和6度分割理论。邓巴发现,一个人的核心圈可能有三个或五人;他们是人的最亲密的朋友。接下来,有12到15人,他的死会给人带来沉重的伤害。然后,有50人。数量增加乘数约为3,和朋友一人的数量不超过150人。6度分割理论指出,一个陌生人可以被5人。因此,如果6号被认为是属于一个人的核心朋友的平均数量,6是150多的多维数据集。因此,它是合理的 为3。

无形的关系是不确定的,它的存在可以猜测的可能性,指出 和计算公式(10):

阈值 设置确定无形的存在关系。为了方便起见, 价值的定义是指 的价值 接近 使不同,它是固定的,这样可以方便观察其他指标的变化。当 ,可以被认为是无形的存在关系。另一方面,无形的存在关系被认为是小概率事件,可以忽略据小概率事件的特性。

猜想无形的关系,影响算法建立了基于影响因素。

然而,在使用影响算法之前,它需要用户信息预处理。用户信息可以分为用户节点和兴趣属性。然后,分别两部分需要处理。

用户节点的过程如下:(1)生成矩阵偶尔接触程度根据用户节点的数量和保持矩阵的行和列之间的通信和用户节点(2)生成一个基于用户节点的邻接矩阵对,并确定用户之间共同的朋友。

用户兴趣属性的过程如下:(1)用户分为不同的利益集团数字化根据兴趣属性(2)计算用户之间的利益重合度。

因此,影响算法的主要步骤描述如下:(1)生成矩阵的基础上连接偶尔的联系程度(2)处理用户的属性,然后产生兴趣重合度的矩阵,感兴趣(3)分析常见的朋友的数量和获取用户欢迎(4)生成矩阵的影响基于影响因素来自①②③(5)比较元素的影响 然后生成矩阵的无形的关系。

具体的过程如图4

5。实验设计与分析

以验证算法的可行性和准确性影响,四项指标。他们是用户朋友的数量,率的测定,假阳性,假阴性(引用定义1011)。此外,由于CN比其他算法具有较高的鲁棒性和稳定性,以CN为比较法、实验设计和实现。实验数据集合被称为(36]叫Hamsterster友谊。他们是无向、非循环和无关紧要的,他们表示用户在web上命名之间的友谊http://hamsterster.com。平均程度几乎是13.492。实验上实现这个数据集。实验环境包括英特尔(R)的核心(TM)(电子邮件保护)GHz (3.20 GHz);8.00 GB内存(1600 MHz);联想联想- ssd st600 - 240 g(东芝DT01ACA100 1 T);版本,和微软Windows 64位操作系统。用MATLAB R2015a实现算法。与此同时,Excel 2013用于选择和数字化文本。然后,影响算法的可行性和准确性进行验证用户朋友的数量,determinatio率n,错误的是西班牙文,假阴性。测量的决心,因为实验数据是静态的,主观逻辑介绍模拟网络中动态变化的关系。数据和计算得到的数据与识别。最后,使用主观逻辑的公式计算结果。

5.1。实验方法的特殊性

在以前的实验中,数据集通常被分为训练集和测试集,训练集是发现规则和遵守规则测试集进行了实验。这个实验是与之前不同。主观逻辑被介绍给马克的数据模拟的动态变化关系。然后,影响算法被用来预测无形的关系,并分析了影响算法的性能用户朋友的数量,率的测定,假阳性,假阴性。用户兴趣属性是影响算法中的一个重要组成部分。兴趣属性通常是文本数据,他们很难像以前一样分为两部分(前一个数据集只是数字化数据)。此外,很难代表数字形式的规则从文本数据中获得。因此,实验的设计是合理的。

5.2。主观的逻辑Jøsang

指的是这本书(37),相关知识介绍了主观逻辑。提出的主观逻辑Jøsang [38)是用于表达主观不确定性,它取得了丰硕的成果。

主观逻辑是基于β描述二项式的后验概率分布的事件。一个积极的事件数量 和消极的事件数量 观察到的事件给出计算确定的概率密度函数。密度函数的基础上,每个事件的可信度产生的计算实体。主观逻辑可以更实际的建模和分析现实世界比传统概率微积分和概率逻辑。当主观逻辑用于决策支持,使决策者能够更好地评估未来结果的不确定性的影响,及时做出改进。从实验中获得的数据是静态的,他们不能分析关系的动态变化。

因此,主观逻辑是用来模拟网络的动态变化关系。为了简化计算,最简单的主观逻辑是使用和计算方程(11): 在哪里 先验概率和设置为0.5, 代表相信概率的值, 代表的值的概率不信, 表示的用户数量有关系,和 表示用户的数量,没有关系。在这里,

在实验中,样本的大小是1800,和经验的限制可以由公式(11)。也就是说, 使实验结果更有说服力,朋友的数量预计约等于号 条件是实验的数量接近极限,计算公式(12): 在哪里 表示用户的数量,可以推测算法的影响。计算公式(12)的值 大约44。众所周知,节点的平均度大约是13.49, 可以减少到13在相同的比例。然而,由于存在的随机性,不能保证13确切数值。因此,的数值 控制10至20。

5.3。数据处理

它是有价值的收集用户的利益属性数据,因为它可以帮助推测无形的关系。由于用户兴趣属性数据是文本,他们需要preprocessed-text数据可以处理自然语言处理(NLP)的帮助。NLP和文本分析问题,袋子里的单词(鞠躬),字嵌入两种常用算法。只能代表单个词词向量。它需要做一些额外的处理来处理文本。弓是用于处理文本基于词频,忽视语序和语法,这是必要的实验。Kim-Kwang和雷蒙德Choo et al。39]提出的无监督和监督的方法在不同的数据集,进行了微博使用他们的实验方法,取得了较高的精度。每个属性视图对一个人有自己的重要性,和其他计算相关文本的指状突起。确保以下实验的准确性和可靠性,文本是手动使用Excel 2013数字化文本处理。

的基础上根据用户感兴趣的属性,一个能人的原则总是忙碌和能源是有限的,用户与多个利益的具体利益分配如下:

假设用户利益的总分类 ,然后loc的值分配给这些利益紧随其后 ,在积极的 轴的方向。因此,关注 用户的特定利益 计算公式(13)如下:

指状突起的文本后,具体的实验操作进行根据方法在本文的第四部分。2000个节点被选为实验样本;然而,结果可视化非常密集,很难观察实验的效果。因此,可视化的数据分为组与50个节点组。此外,与CN可以突出影响算法的可靠性。

5.4。Preexperiment

网络数据集四种方法进行了测试,除了Hamsterster友谊,USAir数据集,路由器和酵母(http://www.linkprediction.org/index.php/link/resource/data)是包括在内。我们在四个数据集计算AUC的准确性。十个实验的平均结果列在表中1

如表所示1USAir和Hamsterster数据集,CN的AUC是大于Jaccard。路由器的数据集,CN的AUC是更好的比AA。酵母数据集,CN的AUC是最好的四种方法之一。因此,我们可以得出结论,CN可以工作在四个数据集。

5.5。实验结果分析

本节主要分析实验的统计结果。通过比较与CN,影响算法的可行性和准确性进行了分析用户朋友的数量,率的测定,假阳性,假阴性

5.5.1。用户朋友的数量

我们分析的朋友发现的三种方法,即,original, CN, and the influence algorithm proposed in this paper. It can be seen from Figure5的趋势预测的算法的用户朋友的数量是相似的。CN预测链接根据规则的朋友有共同的朋友,所以增长的趋势与初始数量的趋势是一致的。影响算法的一致性验证其可行性。此外,朋友预测的影响算法的数量高于CN在大多数情况下,,影响算法的稳定性更好。对不同稳定性的原因是CN的结果取决于最初的数字,因为它必须使用原用户找到其他的朋友。原始用户的数量是CN的数量可以预测的基础。

5.5.2。率的测定

定义8。确定数量 这是指用户总数确定关系。也就是说,用户朋友或nonfriends标记。

定义9。的决心。这指的确定程度的关系预测的算法,它可以获得朋友的数量除以数量确定预测和确定关系。

实验使用样本,和50个节点随机选择可视化。结果如图所示6。根据主观逻辑标记节点,在影响矩阵,值大于阈值的节点 有确定关系,节点值低于阈值 (小概率事件)标有nonrelationship决定。在计算测定时的影响算法根据公式(11), 代表用户的数量的比例确定友谊接受用户的数量,可以预测的算法。和“决定”是指节点被主观逻辑。同样的, 表示用户的数量的比例确定nonfriendship接受用户的数量,可以推测的算法。

我们可以知道从“主观的逻辑Jøsang“决心率可以被认为是平等的在极端情况下。在同样的限制,确定影响算法的速度高于CN;这里有三种情况:(1)当分母是相等的,分子 影响算法的大于CN(2)当分子一样,分母 影响算法的低于CN(3)当分母和分子是不平等的,算法是影响相对更大的分子和分母是相对较低。

我们可以从公式(猜想11),以上三种情况可以确定影响算法的速度比CN。换句话说,影响算法具有更高的准确率和较低的错误率。 与坚定的友谊,代表用户的数量更大 是,更准确的结果。 表示用户的数量与nonfriendships决定。某个最大,大 是较低的 是,所以决心率相对较低。因此,我们可以得出结论,影响算法比CN更可靠。

5.5.3。假阳性和假阴性

定义10。假阳性 这是指用户的比例关系但nonrelationships评判 ;它是用 它是由方程(计算14)如下: 在哪里 代表用户的数量预测没有关系但有关系,和 表示用户的数量预测关系但nonrelationships标记。

定义11。假阴性 这是指用户确定的比例关系而不是预测 ;它是用 它可以被制定为(15)如下: 在哪里 代表了不可预测的用户数量关系和有关系,和 表示出乎意料的用户数量没有关系和nonrelationships标记。

假阳性和假阴性常用指标测量方法的准确性。从定义1011,很明显,有两个部分的分子。无论是假阳性或假阴性,公式的分母都是确定数量 然后,分子越大,结果就越大。CN和影响算法的实验结果如图78。如数据所示78的结果,在大多数情况下,CN高于影响算法的结果。这说明了出乎意料的和用户衡量CN超过影响算法的结果(通过增加用户的数量之和与关系标志着用户的数量没有关系的关系而nonrelationships标记)。此外,用户错误的数量取决于CN也高于对算法的影响。因此,CN低于影响算法的准确性。也就是说,影响算法比CN更可靠。

6。结论

链接预测是社交网络的一个重要研究领域。看不见的关系提出了将在社交网络上的链接更详细和丰富。同时,无形的关系的建议提出了新的人际关系研究的可能性,即。,这可能是人们之间的关系似乎没有连接。无形的社交网络用户之间的关系,分析的定义、类型和特点,介绍了无形的关系。此外,影响算法预测用户看不见的关系,基于偶尔接触程度、兴趣重合度和用户的欢迎。Hamsterster友谊数据集上的实验结果表明,该算法是影响有效地预测并优于CN基线无形的关系。

无形的关系是一个非常重要的不容忽视的社会网络关系,预测无形的关系值得进一步研究和扩展。在未来的工作中,我们将考虑节点拓扑属性和社会网络和提出的方法来预测在多个社交网络无形的关系。

数据可用性

http://konect.uni-koblenz.de/networks/petster-friendships-hamster

附加分

声明。本文扩展版本的手稿发表在2018年13日亚洲联席会议在信息安全(AsiaJCIS)。它们之间有一些差异:首先,本文增加了一些相关工作和引用;其次,本文指定算法的过程;第三,本文preexperiment补充道。

的利益冲突

作者宣称没有利益冲突。

确认

这部分工作是河北省自然科学基金的支持下,中国(F2016201244号和F2020201023)和河北省的社会科学基础,中国(HB18SH002)。