文摘

人际关系是由社会events-people互动,交流信息,分享知识和情感,并收集来自大众媒体的新闻。在人类记忆这些事件留下的痕迹,这取决于认知因素的力量如情绪和注意力。每个跟踪随时间不断削弱,除非另一个相关的事件活动加强它。在这里,我们介绍一个小说cognition-driven社交网络(CogSNet)模型,占社会知觉的认知方面。模型显式地表示每个社会互动作为人类记忆跟踪相应的动力学。跟踪是唯一衡量的力量的相互作用对一个人的影响。为了验证,我们将我们的模型应用到NetSense数据在社会大学学生之间的交互。结果表明,CogSNet显著提高质量的社交网络建模的人工交互。

1。介绍

有一个基本的区别为代表的社会活动方式目前网络分析师和他们被人感知和认知加工的方式。在前者,离散事件的性质被保留和社交网络边缘的重量每更新一次相关事件。相比之下,在人类记忆感知的事件不断随时间变化。此外,跟踪的初始强度取决于认知因素定义参与者的心态和特定方面的交互。决定是否启动、维护或中止社会关系包括认知过程操作所有相关信息存储在记忆的痕迹在特定的时间尺度。

然而,迄今为止,没有模型,准确地代表社会关系的动力学严格通过相应的人类记忆的痕迹。为了解决这个差距,我们引入一个新的cognition-driven社交网络(CogSNet)模型,捕捉人类记忆的影响感知积累的事件和决策形式,维护,或溶解的社会关系。模型中显式地表示人类记忆的一些动态,如记忆痕迹随着时间的推移慢慢衰败。通过适当的数据,还可以扩展到包括额外的认知方面,如个人水平的敏感性相关事件,情绪,或干扰事件的看法。因此,该模型能够捕捉社会互动的动态自然设置从认知的角度来看,每个参与者。

评估该模型的实证性能,我们比较模型与参数拟合的结果使用行为通信事件数据,地面真理感知收集的数据从人类参与者对他们最重要的关系。比较表明,深度的知觉的人们之间的相互作用被CogSNet模型。在任何给定的时间点上,该模型可以计算当前记忆痕迹的力量,包括离散事件的影响,创建或增强这些痕迹。每个社会关系的计算状态(例如,突出对衰变)相比,可以外化的认知自我报告的形式。CogSNet模型使用记录事件数据与参数拟合达到高精度的地面实况数据NetSense网络。这个成功演示了将认知过程的重要性和足够内存动态建模的动态的社会关系。

记忆被认为是人类认知最重要的一个组成部分。这种情况尤其考虑到必要性有效地获取大量的知识和选择信息从一个嘈杂的环境。因此,对认知科学的一个基本的挑战是了解人类记忆的机制参与管理信息(1]。这些机制的具体细节很难坚定地建立以来人类的大脑是一个高度复杂的系统具有强烈的个体间差异基于实验优化(2]。然而,有重大进展的方向发展优质工作记忆和其他核心认知过程的模型。例如,ACT-R认知体系结构很好地模拟人类陈述性记忆的核心特性,成功地复制大量的知名的影响。就我们的目的而言,其中最重要的经验规律的完善的主导地位和近因效应是内存列表(3]。

能力有限,随着时间的推移逐渐腐烂的痕迹在内存中已被许多研究中分析时间和回忆之间的关系(4- - - - - -6]。遗忘机制由参数化建模功能描述一个给定的项目将如何回忆作为时间的函数。看来,人类往往会低估所经历的事件的数量,即。,实际上他们忘记的速度比他们认为他们所做的(5]。显然,任何一个特定事件的回忆会被外部情况允许人们记住的信息了。然而最终,能力有限的范例和遗忘函数主要是负责控制的一生回忆在内存中(7]。有相对多的论文链接预测的更广泛的领域内,但他们对待人类交流一系列固定的时间寡妇,反映了人类认知和遗忘的连续性。例如,读者et al。8)确定在电话一打预测因素量化通信时间的最后在四周内调用或调用的频率,使预测社会关系的持久性,即。沟通,在接下来的四周。文化之间的影响、认知、思维和网络中提到(9),但在一个定性的方式,没有任何提示如何量化这种影响到一个模型,这对我们的方法是至关重要的。其他作品也研究这个问题的回忆同行的名字在各种活动(10- - - - - -12),但他们专注于个人的详细分析属性区分受试者的遗忘,而在这里,我们专注于遗忘的模型。

2。材料和方法

人类的大脑记录事件到达,但只有一小部分传入的信息存储在长期记忆由于能力有限。遗忘机制规定召回一个给定事件的机会逐渐减少,我们前进从第一次接触的时间6]。在某种意义上,它类似于graph-streaming [13)和feed-based社交媒体网络级联(14)场景传入的事件命令他们的到达时间,但是只有其中一些。

因此,CogSNet模型使用遗忘函数 占内存的减少的概率保持老化痕迹。遗忘是一种单调nonincreasing时间的函数 对所有 它是由三个参数定义:强化峰值 ,忘记强度 (用于ACT-R模型),以及额外的第三个参数,忘记阈值

为了清晰起见,我们这里现在基本CogSNet模型;一个更一般的版本定义在附录和附件方程(. 1)和(a .)。该模型处理一个事件发生的时间 如下。如果事件涉及一对无关的节点 ,一条边 创建连接这些节点。这条边被分配重量 等于强化峰值 否则,如果涉及的节点已经连接,遗忘函数 用于设置边缘连接这些节点的重量: 在哪里 是前面的事件的时间优势。处理的每个事件以推进 最初, 设置为0。方程(1)和限制的价值 确保任何边缘的重量最多1。

重量 的优势 两个节点之间的任何用户选择时间 计算如下。一旦所有的相关事件时间 处理,我们简单地设置 如果结果小于忘记阈值 , 减少到零,边缘。需要一个阈值与遗忘功能,比如电力和指数遗忘,积极的非负参数。否则,优势会得到积极的重量在创建和总是保持积极的态度;即。,all created memory traces would never cease to exist. The reinforcement peak 定义了一个事件的影响在边缘的重量与这个事件有关。这个峰是一个全球性的模型参数。原则上,峰值可以调整根据事件或事件感知节点类型,允许个性化的。

在图1,我们比较CogSNet模型与先前的提议表示时间网络动力学。代表社会网络动力学的最常见的方法是使用交互序列(15]。在这种方法中,每个事件都包含时间戳,权重被添加到边缘连接节点参与这个事件cf。图1((我)和(花絮))。此外,一个给定的边缘是活跃的(存在)只有在给定的时间 这是最细粒度的方法,因为它能够跟踪所有节点之间的事件发生,同时保留事件的时间顺序。

相比之下,一个静态二进制网络表示,如图1(IIb),汇集了所有事件的所有边缘长期有效。因此,一对节点之间的边现有的这些节点之间的对应于一个事件发生在整个观测期间至少有一次16]。这样一个边缘表示扔掉关于事件的时间点的信息,从而无法在静态网络动态过程研究。

增量网络解决方案积累事件只取决于当前时间 的分析。经典的方法,早期用于(17- - - - - -19)、视图动态网络的一系列以时间为顺序的序列静态图(见图1(IIc))。最近,该方法应用于建模网络和社区进化20.,21]。这种方法的缺点是它不保存订单时间片内的交互。应用一个简单frequency-based聚合创建一个frequency-based (FQ)度量cf。图1(IId)。只考虑一个给定数量的最近的事件导致了recency-based cf (RC)模型。图1(IIe)。这两个模型在这里用作基线模型。

1(IIf)显示了一个示例使用CogSNet生成动态社会网络模型。所有其他社交网络模型图1((花絮)- (IIe))也可以由CogSNet通过设置合适的参数组合来实现,根据需要,没有腐烂,即时衰变,等等。这样,CogSNet可以被认为是一个普遍的生成动力学模型的时间社交网络,包括以前的方法作为特殊情况。

一般来说,遗忘函数 在时间间隔 可以是任何类型的(线性、力量和对数),但在这里,工作记忆的认知心理学(通知5等),我们评估只有两个功能:指数函数 和幂函数 定义如下: 在哪里 表示忘记强度;通常情况下, 的使用 在幂函数确保感知的事件发生在不到一个时间单位前被遗忘没有改变。遗忘函数表示的时间单元尺度参数的值。我们的实验使用一小时为时间单位。

为了简化搜索最优参数,我们总在所有三个参数跟踪一生L定义时间之后非强化记忆痕迹是遗忘,即。,太弱回忆道。在模型中, 是时间的遗忘函数减少边缘重量的 导致边缘被移除cf。图2。指数遗忘函数(方程(2)),跟踪一生 而幂函数的公式

请注意,根据CogSNet模型权重属于范围的关系 边缘的体重值往往1当节点遇到大量的连续紧密联系。大事件的数量和相互接近,接近1的重量。

3所示。结果与讨论

在本节中,我们评估提出模型的实证效度估计的准确性CogSNet模型再现了社会关系的动力学在动态社会网络。我们的计算实验使用NetSense数据集介绍22]。

数据包含7096844个人类移动电话通信事件,包括电话和短信。这些是扩充到578年调查包含自我报告上面的联系人。值得强调的是,这个数据集提供了一个独特的机会来评估研究参与者的沟通频率回忆因为学生的知觉frequency-detailed这个信息已经公布的信息和数据是如何处理在附录提供。

我们使用这个数据集研究的演变两个耦合的大学生社交网络。首先是一个行为网络代表个体之间的相互作用的形式记录他们的移动电话和短信。第二个有知觉的边缘定义的个人提名。这些提名基于学生的相应关系的知觉的二十大同行调查管理的参与者互动。这些调查覆盖了前四个学期的学生的大学经历(开始大一大二的结束)。我们从CogSNet比较提名的名单预测网络模型纯粹从通信事件数据的提名名单收集在一个给定的调查。图3显示了一个示例的动态社会网络产生使用CogSNet NetSense数据模型的一个子集。

相比之下,我们也使用手机通信实现三种基线模型数据。第一个是一个frequency-based(FQ)模型订单同伴互动的数量,不管他们的时间顺序。在这种模式下,最高排名同行的数量等于提名中列出的数量的基础上选择相应的调查他们的通信频率。的recency-based(RC)模型选择顶部的同龄人互动为每个给定数量的最近的事件。最后,随机抽样(RND)模型创建列表中随机选择同行从那些记录在给定节点的相互作用的历史。虽然随机基线可以被视为一种简单的下界,这两个提到的实际上是认为是最先进的,因为他们表达两种认知现象。近因效应实验发现的是赫尔曼艾宾浩斯的记忆。他提出的遗忘曲线是基于研究[23和最近证实24]。在这些论文中,作者证明了学习曲线上升的机会回忆开始和结束时的接触,而中间的召回事件的机会较低。然而,随着调查的问题主要是指现在,我们集中在近因,而不是主导地位。frequency-based第二基线,是科学成果的实现从词汇记忆的域(25]。作者的研究表明,经常重复词快被召回。不幸的是,我们所知,没有其他方法适合用于类似的任务。

比较所有的模型的性能,我们使用一个Jaccard度规,方程(C.1),在附录,措施的数量的比例提名产生的模型,也是地面实况提名中列出相应的调查的数量除以独特的提名名单。由于问题制定调查的性质,是不可能使用任何方法基于订购如肯德尔或培生。自从我们必须考虑和无序列表。

4显示了这种比较的结果对参数对应于报道值的范围为1到14周的遗忘。在报道26),召回信息社会互动的能力开始降低大约一个星期后。实验使用NetSense数据集显示,无钢筋的性能是最高时忘记记忆的痕迹发生两周后。结果仍令人满意忘记阈值低至一个星期。两周的阈值,CogSNet模型与权力或指数忘记统计上显著优于任何基准模型。在文献中,忘记了被发现比指数表现更好忘记当一系列参数是有限的(3]。我们不遵守这样的性能优越的权力忘记这里。两个函数峰值Jaccard相似度量,虽然不同的寿命值。

当比较的结果与美国调查CogSNet网络在时间的调查,Jaccard度量是高达29.98%的指数函数l= 3天。遥远的第二个是recency-based RC模型提供Jaccard指标的17.8%要低得多。不过,当看着RC指标的相对简单,也可以说它执行很好这是由于这一事实至上和近因效应发挥作用,当清单同行(27]。

4所示。结论

结果表明,会计事件感知和记忆的动力是至关重要的忠实建模动力学在社交网络的交互。CogSNet执行统计上显著优于任何基本时序模型(见表1在附录)。与合适的数据,模型可以扩展到代表个人敏感事件和情绪感知和干扰事件的影响,进一步提高建模质量。

我们操作包含的数据集数据有限的人类社会活动的一个相对较小的比例。因此,它不能说没有其他事件发生可能影响参与者关于他人的记忆。此类事件的例子有面对面的相互作用,间接引用别人,和别人的个人回忆录。此外,情绪也可以发挥重要作用在这些过程中,他们可能发现有信心从可用数据28]。

因此,强化峰值可以调整为一个给定的人,一个人也事件参看方程(. 1在附录)。什么是观察这是人类记忆的部分表现。然而,即使考虑到模型建立了基于单一数据源,超过600万电话和消息NetSense研究参与者中,模型配备相匹配的事件记录数据收益率结果好突出的社会交往在所有578调查参与者在184年完成。它是观察到,即使使用相同的模型参数的值为所有参与者,结果是令人满意的。然而,这精度最可能会增加如果参数分别调整为每个参与者。除此之外,每个人都应该记住,召回任务是高度相关,因此,个人将提供不同的同事根据情况(11,12]。

这项工作的结果也可以认为是一个重要的构建模块如何保持健康的关系或如何发现异常。例如,根据结果,预计,为了保持生活与同伴的关系,接触不应该比一生稀疏的 ,最好是更频繁。相反,这些研究结果也证明一段悲伤多久后打破可能最后的关系以及如何处理经济复苏过程之后为了让它有效。最后,小的修改使模型更接近ACT-R将使其使用例如阿尔茨海默病的情况下,可以监控同行被患者是否符合CogSNet模型生成基于联系人或访问。如果之间有任何差异发现模型基于访谈和观察,这可能是早期迹象或疾病新兴或变得更加积极。另一个有趣的案例是新的链接的优势是否比旧的衰减较慢。

在未来的工作中,我们计划在附录中概述的方向扩展模型包括会计在交互干扰,个性化的力量,不对称的参与者的相互作用意义(例如,层次关系),以及形式的相互作用的影响和相关的情感。因此,CogSNet模型代表一个重要的社交网络动态建模的第一步通过人类认知的视角。在文学中,有三种方法,广泛用于理解人类认知:认知带宽(CB)防卫道德(DPM)和隐式关联测试(IAT)。在[29日),这些方法相比,它们共同的缺点是指出—缺乏的角度来看,文化背景考虑在内。我们的方法使这些考虑,我们看到这一挑战未来的工作方向。最后,我们希望看到更多的数据集是如此广泛的NetSense数据集可以允许我们评估模型。

附录

(一)CogSNet模型的形式定义

社交网络可以由一个图形表示 ,在哪里 表示的集合 节点和 是导演的集合 对节点之间的边。每条边 从节点 到节点 , ,分配重量 并由一个三

演化模型在离散步骤如下。每一对的节点 ,系统维护两个变量: ,代表最近的事件的时间节点和这双 拥有这双节点的事件的计数处理。最初,两 设置为0,所有边的权值,即:所有成对的节点 ,

当一个事件发生时刻 在社交网络建模,它是按时间顺序的处理模型。首先,更新相应的边的权值根据以下方程: 在哪里 的值是强化峰值的结果吗 事件影响的边缘 在这里,强化峰值的价值 取决于接触和情感调用的事件直接或间接相关的优势 事件的一个例子间接相关边缘节点 讨论节点 或任何情况下提醒节点 关于节点 的值 可以个性化的节点 感知节点的关系 在事件 的值也可能依赖于事件类型: ,例如, 对于电子邮件, 的电话, 会议, 共同合作的项目。

最后,当前事件的处理更新这两个变量与更新后的边缘 如下:

在任何时候 模型的进化,用户可以获得任意边缘的重量的价值 通过计算以下方程:

(B)实验参数空间

分析CogSNet模型并比较其结果同参考模型,许多CogSNet参数的组合进行了测试。首先,不同的值 , , 被指定的,然后, 系数是计算使用方程(4)和(5),它也被用来定义CogSNet参数实验验证。参数的完整列表列出用于表23

(C)质量的措施

Jaccard指标的值为一个学生调查的参与者 计算如下: 在哪里 是一组20同行枚举的参与调查的学生吗 是这个学生的邻居集CogSNet网络最大的非零权重边缘上这个学生当天的调查管理。

(D) Recency-Based基线

recency-based基线模型被发现最好的调优参数代表最近事件的数量需要考虑计算的性能。400事件的结果值在图4recency-based基准模型的计算结果。

(E)的统计测试

确认有统计差异提出CogSNet模型和基线,我们进行了统计检验。这项研究的结果发表在表1这表明CogSNet方法是统计所有基线方法更好。此外,权力忘记执行统计上显著优于指数遗忘。

(F) NetSense数据集

数据集由两部分组成。第一类包括时间戳和持续时间/电话和短信的长度为每个学生收集参与这项研究。每个学生电话设备所有连接记录/信息,包括手机的测试组以外的人,所以记录了双方的沟通,通过发送和接收的电话/信息,如果两个属于研究。总的来说,移动电话通讯数据由7575865年的活动。其中,7096844年短信( 的所有事件)和479021电话( )。因为数据集包括数以百万计的手机交互记录了一个特殊的应用程序安装在学生手机,下面讨论一些问题出现在初步数据分析阶段。

由于事件涉及每个学生拥有手机记录独立于其他手机,一些矛盾出现了其中最重要的是,并不是在所有情况下,双方的事件被记录。因为通常几秒钟之间通过发送短信和接收收件人,我们发现同样的消息的长度。然而,有时候,记录长度是不同的,所以在这种情况下,我们被迫做有些武断的决定基于长度的不同信息是否相同或不同的另一边一个相应的事件的沟通没有记录。

接下来,学生们相互打电话,打电话时没有回答,收件人的语音邮件了,如果是启用。这种情况下被记录为普通电话即使实际上没有回答对方。为了解决这个问题,我们不得不寻找孤儿记录没有相应的记录在收件人的一边。

这部分从我们的数据集数据预处理删除12482条记录。之后,我们进行了探索性分析的事件。在图5,我们显示了基本统计信息关于这项研究的参与者的沟通模式。

第二部分包含同行枚举的数据集包括调查的参与者的每一项在回答以下问题:“在下面的空格,请列出20人(朋友、家人、熟人、或其他的人)你花时间和他交流或互动”。更具体的过程中如何获得数据看起来像学生提供与请求包含20个空字段的形式在这种问题必须填写自己的名字没有任何建议或发电机。如前所述的主要部分手稿,枚举同行的顺序没有实施,但即使学生们会开始清单最重要,没有必要最经常接触,我们不能假设。

最后,学生被要求在任何顺序列举了最近二十同行与他们互动。然而,同行人数的系统记录每名代表的名字在列表上的立场。对于一些调查,有一些洞这个编号,所以学生没有列出相应同行(左之间的一些空白行名称)或部分结果没有记录。这就是为什么我们认为同行列为集没有任何隐含命令和Jaccard集比较指标是用于评估目的而不是任何其他基于排序,例如,皮尔森和斯皮尔曼等级相关系数。

数据可用性

计算的状态的代码使用CogSNet模型构建的社交网络已经公开。快速准备的C实现本手稿的作者可以作为代码海洋胶囊(https://doi.org/10.24433/CO.6088785.v1)。NetSense数据集用于模型验证用于其他研究人员;感兴趣的读者访问数据应该联系奥马尔Lizardo教授合著者。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

所有作者参与研究的设计和计算实验。RM和可计算实验并收集结果。所有作者参与的分析结果。所有作者和编辑手稿写道。

确认

作者要感谢教授托马斯Kajdanowicz对他有价值的评论关于统计测试。这部分工作是由美国国家科学中心、波兰,由以下项目:2015/17 / D / ST6/04046 (RM)和2016/21 / B / ST6/01463 (PK,可),海军研究办公室(ONR)(批准号n00014 - 15 - 1 - 2640),陆军研究办公室(ARO)(批准号w911nf - 16 - 1 - 0524),欧盟玛丽Skłodowska-Curie项目(批准号691152)和波兰科学和高等教育(批准号3628 / H2020/2016/2)。计算进行了使用Wrocław所提供的资源网络和超级计算中心(https://wcss.pl)(批准号177)。NetSense数据的收集是由美国国家科学基金会(批准号iis - 0968529)。提供了进一步支持数据收集通过圣母大学和冲刺。