文摘
我们有数百万Twitter消息检索和分析对应于西班牙大选举行的20 2015年12月至2016年6月26日重复。从两个选举活动的可用性数据非常接近在时间允许我们比较两个类似的社会制度与集体行为类似的上下文。通过计算和分析时间序列的日常活动,我们发现了一个显著的线性相关性的选举。此外,我们表明,每日微博,转发,提到遵循幂律对独特的用户数量,参与谈话。此外,我们已经核实,提到网络的拓扑和转发不改变另一次选举,表明他们的潜在动力强劲的社会环境的变化。因此,根据我们的研究结果,有一些周期性的集体行为模式表现出相似的和一致的属性在不同的选举活动。
1。介绍
如今,社交网站(SNS)是一种行之有效的沟通媒介。他们是被一个巨大的用户群,分享经验,讨论意见,看新闻,等等。Twitter是一个最具活力的SNS用户之间的交互和其中一个最强大的对潜在的信息,可以提取为研究目的。此外,在2015年最后一个季度这个社交网络每月有3.05亿活跃用户,和过去的数据显示,每月活跃用户的数量已经上升到3.35亿年的2018年第二季度(1]。
这些事实激发了研究项目的发展从一个广泛的领域,从网络科学社会学,对用户行为的研究提供了新的视角。这些研究揭示涌现在我们的集体行为模式,显示他们如何可以用来了解有关经济等社会话题(2)、市场营销(3,政治4,5],流动[6),或极化7,8]。
在这项工作中,我们感兴趣的选举过程。在这些类型的环境中,人们使用社交媒体作为一种传播媒介交换意见。然而,也有一些用户,它的目的是影响对话的方式可能会影响人民的投票选择。虽然这些在线操作,他们有一个对现实世界的影响。
推特的简洁特征使它成为一个强大的工具来分享新闻和参与动态辩论(9]。这就是为什么它是最常用的媒体记者、政治家和政治爱好者分享他们的观点和新闻。现在,甚至传统媒体经常使用Twitter作为新闻来源。此外,政治家认为Twitter的一个最重要的社交媒体对他们的工作10],尽管其他在线社交网站如Facebook也高相关性。
2008年奥巴马竞选,Twitter作为传播媒介的功效在政治背景下首次成立(11,12]。从那时起,它已经获得了越来越多的政治活动的相关性。这一趋势也激发了越来越多的学术著作数量使用Twitter数据分析的不同方面的政治运动。
一些线路的研究主要是围绕预测选举结果后不同的技术(4,5,13]。其他作品研究政党之间的交互来评估当事人的凝聚力(14)或辩论的水平(5]。也有研究,分析微博的内容,以检测他们的情绪15- - - - - -17]。两个广泛的评论,覆盖区域内的各种各样的科目可以在[18,19]。
在之前的文献[5)2011年的西班牙大选进行了研究使用Twitter的数据。工作是集中在对选举结果的预测使用公制,措施的政治情绪。作者还探讨了用户之间的交互通过分析复杂网络的结构和动力学模式提到的紧急和转发网络。从政客之间的传播动力学的研究,他们发现缺乏讨论,并提出了一种网络增长模式复制这些交互。
虽然我们比较我们的一些结果那些在工作,在这项研究中我们不旨在预测选举的结果或简单地研究用户和政客之间的关系。我们利用Twitter数据的可用性在两次选举活动(西班牙大选2015年和2016年选举的重复)很近的时间比较集体用户行为表现在两个类似的社会制度类似的上下文。个人活动和政治演员可能不同;实际上,在第二次大选两党成立了一个联盟,改变政治格局。我们的目标是研究和描述紧急循环行为表现在政治背景。
为此,我们有计算和日常活动的时间序列的选举相比,发现颞一系列活动选举时间都显著相关。此外,我们的研究结果表明,微博,转发,提到遵循幂律对独特的用户数量,参与谈话。为了探索进化之间的交互的用户,我们已经建立了网络提到和转发并研究它们之间的进化。这使我们能够确认他们显示相似的拓扑性质在选举时期。此外,我们研究了提和retweet子图引起政治用户和结果意味着不同党派之间缺乏沟通,与之前的工作相一致(5]。此外,我们发现一个强化后的各方之间的交互可以检测到一个联盟的形成。
本文组织如下。在第二部分中,我们描述的政治背景下,一些相关方面的互动机制在Twitter上,我们的数据集的特点,和随后的方法构建的网络交互。在第三节中,我们提出并讨论我们的研究结果对用户活动和提到的演变和转发网络。我们也使用一个度量,讨论普通用户和政客们的影响。此外,我们分析了程度不同的政党的政客们之间的争论。最后,我们总结了主要结论。
2。材料和方法
2.1。政治背景
西班牙两院制的议会制度,众议院叫做国会议员和参议院,参议院。选举的国会代表,每四年举行一次,每个50个省作为一个选区,代表代表的数量取决于其人口。在比例代表制选举制度由d 'Hondt公式,选票是投给了全省方列表,而不是代表个人选区的候选人。
4/5的参议院的成员直接选举通过省级多数系统。每个省有四个代表;三位候选人的选民投票,得票最多的人当选。剩下的参议员由地区立法机关任命。因为表示不是基于人口,在参议院通常较小的和更偏远的省份所占比例与整体人口(21]。因此,目的是说明西班牙政治格局,在这项工作我们选择只报告结果的国会代表,席位的分配应该是更具有代表性。
2015年12月20日,西班牙举行了大选。的西班牙人民党,人民党(PP)和工人社会党(党Socialista Obrero西班牙人,西班牙社会主义工人政党),它构成了传统的两党制失去了很多社会支持,而新兴党派Podemos(我们)领导和Cs(一、公民)在上升。这导致一个过渡从两党制、多党制(22]。
尽管如此,人民党,持有政府仍在民意测验中处于领先位置。其余的政党是但不是太远。事实上,其他三个主要政党的支持波动在大选前一年,似乎无法预测,通过查看投票,投票的最终排名(23]。
结果是一个支离破碎没有派对举行的议会绝对多数和大联盟需要组建政府。每一方获得的选票和座位都显示在表中1。经过几个月的谈判没有任何团体之间的协议方足以获得议会的多数席位,使政府的形成。这导致了宣布在2016年6月26日举行新的选举。
在这个新的选举之前,新兴的政党之一,Podemos,领导组成了一个联盟与国际单位(Izquierda Unida,联合左)。这个联盟被称为(森Podemos,领导我们可以联合)。
2016年的选举导致了议会,几乎和2015年一样支离破碎。获得的选票和座位每一方展示在表1。2016年10月,人民党终于赢得了任命选票,组建了少数派政府不信任(2018年6月,运动对执政党(PP)和发布PSOE组建了少数派政府)。
2.2。描述数据的
我们已经与Twitter信息检索Twitter流API。这个API允许下载微博匹配一组关键字。为了避免偏见的结果,我们选择中性关键词过滤的信息如下:(我)2015年大选的关键字:20 d, 20 d2015 # EleccionesGenerales2015(2)2016年大选的关键字:26 j, 26 j2016 # EleccionesGenerales2016, # Elecciones26J
我们已经下载了微博两个多月期间之前和之后的每一个选举。然而,我们的分析的核心都集中在15天的正式选举活动,反射的一天(在大选前),选举日,后的第二天。在此期间检索的18天我们有1793145微博2015年的选举和1755438 2016年大选。
除了关键字用于检索数据,最常用的标签出现在我们的数据集如下:(我)最高标签2015:# podemos,领导工人社会党,# partidopopular, #一,# l6elecciones, # 7 deldebatedecisivo # votapsoe, #, # pp、# mivotocuenta, #西班牙,# espanaenserio, # podemos20dic, 20 dicpodemos #, # podemosremontada, # votapp, # hevotado, # votapodemos20d(2)最高标签2016:# afavor, # unidospodemos, # l6elecciones, # votapsoe, # Debate13j, #工人社会党,# cambioamejor, # votapp, #西班牙,#一,# partidopopular, # elcanvipossible, # unsiporelcambio, # avotar, # lasonrisadeunpais, # brexit, # eleccionesgenerales
我们还编译的Twitter账户列表相关的四个主要政党(PP,工人社会党,Podemos和Cs)领导和单位。后者是相关的,因为在2016年的选举中,我们解释了部分2。1,这个政党组成了一个联盟()Podemos,领导一个事实反映在数据上。这些账户列表允许我们分析普通用户和政客的行为的差异。
为了构建政治账户的设置,我们看着Twitter列表(列表用户账户阐述的)定义的相关官方账户与两党有关。我们已经下载了这些列表,包括政治家、政治机构或政党的支持者。政治参与的用户检索的总数对话是5227年2015年,4044年的平均数量的追随者,在2016年和5012年,平均4662的追随者。
2.3。Twitter是如何工作的呢?
在本节中,我们将简要描述一些Twitter的特点。特别地,用户之间的通信手段,将源用于构建网络的交互。
在Twitter上有几个用户之间的互动机制。第一个是遵循其他用户。一个用户将获得每一个推特她的追随者。此外,有五个社交网络内的其他交互机制:直接消息,提到,转发,报价,和回复。我们将关注提到和转发,因为他们是最广泛使用的。
的提到是一个公共直接沟通机制。它由包括一个用户的名称推特[…]([. .]@用户名)。提到的这种方式,用户将收到消息后,即使她不是用户发布。存在一个在Twitter根据约定,只要给定用户在微博提到的,使用@用户名而不是她的真实姓名,独立的目的是建立一个与目标用户通信。
的转发是一个广播机制。每个由用户转发消息转发给她的追随者一样一个原始的tweet。在政治背景下转发通常,但不总是,意味着思想中包含的信息的认可。
2.4。建设提到的网络和转发
在这里,我们将解释的方法,我们采用了构建网络从Twitter数据的交互。我们分析了交互提到和转发。
我们建立了提到网络通过考虑每个用户参与对话作为一个节点。两个节点j和我与一个直接链接来自哪里来当用户j提到的用户我;也就是说,j发布一个推特包括@name_of_i。结果是一个有向加权网络,每个链接的重量对应的微博总数j提到我聚集在一个给定的时间间隔内的时间。入度,或 ,的一个用户在这个网络对应的用户总数已经提到 。 对应的用户总数,她提到。
转发网络是建立在类似的方式提到网络。用户和用户的节点j与一个直接链接到用户吗我如果j转发一条消息最初发布的我。如果一个用户转发一个原始微博和转发广播的消息 ,有链接来从来 ,但不从来 。图1说明了这种机制。
让我们来评论这个想法:链接转发网络中加入与原始海报转发;没有中间商,广播原始消息之间的联系。原因选择的方法是,Twitter API用于下载数据只在那一刻楼主提供的信息转发一条微博的元数据。转发网络然后一个有向加权网络的权重的链接来的消息吗我转发的j在一个给定的一段时间。的一个用户在这个网络对应的用户总数转发消息 。 对应的用户总数的消息转发。转发机制通常会导致网络子图显示大明星。
我们已经考虑了两种不同的时间尺度。一方面,我们已经建立了日常网络,计算一天的24小时4点(UTC)(在西班牙当地时间对应于UTC + 1冬天和夏天UTC + 2)的那一天直到第二天4点。这样我们捕获完整人类活动周期。这种方法是基于一个工作莫拉莱斯et al。24),人类同步研究几个尺度,发现强周期的研究与昼夜和社会周期以及发展全球同步全球化的现象,增加了一个新的视角。另一方面,我们已经构建了聚合网络选举活动的15天+未来三天(大选,大选前,经过选举)。
3所示。结果
3.1。用户活动的时间演变
为了描述用户的全球经济活动(微博发布的数量在给定的时间内),我们计算总日常活动整段的时间序列。此外,我们分析了每个用户每天活动的分布的演化。
在左面板图2我们已经策划日常活动的时间序列对选举活动。我们一致他们这样投票正值天0。图中我们可以看出,在选举活动日常活动的时间序列值低,但他们在出现两个活动开始上升。
与现有文献[5,25,26),活动的时间序列的特性可以解释在很高程度上线下活动。有一个巨大的峰值在选举日的消息,占总数的30%以上的消息期间研究选举(2015年是36%,2016年为32%)。也有小山峰选举活动期间,可以解释为主要的选举辩论。
期间在西班牙,preelectoral沉默是强制性的,跨越从选举的前一天12点关闭投票选举。这一时期被称为反射的一天和一些限制对政党和媒体的行为。其中,选举事件不能举行,选举宣传的传播是被禁止的(27]。时间序列出现递减,这可能是由这一事实政客停止在在线和离线媒体活动。由于缺乏刺激,普通用户衰变之间的对话。
值得指出的是,相似的用户活动的演化在选举。在图2,我们已经策划(在对数刻度)一个周期的时间序列一致反对选举的其他天。通过执行这些数据的线性回归,发现了显著的线性相关性。我们获得 当我们执行线性回归包括选举和的日子 如果我们排除它。然而,请注意,山坡上的差异 。这种相关性可以部分解释为背景的相似性和周期性结构的选举活动。它总是在大选前16天开始,持续15天。此外,主要的辩论都是在大选前举行了13天。由于微博的数量在2016年的选举中略低于2015年,线性回归的斜率小于1。
用户活动的另一个相关属性显示在图中3,我们显示tweet的总数,转发,提到每天遵循幂律对独特的用户数量每一天。因此,我们拟合数据幂律指数 。指数的值和适合显示在表的相关系数2。理解这种行为我们之后工作Leskovec et al。28),结果表明,当现实世界网络发展通过时间、链接的数量尺度与节点的数量作为
注意,而在2015年,三个量略超线性增长的用户数量,2016年我们观察是一个近似的线性行为。因此,2015年,当越来越多的用户加入谈话,活动经历增量比例高于2016年。
为了进一步探索用户行为的特点,我们也分析了分布的演化的日常用户活动图的左面板所示4。活动分布异构的性格,结果一致文献[29日]。我们有安装他们以下离散幂律:
在这种情况下日常活动和吗是黎曼ζ函数。
在右面板图4我们策划的演化指数幂律。它已经被解决以下方程数值计算获得极大似然估计量(30.(标定) :
的地方'表示与第一个参数和分化对应的用户数量。的不确定性已经计算如下:
这种技术被证明是更精确的最小平方适合重对数坐标图,通常产生不正确的结果当计算幂律分布的参数(30.]。其他的权力指数法的离散数据一直以同样的方式计算。由于活动的最小值是1(也是最丰富的数据),我们有固定的 当计算的大中型企业 。
我们可以看到的值指数波动在一个小的时间间隔( )在考虑期间对选举。在[这些值是完全兼容5),作者获得的价值 。
小的波动指数告诉我们,不改变集体行为从一天到另一个。如果我们考虑到这一事实的价值指数的分布控制它衰变速度,我们看到,当指数较小,活动达到更高的值(反之亦然)。因此,通过观察图4,我们可以看到,选举的日子我们获得一个低指数由于活动的增加。此外,在选举期间沉默,结果如图2我们欣赏活动减少。注意图。然而,尽管在的情况下4相对应的点选举沉静是最高的,他们不是最低的活动的时间序列图2。这意味着尽管单独每个用户倾向于更少的消息之后,仍然有很多用户参与谈话。
3.2。提到的演化和转发网络
我们已经分析了聚合提到的演化和转发网络在两个不同的时间尺度。一方面,我们有聚合网络为整个活动期间(+未来三天);另一方面,我们有网络的演化进行分析通过聚合的数据每天分别为不同的度量和计算时间序列。
在图5我们将展示2015年聚合网络的强连通分量。颜色对应的社区与鲁汶计算算法(20.]。我们得到一个模块化的 转发网络和 提到网络。其他社区检测算法应用获得类似的结果(31日]。我们表示最可能的从属关系的每个社区的节点。为了做到这一点我们有视觉检查哪些节点(或用户)在每个社区最中央。节点的中心已计算的指标(32),衡量一个节点根据其社区的影响。节点图的大小5被代表成正比吗 。
每一个定义良好的群体似乎对应于一个政党。而在提到网络的表示不同的团体被良好的定义和最中央节点对应于社区的领导人和政客或政党,在转发网络节点混合放置在不同的社区的中心表示可以欣赏。大多数这些节点中心高,属于不同的通信媒体。这是在良好的协议与文献[33]。
我们计算了这些网络的统计特性:节点的数量( )和链接( ),密度( ),平均聚类系数( ),和——和出度分布。我们发现他们非常异构和安装一个幂律节中描述的方法3所示。1。入度( )分布异构比学位( )分布;也就是说,指数的关系 。这是由于这一事实与个人的努力而对应于集体行动。个体身体仅限于发布一个给定数量的推文在给定的一段时间,而一大群用户可以发布更多的信息在同一时间。正因为如此,高值可能比高值,导致上述关系指数。
聚合网络的属性显示在表中3,在那里我们可以欣赏到明确的提到和转发网络之间的差异。首先,前者提供了更高的平均和最大程度。而高提到网络显示它分布异构略低于一个转发,价值越低意味着分布异构提到比转发。第一个现象可以归因于网络的建设方法。因为所有的转发链接到楼主,高的值在转发网络更常见。第二个现象源自于这样一个事实:可以有多个提到每个tweet和在每一个转发,至少,一提到楼主。
更高的平均聚类提到网络可以解释不同用途的提到和转发。提到是一个沟通和典故而转发机制主要用于广播消息,从而导致更多的集群网络在第一种情况下,子图更像星星一样在第二个。然而,网络的建设机制也扮演相关角色,因为中间商之间的关系并没有出现在转发网络。
选举结果显示很少的变化从一个到另一端,这表明底层网络的动态相互作用是一致的,在某种程度上,独立于上下文。
对演化的入度分布指数的提及和转发网络,如图所示6,它仍然是在选举前47天约常数(为简单起见,只有16天在大选前图)所示。在此期间的平均价值 和 提到网络和 和 转发网络,置信区间 。这些结果表明高一致性的用户行为的选举。指数是略高的一个聚合网络,因为在这些网络几乎每个人都提到,让分布的尾部也愈长。
在的情况下的演化出度分布指数,显示在图6,它也仍然在选举前约常数47天。在此期间的平均价值 和 提到网络和 和 转发网络,置信区间 。类似地度,相似指数的值从一年到另一个表明复发性行为模式。他们也类似于聚合网络的价值,但更高,这意味着异质性较低。原因是这些网络的建设机制。人是活跃的研究下所有的时期,每天生产更多的链接,因此稍微改变分布异构一天聚集。
我们已经探索了网络的度相关性及其进化在几个方面。首先,我们计算assortativities程度(34),表中给出4随机网络,并与assortativities通过z分数,以确定assortativities的度分布的结果单独或更复杂的相关性。表的z分数可以咨询5。随机化进行了使用500定向配置模型的实现35)中实现NetworkX Python模块(36]。
我们可以看到在桌子上4,assortativities显示网络和年之间经常性的顺序: 。始终与其他措施提出了到目前为止,他们表现出相似度很高。此外,当我们比较的结果转发网络的度相关性的2011年大选(5),我们看到他们非常相似。这个结果表明复发行为用户的通信模式。
这种秩序维护的z得分(见表5),也就是说,选型选型关系仍然比我们应该期望的随机网络和非选型的更非选型。
对日常的演化程度assortativities这是显示在图7我们可以看到,他们或多或少围绕一个固定值波动。然而,这些波动有时是强大到足以改变先前描述的顺序。
似乎这些波动造成的破坏性事件,外生和内生。6天庆祝2015年的辩论之间的人民党领袖(然后,总统)和工人社会党领袖。类似的模式,但较弱,可以观察到的时间序列assortativity -13天,伴随着其他活动的重要辩论。在2016年-11天我们发现一种病毒tweet,包含对西班牙的政治滑稽视频。该推文转发收到的达到那天所有的推特发表的谈话,分析时的平均比例每天转发收到的最受欢迎的帖子在2016年的竞选 。
3.3。沟通效率
为了测量全球用户对网络的影响,我们使用了用户效率指标(29日]。在Twitter上,它可以被认为是一个消息已经达到了一个更高的影响如果它被大量的转发(RTs)。她越高RTs /原创微博的平均数量是更高效的用户。因此,用户的效率被定义如下:
在哪里用户的实力吗在网络和转发是她的活动,发布消息的总数。应该注意的是, 。因此,这种方法代表了集体对个人的行动。
我们有计算效率的分布全球对话包括普通用户和政客们参与。为了比较常规用户与政客的行为,我们也考虑效率的分布对应的组帐户的四个部分中描述的主要政党2。2。
在图8我们代表,对选举活动,效率的概率分布与每一方和相关的Twitter账户的用户。这个分布对应于概率质量函数。在那里,我们可以欣赏分布遵循相同的函数形式为普通用户和用户与政党联系在一起。特别是,他们显示异构行为特征是一个沉重的尾巴与幂律衰减。这是测试通过拟合的尾部分布不同的功能(指数、伽马、对数正态和幂律)和选择最好的一个根据Akaike信息标准(AIC) [37]。过渡到幂律发生 。同样的行为是观察选举。注意效率分布的形状不是特定选举的上下文,因为这种结构一直在观察效率分布对应于不同性质和大小的Twitter对话(29日]。
我们相比效率的每一方的政治账户模式对整个组用户的选举。为了做到这一点,我们把区间跨度的所有可能值效率(如图8在对数垃圾箱。然后,我们计算的概率的一个给定的方在每一本( )和的概率属于全球对话的用户帐户( )。最后,我们有了区别 四个主要的政党,如图9。
为了评估这个结果的意义,我们100个样本1000随机选择用户和计算效率的概率差异对大部分用户如上所述。差异的平均值和标准差表示,分别蓝点和蓝灰色的阴影图9。
图,可以发现账户属于政党往往表现出更高的概率比普通用户在该地区的效率 在该地区和低概率效率 。这个措施对所有类似的行为。根据这个结果,集体反应每一方具有可比性的传播策略。此外,结果表明,在一般情况下,政治账户比普通用户更有效的传播消息。
3.4。精英之间的通信
虽然大多数的用户充当被动的听众或广播电台,Twitter对话通常是由一个小的精英影响力的账户的5,38]。这种精英的组成变化取决于主体的对话和互动媒介(33]。前一节所示,政客们在最有效的用户,这意味着他们持有较高的影响力。鉴于该用户组的相关性,在本节中,我们将研究它们之间的通信动态。为此,我们有检索列表相关联的用户帐户的每一方以下部分描述的过程2。2。
为了分析政治家之间的沟通,我们计算子图诱导与政党相关联的用户帐户。然后,我们有分组节点属于同一个政党在出错,获得网络。结果出错导致用户组对应的权重之间的联系这些出错的所有链接的权重之和,加入一个用户从一个组与原有用户的另一个网络。由此产生的彩色邻接矩阵显示在图中10,数字是链接的权重的,也就是说,一方的总次数,用户连续提到过(转发)另一方的用户列。颜色与提到的比例(转发)聚会相对于提到的总数(转发) ,这样,如果是邻接矩阵的一个元素,细胞的颜色会成正比 。
如我们所见,与之前的作品(5,15),是一个完整的账户之间缺乏沟通不同的政党。邻接矩阵的对角线(self-links)把最重的重量超过两个数量级。对于转发网络,不同党派之间几乎没有联系。考虑到这样一个事实:转发一条消息通常意味着支持楼主的想法,这并不奇怪。在提到网络的情况下,有更多比转发消息交换网络。
我们包括党IU分析研究它们之间的协议的影响和Podemos形成领导联盟在2016年的选举中。结果显示在图10表明,尽管双方交互已经在2015年,在2016年他们交换更多的信息。
我们也计算选型混合的演变(39)使用两种不同的政治立场分区的节点。在第一个分区,我们将每个节点分配给自己的聚会,我们有五个组的节点对应于PP、工人社会党,Cs, Podemos,领导和单位。这是分区的方。在第二个分区,我们分配节点属于IU和Podemos同一组领导,离开其余的节点在自己的政党。因此,我们有四组,对应于PP、工人社会党,Cs, = (Podemos + IU)领导。我们称为第二个分区联盟的分区。
选型混合是一种度量,用于测试网络的链接优先的加入相同的节点,节点的不同或者是随机的连接。在我们的例子中,不同种类的不同党派在一个案例中,联盟。为了计算选型混合,团体和比例的节点进行分类的力量(即链接)的总重量从组组计算。在我们的示例中,由于我们党已经聚合节点的网络,我们可以用邻接矩阵的元素这样的网络来确定 :
然后, 联系的比例是一个节点类型的起源吗和 的比例与目标节点的类型 。如果我们忽略网络结构,找到的概率与来源节点的类型和目标节点的类型将 。考虑到这一点,网络的选型混合定义如下:
这个度量值 为一个完美的网络选型, 随机网络, 一个完全非选型。
在图11我们已经绘制的时间演化的选型混合党和联盟。我们可以看到,党和联盟的选型混合仍然很高的提到和转发。转发网络不过是最相配的,常常达到的值 。
assortativity下降后的第二天不同政党的选举意味着政客们互相交流更多比在竞选中那一天。这似乎是引起一些交换消息的评论部分选举结果的后果。有推文批评对手,祝贺消息关联方,tweet试图说服或推动潜在盟友形成联盟。不过,请注意,这个下降,虽然重要,并不大:2015年价值大约是0.87,2016年是0.89。因此,我们把减少的数量降低了选举后的第二天发布消息,使得数据更吵,各方之间的消息交换的一个增量。
其中最显著特征的时间序列之间的区别是2015年和2016年的选举。在后者,当事人IU和Podemos组成了一个联盟,领导一个事实反映在以下方式:而2015年联盟和党assortativities几乎是相等的,在2016年联合assortativity显然是更高的网络。这意味着,用户之间的通信Podemos IU足够高,领导一般assortativity低。
为了评估这种影响的相关性,我们已经进行了配对t检验每个assortativity assortativities时间序列耦合从2015年与2016年。零假设是选型混合值对于选举有相同的预期值。表中给出的结果6意味着,对于一个统计的信心 ,各方明确拒绝零假设的时间序列在联盟时间序列的情况下不能拒绝零假设。
4所示。结论
在这工作是我们的主要目标进行比较分析Twitter的用户行为在两个连续的选举活动为了找到相关性的存在和复发性模式。为此,我们分析了时间系列和交互网络对应两个Twitter数据集下载在西班牙2015年和2016年的选举活动。虽然个人活动和政治行动者可能已经改变了,我们展示了复发性活动的证据模式在不同的政治运动。特别是,选举的活动时间序列表现出显著相关性。此外,我们发现了一个幂律关系每天的房费的tweet(转发和提到)和独特的用户数量。最后,除了上述行为的稳定性,我们已经能够检测的影响的一个政治联盟互动网络通过学习进化的特性。
结果,我们得到的计算和分析日常用户活动时间序列对选举表明,他们呈现出显著的线性相关性。此外,通过研究用户活动的分布,我们发现,在两个选举的指数波动紧密间隔相同。的价值获得的指数在前一个工作5)也位于这个区间。这些事实表明存在的周期性活动模式在不同的政治运动。
我们已经表明,每日微博,转发,提到遵循幂律对独特的用户数量,每天参与谈话。然而,而在2015年,三个量略超线性增长的用户数量,2016年我们观察是一个近似的线性行为。因此,在2015年,当越来越多的用户加入谈话,活动经历增量比例高于2016年。
我们评估的一致性提到和转发网络的拓扑另一次选举通过计算聚合度分布和相关性程度的网络。度的幂律指数的变化分布从一个选举周期最多是1%,而相关性程度转移从一年到另一不到10%。这些属性的值也与获得的结果与类似的政治环境(以前的工作5]。这表明潜在的相互作用规律是健壮的面对社会环境的变化。然而,日常的演变的分析程度assortativity网络使我们探测到的波动,似乎是由于破坏性事件,外生和内生,产生相关影响的政治对话。
通过计算用户的分销效率为普通用户和账户与各方联系在一起,我们已经表明,它的函数形式不依赖于选择的用户组或特定选举期间在学习。这增加了进一步的证据所表现出的效率模式的普遍性莫拉莱斯et al。29日),不同性质和大小的对话进行了分析。我们也计算用户之间的差异属于全球对话和政客和发现,在后者的情况下,效率高有更高的概率对普通用户而低效率较低的概率。这个措施对所有类似的行为。根据这个结果,集体反应每一方具有可比性的传播策略。此外,结果表明,在一般情况下,政治账户比普通用户更有效的传播消息。政客们意识到社交媒体的相关性并知道如何利用他们的权力。
提到的执行分析和retweet政治账户引起的网络使我们缺乏不同政党之间的辩论。这个结果是在良好的协议与现有文献[5,15]。此外,我们发现一个强化后的各方之间的交互可以检测到一个联盟的形成。
除了规律的行为模式,我们发现通过比较两个相似的政治背景,一些结果与之前的研究相一致的2011年西班牙选举(5),这表明存在集体行为健壮的面对社会变革,可以与西班牙政治格局有关,但与一个潜在的应用程序超出这个社会背景。一个可能使用这些结果将调查类似的政治进程,突出异常行为可能表明非典型Twitter使用在选举的情况下。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
信息披露
早期版本的工作已经在第九届国际会议上复杂的系统。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作一直支持的西班牙经济和竞争力(MINECO)号合同下。mtm2015 - 63914 p。