复杂性

在这一页上

文摘介绍结果与讨论结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

流行时间网络上的传播动力学

把这个特殊的问题

研究文章|开放获取

体积2021年| 文章的ID2069010| https://doi.org/10.1155/2021/2069010

Topic-Sentiment演化和扩散的研究时间序列的舆论来自突发事件

孟蔡 ,¹ 汉罗 ,¹ 和崔应 ²

学术编辑器: Atila布埃诺

收到了 2021年7月28日

修改后的 2021年8月31日

接受 2021年11月10

发表 2021年12月02

文摘

随着互联网的发展,社交媒体已经成为人们应对突发事件的重要平台和共享信息。突发公共卫生事件发生时,公众能够理解事件的主题和感知他人的情绪通过社交媒体,因此建立一个合作的通信网络。在这项研究中,我们把突发公共卫生事件为主要研究对象,自然灾害,事故,和社会安全事件作为二级研究对象,进一步揭示了公众舆论的形成和演化定律分析时间的网络社交媒体平台的主题和情绪。首先,我们确定了派生的主题通过构建主题模型,用情绪分类模型将派生的文本情感主题分为两种类型:积极情绪和消极情绪。然后,ARIMA时间序列模型被用来适应和预测主题和情感的演化和扩散规则来自公共意见时间网络。发现的进化规律推导出舆论在各种类型的突发事件和异同密切相关政府措施和媒体报道。管理的相关研究提供了基础的网络舆论,更好的实现应急效果。

1。介绍

随着经济的发展和深化的社会转型时期,社会矛盾进一步加剧,突发事件的频繁发生已成为社会治理所面临的严峻考验1]。根据相关研究,紧急事件被定义为对人类生活构成严重威胁,健康,财产,和安全,进一步分为四种类型:自然灾害、事故、公共卫生和社会安全事件(2,3]。例如,2020年COVID-19爆发是一个典型的公共卫生事件,带来了严重的经济损失和人员伤亡,世界上所有国家和社会秩序的治理提出了严重的挑战,维护社会稳定。突发公共卫生事件或其他类型的事件发生时,人们会进行激烈的讨论社交媒体在相关事件,试图获取信息相关的事件和理解情况相关事件与社会媒体的便利,减少不确定性带来的影响(4]。然而,紧急的即时性使政府和媒体的反应滞后,不能满足公众的需求爆炸性事件相关的信息,经常离开公众在缺乏信息的情况和心理焦虑。这个时候,公众很容易受到虚假信息的影响,往往会形成负面情绪,使应急管理更加复杂,削弱社会凝聚力,影响社会秩序和社会稳定,最后导致社会危机(5]。

近年来,随着现代社会的一个组成部分,社会媒体已经渗透到每个人的日常生活。据有关机构的统计数据,2021年全球社交媒体的用户已经超过47亿,这意味着平均6的人使用社交媒体(6]。通过社交网络建立的社交媒体平台,一方面,公众可以方便地表达自己的观点,分享他们的经验和想法,使评论事件。另一方面,他们也可以与其他社会媒体用户通过交互等功能的拇指,转发和评论7]。社交媒体的即时沟通和互动的优点也使其发挥着越来越重要的作用在突发事件的应急管理8]。因此,当发生紧急情况时,公众往往使用社交媒体来收集和传播信息,形成一个合作通信网络在社交媒体平台上通过交换图片,文字,和其他信息,实现信息共享和交换意见9),这也为救援提供了有利条件和管理后紧急情况的发生。

此外,突发事件的发生往往不是孤立的,但会有进一步的进化和发展在时间和空间的背景下,在环境的作用下获得其他相关事件。当紧急情况发生时,公众的讨论和关注突发事件本身的定义通常是指最初的紧急的公众舆论,和公众讨论和关注相关事件的演变在时间和空间中紧急的定义是派生的公众舆论(10]。简而言之,紧急情况在社交媒体上的传播过程是受到各种外部因素的影响,从而形成其他相关事件的内容。派生的公众意见来自公众的讨论和关注相关事件突发事件在分化后的社会网络。的典型特征派生的舆论评价对象的转移,这是不同于原始的公众舆论的研究对象。与原来的舆论相比,紧急派生舆论更暗。在紧急的早期阶段,它隐藏在原始的进化公众舆论和难以吸引公众的注意力。然而,当最初的公众舆论的紧急发展到一定的阶段,或者当紧急的控制和治疗措施是无效的,派生的舆论往往会迅速爆发。一方面,它吸引了公众的注意,成为社会的一个热门话题,进一步扩大影响的范围和程度的函数的紧急11]。另一方面,它也会影响原来的公众舆论,加剧和升级的公众舆论,舆论管理的难度增加的社交网络,并进一步影响社会秩序和社会稳定12]。因此,公众舆论来自突发事件的相关分析基于公共卫生事件不仅有利于突发事件的预测和应急管理,但也减少网络舆论的负面影响,这是一个重要保障的实现网络安全管理和维护社会秩序和社会稳定。

在这项研究中,我们把舆论来自突发公共卫生事件为主要研究对象,并介绍其他类型的突发事件如自然灾害、意外事故和灾害,和社会保障作为次要的研究对象。结合时间序列分析方法,本研究试图探讨topic-sentiment进化定律舆论来自于公共卫生事件时序网络,进一步比较topic-sentiment演变规律的共性和区别不同类型的突发事件。通过上述分析,本研究试图回答下列问题:(1)什么是公众意见的话题演化的特点源于突发公共卫生事件时序网络吗?与其他类型的紧急情况有什么不同?(2)什么是舆论的情感发展的特点源于突发公共卫生事件时序网络吗?与其他类型的紧急情况有什么不同?

本文的其余部分的结构如下。在下一节中,这项研究将审查公众舆论来自突发事件及相关研究topic-sentiment进化。第三部分介绍了本文的方法,主要包括模型的原理和优点。第四部分介绍了本文的研究设计,包括数据采集和预处理,主题模型,情绪模型和时间序列模型。第五部分给出了本文的研究成果,揭示了主题,情绪派生的公众意见时间网络的演化规则。第六部分是本文的研究结论,总结了上述,提出后续研究的进一步发展方向。

2.1。研究公众意见来自突发事件

导舆论的讨论和互动中形成的社会媒体用户在相关事件突发事件的演化。这些相关事件通常被称为二次或衍生品活动,发展从最初的事件。其中,原始事件通常指第一次出现的紧急事件,然后发展和传播,而次要的事件和衍生品事件是一系列相关的事件,从原始事件作用下的时空状况10]。两者的区别在于,次级事件和原始事件相一致的类型和发生的原因,连续性和链接,而导数事件完全不同于原始事件的类型和发生的原因(11]。简而言之,次要的事件由最初的触发事件,同样作用于对象的事件,并与原来相同类型的事件。此外,派生事件也是原始事件引起的事件,但研究对象发生了变化,不同于原来的事件类型。例如,治理和预防事件引起的公共卫生事件被称为二次事件,但股票价格的变化引起的公共卫生事件属于派生事件。此外,从内容的角度相关的事件,一些学者认为,相关事件反映的是原始事件从不同方面,和他们的名字相关的事件子事件12,13]。然而,很少有研究相关事件的定义和特性描述,缺乏权威的定义标准和判别框架。因此,为了方便后续研究工作,一系列相关事件的演变在时间和空间的背景下突发事件的统一被称为衍生事件。

网上舆论突发事件指的是合成的态度、意见和情绪表达在社交网络突发事件的发生和传播在一定时间和空间与社会媒体平台沟通渠道(14]。派生的公众舆论是指社会媒体用户表达自己的观点,意见,评估衍生事件的突发事件通过网络平台(15]。现有的相关研究,推导出舆论为研究对象主要集中在派生的公众舆论的传播和预测,派生的公众舆论的进化机制,派生的形成和响应公众舆论,等等。其中,派生的公众舆论的传播和预测主要是研究。一方面,信息挖掘方法用于理解派生的公众舆论的传播机制;另一方面,机器学习等方法用于实现派生的预测公众舆论。例如,一些学者建立了数字模型来模拟网络谣言在社交网络上的传播动力学,确定网络谣言的传播特点,一个特殊的公众舆论,导数在社交网络16]。此外,一些学者建立了控制模型和解释的传播模式派生的舆论传播机制的基础上,实现派生的公众舆论的控制(17]。至于派生的公众舆论的预测,一方面,最近的研究使用黄芪丹参滴丸等机器学习算法来分析文本语义实现派生的公众舆论的分类(18]。另一方面,深入学习算法,如神经网络用于实现派生的预测舆论通过社交媒体数据的分析19]。

目前,派生的舆论的进化机制研究主要采用案例研究的方法,分析得到的进化舆论在社交网络通过选择特定突发事件为研究对象。一些研究选择一个紧急事件为研究对象。例如,基于紧急事故的调查和灾害事件,演化路径和内在逻辑的公共意见探讨来自政府之间的互动和游戏,媒体和公众(20.]。也有研究采取大规模的紧急事件的数据集作为研究对象。例如,基于101年紧急事件的分析数据集,网络民意的变化在时间和空间探索,提供丰富的研究基础派生的公众舆论的进化机制(21]。第三方面,相关研究导数舆论关注导数公众舆论的形成原因和应对策略,并提供导数的理论总结舆论从多学科的角度来看。例如,一些学者描述的传播模式派生的舆论在社交网络通过流行病学模型解释了原因专家干预和政府行为不能从时间延迟的角度发挥作用(22]。从竞争的角度扩散,一些学者提出了网络中断策略和平衡策略处理导数在社交网络舆论的传播,控制舆论的导数,并降低等负面舆论谣言造成的损害(23]。

总之,导数舆论的出现引起了社会各界的关注,成为学者研究的一个重要话题。然而,当前舆论对导数的研究主要集中在导数公众舆论的形成原因和对策,和缺乏足够的探索导数舆论的演变在时间尺度。因此,我们引入了时间序列模型分析公众舆论来自突发事件的演化规律在社交网络从时间序列的角度,让舆论对治理的贡献来自突发事件和维护网络秩序。

2.2。对网络舆论的研究话题

随着互联网和信息技术的发展,人们已经习惯了从社交媒体获得信息。然而,在社交媒体信息的复杂性和多样性使我们更难找到我们想要的信息。使用主题发现方法来分析主题事件新闻不仅可以帮助人们更好地理解事件的发生和演化也分析的问题和理解公众舆论和公众的关注焦点。因此,主题的分析方法发现已经吸引了许多学者的关注,并被广泛应用于网络舆论的相关研究24]。

目前,网上舆论突发事件的研究主题主要关注的话题发现和传播演化网络舆论。其中,网络舆论的话题发现主要是针对意外事件主题的识别在社交网络上,或者是改善和优化预测模型的准确性基于最初的模型。聚类分析和主题模型通常采用的研究。前主要是基于文档的相似度聚类假设相同的类是大型和文档的相似度不同的小类,然后将文本信息转化为数字信息和加工的机器学习方法。例如,一些研究使用社会媒体的大规模文本数据来检测微博事件监控系统基于细分,根据考虑频率分布和信息内容的相似度,发现应急事件事件的推文段片段然后集群事件片段的事件来实现识别相关事件(25]。也有研究使用机器学习的聚类算法确定主题趋势在社会媒体和提供有意义的分析合成准确的描述每个主题(26]。后者是基于主题的发现工具广泛应用于文本挖掘自动找到潜在的隐藏主题和模式从大规模文本数据。最广泛使用的模型是LDA(潜在狄利克雷分配)模型及其改进模型(27]。例如,LDA模型用于检测和分类主题的演变在社交网络在突发公共卫生事件发生时(28]。基于LDA模型,TS-LDA(趋势Sensitive-Latent狄利克雷分配)模型提出了更有效地从文本信息中提取潜在的主题(29日]。

网络舆论的传播演化主要关注的通信机制和演化规律紧急主题在社交网络。通过分析大型社交媒体数据,它试图描绘事件主题在社交网络的通信路径基于演化模型。相关研究集中在建立应急主题的演化模型在社会网络或意识到进化的生命周期紧急除以主题《社交网络》中。例如,基于OLDA (LDA)在线主题演化模型,结合话题之间的相关性在不同时间片段,网上舆论的话题演化已经有效地测试(30.]。一些研究把LDA模型与改进的桦树层次聚类方法提出一个新的文本增强策略,扩大社交媒体的内容较短的文本特征,然后提取网络舆论的话题演化特征(31日]。除了LDA等基于主题模型的研究,一些学者还介绍了社会网络分析方法构建基于网络的话题演化模型矩阵由转发关系,进一步探讨事件主题的互动和演变机制在环境的影响下在舆论的沟通32]。此外,主题的发展生命周期的突发事件也吸引了许多学者的关注。例如,基于事件主题的信息的数量在不同的时期,网络舆论的发展分为四个阶段:初始阶段,爆发阶段、下降阶段和结束阶段(33]。或者根据事件的性质,如选择为研究对象,突发公共卫生事件网络舆论分为不同阶段根据当地的病毒进化和热的趋势34]。还有些研究分析突发事件的传播特征在不同的生命周期阶段,如传播期间,控制期间,和稳定的时期,通过模拟多个紧急情况在社交网络的时间演化过程(21]。

总之,网络舆论的主题研究相对成熟,取得了良好的效果,而很少有研究将派生的公众意见的主题作为研究对象。有鉴于此,我们以派生舆论为研究对象,探索传播进化定律推导出舆论话题,和比较,进一步探索不同类型的派生法律舆论的突发事件。

2.3。情绪研究网络舆论

随着互联网技术的发展,公众已经习惯于使用社交媒体在他们的日常生活。通过提取用户的文章、评论、微博、博客、讨论、和其他内容在社会媒体,我们可以分析社会媒体用户的意见和态度,然后推断出个体情感的趋势和行为偏好(35]。这种分析方法通常被称为情绪分析,有时也称为观点分析,意见挖掘(36]。作为自然语言处理的一个分支,它被广泛应用于信息检索、文本挖掘等领域(37]。例如,测试集的基础上,相关研究人员进行检索评估利用信息的相关性判断的对象和主题,来验证的有效性和可靠性测试集的收集的信息检索评价(38]。此外,也有研究基于社会网络分析的方法来进行情感分析突发事件在社交网络的大规模文本数据,了解活动内容的通信结构和特点(39]。

类似主题的研究,传播进化也在线民意情绪研究的重点。网络舆论的情绪的研究主要集中在两个方面,即情绪的影响因素和情绪的进化机制。基于文本信息的分析,我们不仅可以了解哪些因素会影响情绪,也理解情绪的变化在不同的时间和空间,实现情感的分析和预测。其中,领域的商业产品,情绪的影响因素分析是最常用的。例如,一些研究把手机产品在亚马逊的评论文本的情绪,如快乐、悲伤、信任、和愤怒,和了解消费者的影响因素的情感通过审查文本的分析,为手机制造商提供反馈(40]。根据产品评论的内容特点,一些研究来了解用户偏好的影响因素进行评论,提高用户感知信息的有效性的购物平台,并为用户提供更好的建议在产品的选择41]。除了对情绪的影响因素的研究,我们也可以使用社交媒体用户的情绪来分析网络舆论的进化的传导机制,实现突发事件的预测。例如,基于移情和传染性的情绪,学者们用社交媒体数据预测国家政治选举基于情感分析方法,取得了良好的结果(42,43]。一些学者也用意见挖掘和情感分析来预测股票价格指数和趋势基于公开评论和意见发表在社交媒体平台(44,45]。

我们可以做情绪分析之前,我们首先需要分类的情绪。常用的研究方法主要分为两类:基于情绪情绪分类词典和情绪基于机器学习的分类(46]。前者主要是基于词汇和短语的意义在文档中标记文档的情感方向,通过手动筛选,基于现有的字典,或基于语料库建设的方法。例如,NRC情绪词典是用来计算的情感表现新闻标题在八维当紧急情况发生时(47),或以突发事件为例,点互信息的方法,基于现有情绪词典是用来构造emoji字典来计算文本情感(48]。semisupervised,后者需要使用监督和非监督机器学习方法,如支持向量机、朴素贝叶斯、和神经网络分类基于标签的数据作为训练集的情绪。例如,支持向量机作为分类器进行分类的文本数据集的映射emojis和词向量到情绪空间(49),或语法作为文本特征和朴素贝叶斯分类器来识别情感类型的网民(50]。深度学习技术的发展,越来越多的研究使用深度学习模型作为一个分类器来取代传统的机器学习模型的简短文本情感分析。例如,通过情感数据分析框架,使用卷积神经网络实现识别不同情感类型的文本,视频,和其他数据(51),或者基于循环神经网络,长期和短期内存模型(CLSTM)介绍,使循环神经网络更好的存储的信息(52]。这些研究取得了良好的效果,使深度学习情绪分类最受欢迎的方法之一。这些研究的成功使得深度学习情绪分类的最受欢迎的方法之一。

总之,网络舆论的研究利用情绪分析一直是研究的一个热门话题。然而,情感的差异进化《社交网络》中通过比较不同的导数舆论突发事件衍生舆论为研究对象得到了学者们的关注。有鉴于此,我们将深学习情感分类方法,并尝试进一步研究情感的进化派生的舆论在社会网络基于时间序列分析。此外,我们还比较和探索法律舆论来自公共卫生事件和其他类型的紧急情况。

3所示。提出的方法

在本部分中,我们介绍了研究方法主要用于研究和构建三种模式,即主题识别网络舆论,网络舆论的情绪分类,和时间序列模型的在线民意。在话题识别模型中,研究主要用于Word2Vec词向量模型将文本数据转换为矢量,然后使用聚类方法实现主题识别。在biLSTM情绪分类模型,模型主要用于实现文本的识别情绪训练集的基础上,它分为积极和消极情绪的类型。时间序列模型,研究主要利用ARIMA模型进行topic-sentiment分析公众舆论来自紧急情况,并进一步比较不同类型的紧急情况,探索进化共性和差异的突发公共卫生事件和其他类型的事件时间网络。在本节中,我们将简要介绍Word2Vec词向量模型的原理和优点,biLSTM情绪分类模型、ARIMA时间序列模型。

3.1。建设主题识别模型

社交媒体为人们提供了一个方便的渠道了解有关突发事件的信息。然而,网络数据的大规模的,大量的无用的信息,和噪声的存在使其更难以提取有效的信息。及时、准确地发现重要信息,主题识别方法已广泛应用于社会媒体的事件检测和信息提取(53]。然而,在Twitter和Facebook等社交媒体平台,由短的文本信息,传统的主题识别模型由LDA不适用,和主题识别的有效性不能充分保障(54]。作为一个典型的主题模型,LDA主要使用集群文件和软聚类方法,通过研究文档矩阵,实现主题聚类通过使用的同现关系词的文档。然而,当话题模型应用于短的文本文档,稀疏数据经常出现的问题。具体来说,一方面,总之文档的字数小于在长文档,所以很难区分文档语义模型通过少量的单词。另一方面,上下文简而言之文本的数量限制了模型的应用,使主题模型很难准确地确定模糊词的含义。为了进一步提高主题识别的准确性,研究人员提出了一系列主题识别和文本挖掘方法基于深度学习,其中最具代表性的模型Word2vec,可以生成词向量和由浅和两层神经网络结构55]。与话题模型由LDA相比,Word2vec主要表示为嵌入模型与神经网络结构。通过学习context-word矩阵,单词转换成词向量,它显示了更好的结果在话题识别的文本信息。

Word2vec词向量模型可以被看作是一个简化的神经网络模型。首先,文本处理通过使用浅神经网络,并根据使用大数据集作为训练集,词与词之间的关系和上下文。其次,这个词的语义映射到向量空间,和词转化为分布向量代表这是一个类似语义词(56]。其中,词向量Word2vec模型的训练主要是完成Skip-Gram模型和连续Bag-of-Words (CBOW)模型。不同之处在于,前者主要实现上下文的预测单词通过当前词的语义,而后者主要实现预测当前的单词通过上下文的语义。虽然Skip-Gram模型更准确的获取词向量的文本在遍历所有文本,CBOW模型已经被研究者采用更高的效率和更快的速度在分析大型社交媒体数据集(57]。考虑到本文采用相对较大的数据集,我们使用CBOW模型进行主题分析舆论来自突发事件。

作为CBOW浅神经网络模型,模型由输入层、投影层和输出层。是一个词袋模型形成基于连续分布的词表达方法(58]。CBOW模型的目标函数通常表示为一个对数似然函数,所示(1),代表模型的目标函数,是中央词研究,是一个给定的序列训练的话,这意味着单词被中央前后的词。

CBOW模型预测基于上下文的中心词词的概率。假设语料库是训练词汇的数量,然后呢是的组件值向量。基于中心词的上下文信息 ,规范化的模型结合softmax函数计算和最终生成的矢量值。所示的具体计算

CBOW模型的结构如图1。首先,模型输入上下文的目标词,通过嵌入层初始化随机权重。其次,模型传输嵌入这个词的上下文词语λ层获得平均字嵌入。第三,我们通过平均词向量致密层和匹配预测词与目标词的基础上,预测将softmax目标词的功能。最后,损失计算和嵌入层更新是通过分类叉和反向传播来实现,分别。

3.2。情感分类模型的建设

近年来,基于深度学习的情绪分类模型取得了良好的效果在测试和被广泛应用59]。其中,在自然语言处理的研究中,要求输入变量的长度,递归神经网络(RNN)已成为一个重要工具领域的情感分析的高效信息处理(60]。在这项研究中,一个双向短期记忆模型被用来实现情绪分类基于递归神经网络。

长期短期记忆模型,递归神经网络的一种变体,是广泛用于情绪分析。一方面,这是因为模型的设计结构可以捕获远程依赖关系和解决传统递归神经网络的短期记忆的问题。另一方面,它不仅可以考虑文本数据的顺序也保存或删除信息在培训过程中,所以它有一个很大的优势在连续的文本数据的处理。模型的实现主要分为三个阶段:选择性记忆,遗忘和输出阶段。选择记忆是输入阶段,有选择地记录输入信息。忘记是第二阶段提取的信息,忘记不重要的信息和记录重要信息,实现信息的选择记录。输出阶段决定哪些信息是最终输出到当前状态。

对应于模型的实现阶段,长期短期记忆模型选择信息通过“门”实现选择性的信息通道。模型的结构是由一个输入门,忘记门,输出门,和内存单元。模型主要实现信息的选择通过忘记门被遗忘,和特定的公式所示(3)。忘记门为代表的象征 , 是激活函数,和 ,分别代表忘记门的重量和标准偏差,代表隐藏状态前一刻,表示文本信息在当前时刻的输入。

相对应的输入通道选择记忆阶段的模型,主要决定了文本的输入信息和实现内存信息的保存。具体计算公式如下所示,代表输入门,代表了临时内存单元,和分别代表输入门的重量和标准偏差,和分别代表了重量和标准偏差的内存单元,和表示前一时刻的内存单元。

类似于输入,输出门对应于模型的输出级,主要决定了输出文本信息的内存单元在接下来的时刻。具体计算公式如下,输出门所代表的象征 ,所表示的内存单元的象征 , 和代表输出门的重量和标准偏差,分别和表示隐藏状态的内存单元前一刻和当前时刻,分别。

长期短期记忆模型可以有效地流程顺序文本和解决复发性神经网络的短期记忆问题,已被许多学者认可。然而,LSTM也有一些缺陷。它只能处理数据从前面到后面,忽略了文本信息落后的特点,不能从后面到前面编码信息。因此,为了进一步提高分类的准确性的影响,我们采用了双向短期记忆模型实现情绪分类工作。双向长期和短期内存模型是由前后两个长期和短期记忆模型,包括所有向前和向后的信息。它可以完成序列数据的学习从前后两个方向,最后,得到输出结果的准确性。模型结构如图2在下面。首先,模型输入pretraining嵌入层中的文本数据并将其转换成词向量。其次,向前和向后LSTM模型是用来获取信息之前和之后这个词向量,然后拼接。最后,完成信息输入将softmax功能层输出的概率分布积极和消极情绪的基础上,预测函数。

3.3。建设的时间序列模型

时间序列是一个序列形成的顺序相同的观测值对象的顺序。其目的是使用现有的历史数据来预测未来的数据(61年]。实现预测的观察,随机和动态模型建立了基于时间序列的数据。常见的模型包括自回归(AR)移动平均线(MA)和向量按照(VAR),以及自回归移动平均(ARMA)和自回归综合移动平均(ARIMA)模型基于AR和MA模型。与其他模型相比,直接使用过去的值来预测未来值,ARIMA模型第一权重过去的数据和纠正错误值,显示一个更好的预测效果,所以它被广泛用于时间序列分析(62年]。基于现有的研究中,本研究主要采用ARIMA模型实现topic-sentiment进化分析公众舆论来自突发事件,然后探讨突发公共卫生事件的内部形成和传播规则和其他三种类型的紧急情况。

ARIMA模型是基于时间序列组合模型,基于“增大化现实”技术是指自回归模型,它主要使回归预测基于滞后数据和观测数据之间的相关性。用于表示自回归项的数量。我们将整合,它表示为一个整数秩序。同时,这也让时间序列的次数固定和改变。时间序列的平稳性是由测量观测值在不同时期,地方差异的数量平稳时间序列通常是由。马是指移动平均模型衡量观测值之间的相关性和残余项,移动平均线项目的数量在哪里经常表达的。因此,ARIMA ( )也常用于研究代表了自回归移动平均差模型(63年]。

ARIMA模型的基本原理是近似数据通过数学方法观察对象的时间变化,实现未来的预测基于历史数据的拟合。一般阶自回归(AR)模型方程所示(6)。其中,固定数据系列为代表 ,自回归系数为代表 , 表示时间序列的随机误差项,也称为白噪声序列代表了常数。

移动平均(MA)模型方程所示(7),代表了移动平均系数,代表了白噪声时间序列的过程,和表示期望的平稳时间序列,它通常被认为是0。

ARIMA模型结合基于“增大化现实”技术获得,模型,和差异,模型方程所示(8),代表了数据系列差异后,将非平稳的时间转化为平稳时间序列。的参数代表的AR模型参数马代表的顺序模型,代表的是白噪声序列,代表了常数。

利用ARIMA模型分析导数公众舆论在时间尺度主要涉及以下步骤。首先,派生的公众舆论的稳定性试验应进行。如果它是不稳定的,非平稳的序列应该转化为静止的使用微分变换或其他方法。在本文中,我们主要使用图方法来检查时间序列数据的平稳性。生产后的时间序列图微博的发布时间为横坐标,文本为纵坐标,可以判断时间序列数据是稳定的通过观察派生的公共意见时间网络的趋势。其次,模型的形式是由自相关系数和偏相关系数,和ARIMA的参数( )模型确定模型的拟合程度。最后,白噪声测试是对残差序列进行判断的影响从模型中提取有用的信息,达到准确预测派生的公众舆论。

4所示。研究设计

在这项研究中,我们第一次抓住了公共卫生事件作为主要研究对象,然后抓住了微博数据集的三种不同类型的突发事件,自然灾害,事故,和社会安全事件,进行比较分析。此外,我们完成文本预处理通过删除停止词,分词、文本内容过滤。其次,我们使用Word2Vec和K——聚类方法来提取各种类型的突发事件的主题和所确定的主题划分为原始主题和派生的主题,进一步获得衍生主题每个紧急通过计算的数据集。第三,基于训练数据集,我们结合双向短期记忆模型实现文本信息的情感分类,把它分成两种类型:积极情绪和消极情绪。最后,我们用时间序列分析方法模型派生的公众舆论,探索topic-sentiment进化机制派生民意的公共卫生事件,画出进化图,并与其他三种紧急情况做个比较理解进化规律的共性和差异。研究框架如图3。

4.1。数据收集和预处理

研究主要以突发公共卫生事件为主要研究对象,通过与其他三种紧急情况的比较,揭示了公众舆论的topic-sentiment进化的共性和差异来源于时间网络上的突发事件。因此,我们选择了四个代表突发事件近年来作为我们的案例材料,通过新浪微博获得数据源。其中,我们选择的情况下“病毒游轮”(大规模病毒感染在日本豪华游轮)在公共卫生事件作为主要研究对象。这是因为它不仅涉及到大规模的病毒传播在一个狭小的空间里,引起了世界的关注,但也因此COVID-19典型的相关性。此外,森林大火,爆炸,金矿和人质劫持事件是选为自然灾害、事故、和社会保障情况下,分别。

新浪微博是最具代表性和影响力的信息互动和交流平台。类似于Twitter, Facebook和其他社交媒体平台,用户分享他们的经验,表达他们对事件的看法,和相互作用在微博上,从而构建一个信息交换和共享网络。通过有限的时间和搜索关键词的方法,研究人员获得了事件的帖子和时间信息的四种类型的紧急情况下平台,这为我们的后续研究提供了足够的数据支持。

在数据分析,进一步提高模型操作的效率和结果的准确性,需要采取一些数据预处理步骤。首先,我们做了一个初步浏览我们获得的数据删除无效的帖子和过滤文本内容通过正则表达式等方法。其次,我们使用了Jieba中文文本的分词工具解决问题缺乏空间中文文本与英文文本。最后,为了进一步处理无效的单词在文本数据,我们使用了中国停止词表标签停止词词性和删除。

4.2。话题识别模型的设计

之前使用Word2vec模型将文本信息转换成一个词向量,我们首先提取功能词通过TF-IDF模型减少无用的信息的干扰和噪声在文本数据。基于加权处理,我们从每个文本数据中提取20最重要的关键词和使用它们作为词语料库集向量变换。其次,我们使用在Word2vec CBOW模型变换向量的数据集,这个词的文本转换成一个词向量,使用普通的文本挖掘方法k——集群的文本。最后,我们把提取的主题分成不同的集群根据文本之间的相似度,实现识别文本主题。

在使用Word2Vec词向量模型和K——聚类方法实现话题识别的文本数据,我们确定主题分为原始主题和派生主题根据派生事件的判断标准。在现有的研究中,这是很常见的检测基于主题派生事件识别基于聚类方法(64年]。考虑到评价主体参与公共突发事件的意见在社交网络很容易识别,结合现有的研究,我们认为评价对象的变化作为原始主题的分类的标准和派生的主题。如果评估的主题主题已经改变了,这个话题将被确定为一个派生的话题,和一个包含派生的数据集的话题将进一步建立了分析(65年]。

分析公众舆论,我们需要建立派生民意数据集根据所确定的主题。首先,我们需要给所有文本数据对应主题根据主题识别模型区分每个事件的文本数据和数据集分成不同的主题。其次,我们使用代表了主题模型和确定的话题代表每个主题的关键词。主题的序列号 ,关键字的序列号 ,和主题(关键字)( )。例如,第一个字的第一个话题可以表示为( ),第一个字的第三个话题可以表示为( ),等。第三,我们使用代表某一关键字的出现频率在主题 ,和的值可以从任何文本获得数据。最后,我们比较值在不同的文本数据。值越高,越有可能文本数据是属于一个特定的主题,来获取原始数据集的主题和主题派生而来。后获得的数据集派生的话题,我们统计微博发布时间之间的关系和派生的话题的微博帖子数量数据集,然后得到的时间序列数据进行分析。

4.3。情感分类模型的设计

在这篇文章中,我们主要使用双向长期和短期内存模型实现情绪分类,但是在使用深度学习模型文本情感分类的数据,我们需要训练和测试的情绪分类模型基于微博的测试训练集数据。结合现有的研究中,我们使用微博人气的公共数据集分类评价NLPCC国际会议在2013年和2014年作为我们的模型数据集。我们把情绪分为两种类型:“积极情绪”和“负面情绪”,其中包括积极情绪的情绪,如爱和幸福,而负面情绪包括情绪如厌恶、恐惧、愤怒和悲伤。

为什么我们选择NLP&CC训练数据集和测试数据集是NLP&CC已广泛应用于细粒度的中国情绪分类模型的训练和评价近年来,取得了良好效果66年,67年]。另一方面,NLP&CC数据集来自新浪微博平台上,这是符合我们的数据来源和适合我们的情感分析研究。同时,考虑到一些新单词,最初并没有包含在训练数据集是现在广泛使用的语料库可能随时间改变。采用biLSTM模型实现情绪分类之前,我们随机捕获和过滤200000微博,通过使用CBOW pretraining方法进行,获得的语义表示和语义相似的单词通过pretrained字嵌入模型。因此,当输入语句包含这个词没有出现在训练语料库但pretraining语料库中出现,该预测模型还可以掌握其情感意义和进一步提高模型的预测精度和泛化能力。pretraining后情绪分类模型,我们在微博进行情绪识别的数据集,把微博帖子分为积极和消极情绪类型,并指定相应的情绪标签文本数据。模型的精度是0.71,满足研究的需要。

4.4。时间序列模型的设计

实现topic-sentiment派生时序网络舆论的分析,我们使用了ARIMA模型分析推导出基于获得的数据集的数据集。派生的公众舆论,研究主要建立一个时间图与文本为纵坐标的数量和时间尺度脓肿,观察派生的主题和情绪的进化时间尺度的公众舆论。其中,获得基于主题的步骤时间序列数据的派生的公众意见如下。

首先,主题聚类的文本数据进行识别模型,通过一个话题和相应的标记分配给每一个微博话题。其次,我们将主题确定的主题模型划分为原始主题和派生的主题和提取文本数据包含所有派生的主题根据推导的计算方法主题数据集。第三,我们选择一个派生的话题,需要分析,过滤,并提取数据集,数据集建立派生的话题。最后,我们建立了一个二维坐标图根据发布时间和派生的主题的文本数量数据集进行时间序列分析的主题派生而来。

时间序列数据的采集方法类似于基于观感舆论话题数据。首先,进行情感分类是文本数据和相应的情绪类型是给每个帖子。第二,所有文本数据包含导出主题提取根据派生主题数据集的计算方法。第三,根据分析的需要一定的情绪类型、情绪数据集来自事件建立了筛选和提取数据集。最后,根据发布时间和数量的文本数据集,建立了坐标图来分析情绪来自公众舆论的变化在时间尺度上。

5。结果与讨论

5.1。描述性分析的数据

在本文中,我们以突发公共卫生事件为主要研究对象,并进一步探索舆论的进化机制来源于公共卫生事件时序网络通过比较与自然灾害、公共卫生事件事故和灾害,和社会安全事件。我们选择了“日本病毒巡航”作为公共卫生的情况下,发生在COVID-19传播。2020年1月和2月期间,3711名船员和游客的712人被感染,许多死于日本豪华游轮上爆发。同时,森林大火(2019年3月30日,2019年4月10日),金矿爆炸(2021年1月10日,2月5日,2021年),和人质(2021年1月22日,2021年2月10日)被选为自然灾害、事故灾难、社会安全事件情况。这些事件的发生后,他们都吸引了广大公众的注意在微博平台上。公众开展相关讨论的主题,形成大量的文本数据,这为我们的研究提供了丰富的分析材料。

在指定的时间的情况下,我们从微博抓取相关数据平台通过搜索关键词。例如,我们爬帖子相关公共卫生事件在微博上从1月19日,2020年,2月21日,2020年,基于搜索关键字,如“COVID-19病毒游轮”和“游轮爆发”。文章包括用户的评论事件本身和与他人的互动评论。最后,完整和有效的帖子的数量达到了85551。文章的数量的紧急情况如表所示1。

5.2。导舆论基于主题识别的数据集

在这项研究中,Word2Vec词向量模型被用来将文本数据转换为向量,和K聚类方法则被用来实现主题识别。考虑到研究的主要对象是派生的舆论的形成和发展,我们只显示突发公共卫生事件的聚类结果在下表中2和实现派生的识别主题根据派生事件的判断标准。

根据的差异K价值,的结果K值聚类也会大大改变。结合数据量和数据内容,我们选择合适的K价值实现文本聚类。聚类结果如表所示2。突发公共卫生事件的文本数据聚类后K方法则可以分为9类。考虑到有限的空间里,我们只显示表中的关键字的一部分。例如,主题1和关键字可以表示为 ,即主题“警察逮捕破坏抵抗疾病”{“消除”,“逮捕”,“讨厌”,“检验权威,”“警察”“济南市委、”“打麻将”,“行业”}作为关键词。

在突发公共卫生事件的主题聚类,我们可以发现话题一起构成突发公共卫生事件的发展脉络。例如,主题3”的最新消息关于大规模病毒爆发的船”和主题6”游轮防疫和控制是无效的,成为灾区”是我们选定的公共卫生事件的开始。COVID-19游轮在这段时间中迅速传播。然后话题4“医务人员帮助感染者”和主题9“政府召开新闻发布会给病毒爆发的细节关于船”代表政府的关注和应对公共卫生事件。主题5“人们祈求平安归来的感染”和主题8“公众指责官员逃避他们的责任”不仅是公众的关心和祝福对受感染的人在船上,而且评价突发公共卫生事件的政府官员的行为。话题1”警察逮捕了那些阻碍抗击疫情,”主题2”人们呼吁共同抗击疫情,”和主题7“流行”的新闻媒体报道情况分为衍生主题根据派生事件的判断标准,因为变化的评价对象。

结合派生的公众舆论的采集方法的数据集,我们可以获得各种主题的数据集在突发公共卫生事件。例如,有2308、4138和7447年的数据的主题“警察逮捕了那些阻碍抗击疫情,”“人们呼吁共同抗击疫情,”和“疫情的新闻媒体报道情况,”。除此之外,我们还可以根据比例计算每个话题的热话题数据集的数据集。其中,有85551数据集的突发公共卫生事件,和每个主题的数据量和热量比例如表所示3。

从表可以看出3,突发公共卫生事件的主题聚类后,人气最高的主题是“最新消息关于大规模病毒爆发的船只,”曾引起了网络空间中最激烈的关注和讨论。最受欢迎的主题是“游轮防疫和控制是无效的,成为灾区,”和获得的数据集是最少的。这一现象表明,网络舆论是容易事件本身的影响在传播过程中,和初始事件的重大进展很容易吸引公众的注意,但随着时间的推移和其他新闻的影响减弱。在三个主题来自公众舆论,主题“流行”的新闻媒体报道情况人气最高,排名第二在所有话题。的主题“警察逮捕了那些阻挠抗击艾滋病”的主题“人们呼吁共同抗击艾滋病”削弱了受欢迎,但他们也排名高在所有的主题。一方面,这证实了导数民意的重要性,有一个广泛的影响范围和很大程度上的影响。另一方面,从内容的角度来看,它也证实,派生的主题发挥了重要作用在COVID-19的传播宣传和指导,导致传输内容的分化过程。

比较之间的差异和其他类型的突发公共卫生事件的传播时间网络突发事件,我们进行主题聚类为不同类型的紧急情况。此外,我们结合主题数据集的数量在每个紧急计算的热话题。主题聚类和热比较各种类型的突发事件的结果如表所示4。

根据评价对象的转移话题,确定主题可分为原始主题和主题派生而来。考虑到差异影响时间网络上各种派生的话题,我们选择了两个主题数据集最高的主题流行来自每个紧急进行进一步分析。主题数据集来自自然灾害事件是“山水保护和保卫家园”和“致敬每一个英雄带着负担。事故”派生的主题数据集包括“出了对外贸易争端矿物贸易”和“提高系统防止悲剧再次发生。的派生主题数据集公共卫生事件“疫情的新闻媒体报道情况”和“公众指责官员逃避他们的责任。“派生的话题数据集的社会安全事件是“保护公平和正义,减少悲剧”和“恶性事件引起了网友围观。”

5.3。主题的分析,推导出基于时间序列的舆论

获得衍生民意数据集后,我们使用时间序列分析方法分析提取的派生的公众意见的时间尺度。考虑到舆论的时期所有的数据集采用持续了大约一个月的研究中,它是不适合切片的单位”。“此外,进一步精炼时间尺度,更直观地显示派生舆论的进化趋势,我们最终选择了切片数据的单位”三个小时。“发布日期之间的关系和数据集计算,发表的文章数量和可分析的时间序列数据{时间,time_number}终于建成。

时间序列分析的具体步骤如下。首先,我们进口切片后发布时间和数量数据{时间,time_number}到分析软件和观察序列的平稳性通过观察图。其次,从获得的数据都非平稳的系列中,我们使用了差分法,分别进行一阶差分和二阶差分数据稳定。发现二阶的区别是更适合我们,获得的数据和数据后,变成了一个平稳时间序列的差异。第三,我们对数据进行自相关和偏相关测试后差异和决定系数的值和系数ARIMA模型结合ACF自相关图和PACF偏相关图。最后,ARIMA模型的结果与不同的系数进行了比较,并选择适当的系数绘制每个派生的形成和演化图时间网络上的话题。每个派生主题的ARIMA模型测试结果如表所示5。模型的整体拟合效果由静止的R²和的范围R²是0 - 1。值越接近1,模型的拟合效果就会越好。信息模型是由BIC准则,选择和模型根据符合程度的模型。此外,每个模型的残差不相关,和时间序列的残差数据符合随机分布的级数,并没有离群值,显示出良好的拟合效果。

根据每个派生的ARIMA模型的测试结果的话题,如表所示5,我们建立了测量和拟合图的每个派生的形成和演化时间网络上的话题。实际值和预测值的曲线为每个派生主题图所示4,发布帖子后切片的横坐标是时间,纵坐标是文章的数量。此外,红色曲线代表了实际值,蓝色曲线代表了预测值,置信区间UCL和拼箱是由紫色曲线和粉色曲线,分别。此外,数据4(一)和4 (b)分别代表最高的派生的主题和第二高的人气自然灾害应急的主题之一。数据4 (c)和4 (d)分别代表最高的派生的主题和第二主题流行在事故事件。数据4 (e)和4 (f)代表最高的派生的主题和第二主题流行的公共卫生事件,分别。数据4 (g)和4 (h)代表最高的派生的主题和第二主题流行的社会安全事件,分别。

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

从图可以看出4自然灾害事件的两个派生的主题有一个明显的“长尾效应”在时间序列,和热事件有一个明显的爆发现象开始出现,随着时间的推移,它逐渐被夷为平地。其中,派生的公众舆论的平均值数据图4(一)约为514.08,标准差为717.463,最大值为3747,最小值是0,偏态是2.440,峰度为7.033。数据剧烈波动和顶点的特点和正确的偏见。派生的公众舆论的平均值数据图4 (b)约为42.75,标准差为64.142,最大值为394,最小值是0,偏态是3.057,峰度为12.358。数据的波动仍比较严重,但是它有点温柔而图4(一),更明显的高峰和右偏态特性。

根据观察数据4 (c)和4 (d),它可以发现事故应急的派生的话题都通过一个稳定时期爆发之前,也是符合事件本身的发展。结合文本数据,事故并没有引起公众的注意后立即发生,但花了一段时间的发酵之前,终于引起了公众的意见。其中,派生的公众舆论的平均值数据图4 (c)约为73.97,标准差为294.524,最大值为3117,最小值是0,偏态是7.673,峰度为68.851。此外,数据的波动幅度大,峰值的特征非常明显,向右倾斜。在图4 (d)派生民意数据的均值为1.60,标准差为0.371,最大值是47岁,最小值是0,偏态为6.505,和峰度为49.248,显示出明显的顶点和右偏态的特点,但数据变化的范围小于图4 (c)。

基于数据4 (e)和4 (f)的变化派生的主题在时间尺度反映公共卫生事件。与其他类型的紧急情况相比,公共卫生事件的时序图像显示独特的特点。数据显示4 (e)和4 (f),我们可以直观地感受到派生的不同传播主题。前波动更加剧烈和连续经历了几个时期的波动,而后者更多的温柔和不连续地爆发。结合文本数据,我们发现,这是由于所选择的公共卫生事件的本质。世界各地频繁发生的COVID-19及其伟大的掠夺吸引了更多的关注和讨论派生的话题”疫情的新闻媒体报道情况,”和它的受欢迎程度仍然很高。时机的变化趋势的主题“公众指责官员逃避他们的责任”是由于新闻发布会的影响,提高应对流行病的方式,,并没有持续和渐渐熄灭。简而言之,公共卫生事件的舆论传播的原因时间网络上不同于其他突发事件主要是与公共卫生事件本身的特点有关。不同于其他突发事件,公共卫生事件往往持续很长时间,容易发生急剧变化的外部环境的影响下。此外,与其他活动相比,公共卫生事件有一个广泛的区域的影响,以及影响的程度不同治理措施和环境在不同地区的差异。在图4 (e)均值为209.21,标准差为243.799,最大值为1811,最小值是0,偏态是2.494,峰度为10.211。数据的大幅波动,与大量的山峰,和有明显的right-skewness特征。在图4 (f)均值为31.16,标准差为81.708,最大值为634,最小值是0,偏态是5.219,峰度为31.352。相比之下,图4 (e),中值较小,波动相对温和,但顶点和右偏态更明显。

基于数据4 (g)和4 (h),我们可以观察到的变化派生主题的社会安全事件时序网络。他们两人经历了相对激烈波动的事件,并随着时间的推移,慢慢加热冷却曲线逐渐变得平坦。在图4 (g)数据的均值为140.55,标准差为646.252,最大值为6208,最小值是0,偏态是6.929,峰度为55.914。数据的波动比较剧烈,高峰期的特点尤为明显,右偏态。在图4 (h)数据的均值为7.511,标准差为92.606,最大值为703,最小值是0,偏态是5.319,峰度为30.702。相比之下,图的平均值4 (g)数据的波动相对温和,和顶点和右偏态的特点是不明显的。

5.4。情绪分析,推导出基于时间序列的舆论

后情绪biLSTM民意数据集的分类模型,我们给每个文本数据对应的积极情绪或消极情绪标签和建立了导数民意数据集通过数据筛选。然后,我们提取的数据集的积极情绪和消极情绪分别派生民意数据集的数据集,建立了ARIMA模型分析时序网络。其中,情绪的ARIMA模型测试结果数据集来自公众舆论如表所示6。此外,我们选择适当的模型系数绘制地图的积极和消极情绪的演变在时间序列来自公众的意见。所选模型的拟合程度高于其他系数值,实现更好的结果,也要满足条件的剩余序列不相关的和异常值是0。

后确定时间序列模型的系数的积极和消极情绪,我们画相应的时间序列映射的公共意见来自突发事件。例如,积极的情绪来自公众舆论的进化趋势随着时间的推移图所示5。这个传说与时间序列的主题是相一致的。红色和蓝色曲线代表的实际值和预测值,和紫色和粉色曲线代表了置信区间的上限和下限。

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

从数据可以看出5(一个)和5 (b)公众意见来自自然灾害事件的类型有一个相对明显的积极情绪波动在初始阶段的活动,这是相对温和的随着时间的推移。结合文本材料,这主要来自公众的尊重和爱的英雄出现在事件的开始。相比之下,图5(一个)图的,积极的情绪5 (b)再次形成一波高峰时间结束时,成为人们的关注的焦点。这是因为英雄的公告列表的痛苦在紧急情况导致人们自发形成尊重和积极的情绪。

数据显示5 (c)和5 (d),它可以发现情感的进化舆论来自于事故是类似于主题演化图,这两种实现快速发酵后爆发。结合材料,积极的情绪聚集在这一次主要是应急管理部门认可的处理速度和处理方法,以及赞赏灾难受害者的顽强的求生意志。

基于数据5 (e)和5 (f),我们可以观察到的积极情绪的进化时间序列的公共卫生事件。前形成一个连续爆发波动在传输过程中,和世界各地的人们的同情和鼓励为灾难的受害者成了沟通的主流社交媒体。后者经历了一段时间的发酵。直到事件的具体方式和安排,积极情绪来自公众,主要集中在为受害者祈祷和祝愿。

数据显示5 (g)和5 (h),我们可以观察到的积极情绪的进化过程中的社会安全事件时间序列。两个相对的波动趋势相似,均呈现倒“U”波动在初始阶段的爆发事件。材料的内容集中在希望公共正义可以保护和相关系统可以改善。与此同时,这也是拯救人质的成功的喜悦和救援人员的认可。

当紧急情况发生时,负面情绪来源于各种舆论的分布在时间序列如图6。从数据6(一)和6 (b),可以发现,舆论的负面情绪变化来源于自然灾害事件时间序列提供了一个“M”形状和长尾效应。负面情绪的破裂曲线类似于积极的情绪,都在事件的发病急剧上升,但不同的是,负面情绪的持续时间短于积极的情绪。结合文本,它可能与媒体宣传内容。在初始阶段的事件,相关媒体宣传集中在自然灾害造成的经济损失和人员伤亡,但事件爆发后,它专注于赞颂英雄新兴的紧急和赞扬保护人民的精神家园,聚集更多的积极情绪,而不是消极情绪。

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

数据6 (c)和6 (d)负面情绪的变化时间序列的公共意见来自事故,类似于积极情绪。负面情绪的爆发主要是集中在事故发生后的中间阶段,这是相关公众关注的滞后造成的事故。积极的情绪是不同的,负面情绪也产生了强烈的波动变化但远低于积极情绪的变化。之后,这可能是因为事件时,救援人员搜寻相关位置的受害者在时间和供应,这削弱了形成负面的情绪,如焦虑和恐惧。

数据显示6 (e)和6 (f),我们可以观察到舆论的负面情绪变化来源于公共卫生事件在时间序列曲线变化的趋势是一致的积极情绪。负面情绪在图的曲线6 (e)不断上下波动,而负面情绪在图的曲线6 (f)形成急剧爆发趋势经过初期的滞后期。结合文本,这可能是由研究突发公共卫生事件的性质。尽管COVID-19给世界人民带来了沉重的灾难,人们也受到英雄从灾害。此外,连续战胜疫情管理困难的人民带来了信心,和积极情绪和消极情绪是相互伴随。

基于数据6 (g)和6 (h),它可以发现舆论的情感分布来源于社会安全事件时间序列类似于积极情绪,这两个显示一个倒“U”型的趋势。但负面情绪的进化曲线是陡峭,也更有戏剧性,它也与社会安全事件的快速变化,难以预测。当绑匪威胁人质的相应行动,公众的负面情绪产生大幅波动。

结合上面的分析,我们发现的进化和分布公共意见来自不同类型的事件在时间序列明显不同。基于主题的分析,发现影响事件的本质,派生的发展主题的公共卫生事件在时间序列波动性更大比其他紧急情况,随着时间的推移不断波动。此外,它也有一定的连续性。这也是因为公共卫生事件动态及时和持续发展的一个长期的过程。在太空,它涉及绝大多数人,一个更大的时间和空间范围。情绪分析,发现公共卫生事件的积极和消极情绪是类似的其他紧急情况,并都有一定范围的起伏。但更比任何其他突发事件,公共卫生事件的情感进化已经飙升和恢复而不是随着时间的推移趋于稳定。同时,积极情绪和消极情绪的发生曲线在公共卫生事件,和疫情带来的灾难使人们不断形成负面情绪。然而,负面情绪的形成并不是独立的,和英雄的出现在公共卫生事件和克服困难的好消息也会促进积极情绪的一代。

5.5。在紧急情况下情感分配派生的公众舆论

有一个更深的理解的情感动力来自突发事件在社会舆论媒体,我们进一步细分情绪分为七种情感类型:“喜欢”“恐惧”,“悲伤,”“惊喜”,“愤怒”“幸福”和“厌恶”,并使用雷达图表来描述每个派生的公众舆论的分布在不同的情绪。如图所示的细节7。为了便于对图的理解,我们把微博的数量的对数包含不同的情绪。

从图可以看出7派生的各种突发事件的舆论,喜欢的情绪占据主导地位。结合文本材料,喜欢的情绪主要来自赞颂英雄出现了紧急情况。尽管造成巨大的物质损失和人员伤亡的各种突发事件,英雄事迹和合作的精神,出现了突发事件也给公众带来了希望。其中,与其它紧急情况相比,公众舆论来自公共卫生事件的分布也在第一时间。这可能与这一事实有关的公共卫生事件更大范围和涉及最多的人,造成最多的英雄行为和行为的阻力。其次,厌恶和悲伤导数舆论发挥了重要作用的各种各样的紧急情况。结合文本材料,厌恶的阻力主要来自公众的灾难和抵抗一些行为在这场灾难中寻求个人利益。太多的悲伤来自哀悼失去生命。这一发现也对应于我们之前的结论,派生的传播在社会媒体舆论是伴随着不同的情绪的蔓延,和情感的分布也帮助我们进一步理解派生舆论的影响。

6。结论

在本文中,我们研究的主要研究对象是突发公共卫生事件,并通过对比自然灾害,事故,和社会安全应急,我们显示时间网络上的公众舆论的演化规律。首先,我们使用主题聚类方法构建突发事件和话题模型所确定的主题分为原始主题和主题派生而来。其次,我们提取衍生主题数据集根据关键字使用的派生的主题和情绪分类模型来分配相应的情绪标签文本数据。最后,我们用时间序列模型分析舆论的形成和演化规则来自突发事件和比较了topic-sentiment进化规则的突发公共卫生事件与其他事件的共同点和不同。

发现相对于其他类型的突发事件,公众意见来自公共卫生事件有独特的主题和情感的进化的特征。主题分析,公众舆论来自公共卫生事件有更明显的动态特性和随时间波动。通过情绪分析,发现舆论曲线来自公共卫生事件有更多的峰值,并没有随着时间的推移逐渐稳定,但形成了一个新的增长曲线。但与此同时,结合文本材料,发现政府的措施和媒体报道将深深影响公众舆论的波动来自突发事件时序网络。公众不仅注重原始事件的发展也非常关注导数舆论的发展。通过相关分析,我们可以有一个更清晰的理解派生时序网络舆论的传播特征。与此同时,它还可以做出一定贡献的应急管理公众舆论,减少公众的负面情绪,维护网络秩序和社会。

通过使用深度学习方法,我们可以更容易地理解公共卫生事件的传播和演化时间网络。然而,仍有进一步发展的空间深度学习的相关研究方法,如选择一个更合适的聚类模型和分类模型和选择更大的数据集进行训练。我们还将把这项研究作为出发点和将来进行进一步的研究。

数据可用性

本文的数据可从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由中国国家自然科学基金批准号下71501153,中国陕西省创新能力支持项目批准号下2021 krm135,宏大的理论和实践问题的研究基金会在中国的陕西省哲学社会科学在批准号2021年nd0221,研究陕西省教育部基金批准号下的中国20 jg020,中国陕西省自然科学基金批准号下2019 jm - 572。

引用

l .皮c,思嘉,h .元,m .宁w .广绘和n .北京”的分析和政策建议在网络舆论传播的重大安全生产事故案例研究的8·12天津港爆炸,”管理评审,28卷,不。3,p。221年,2016年。
视图: 谷歌学术搜索
“英国政府建议紧急的定义,“2007年,http://www.ukresilience.info/upload/assets/www.ukresilience.info/15mayshortguide.pdf。
视图: 谷歌学术搜索
“国家突发公共事件总体应急计划”,2006年,http://www.gov.cn/jrzg/2006-01/08/content_150878.htm。
视图: 谷歌学术搜索
k . h . Kwon c . c .爆炸m . Egnoto h . Raghav饶,“社交媒体传言简易舆论:语义网络分析twitter的话语在2013年朝鲜炫耀武力,”亚洲》杂志上的沟通,26卷,不。3、201 - 222年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
w·张,m . Wang和研究。朱:“政府信息发布重要调节contagion-evolution在突发公共事件的负面情绪?从认知的角度大数据分析”,国际信息管理杂志》上,50卷,第514 - 498页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
2021年“数字:4月全球statshot,”2021年,https://datareportal.com/reports/digital - 2021 - 4月全球statshot。
视图: 谷歌学术搜索
a . m . Aladwani”主持人、特征和影响twitter的使用:理论分析和实证说明,“国际信息管理杂志》上,35卷,不。1、15 - 25,2015页。
视图: 出版商的网站 | 谷歌学术搜索
a . Sarcevic l . Palen j .白k·德鲁·m·Bagdouri和k·安德森,“希望的灯塔”分散协调:从实地学习医学twitter在2010年海地地震,”ACM 2012会议的程序计算机支持的协同工作美国,西雅图,佤邦,2012年。
视图: 谷歌学术搜索
n y Kryvasheyeu, h . Chen Obradovich et al .,“快速评估灾难的损害使用社交媒体活动,“科学的进步,卷2,不。第三条ID e1500779, 2016。
视图: 出版商的网站 | 谷歌学术搜索
j . m . Li陈,陈t h .元,“概率灾害链在紧急情况下,”清华大学科学和技术杂志》上,50卷,不。8,1173 - 1177年,2010页。
视图: 谷歌学术搜索
A . Lu和l .钱”,探讨基于热点话题识别的次生衍生事件的紧急情况,”信息和文档服务第41卷。。6、26 - 35周不等,2020页。
视图: 谷歌学术搜索
r·斯利瓦斯塔瓦和m p s Bhatia实时未指明的twitter的主要sub-events检测数据流引起情绪的变化分数有针对性的活动,“国际期刊的信息技术和网络工程,12卷,不。4,21,2017页。
视图: 出版商的网站 | 谷歌学术搜索
d·波尔、a . Bouchachia和h . Hellwagner”自动sub-event检测在应急管理中使用社交媒体,”21国际会议的程序在万维网上2012年,里昂,法国。
视图: 出版商的网站 | 谷歌学术搜索
大肠张和t·李”,研究基于微博舆论事件的对策,“情报科学》12卷,第98 - 94页,2016年。
视图: 谷歌学术搜索
现金和o . g . Gordoni“意见表达通过用户评论新闻网站:通过“沉默螺旋”的角度分析,“信息,沟通与社会,21卷,不。3、388 - 403年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
w·刘,吴x, w·杨朱x,和美国中,“网络谣言传播在移动社交网络建模:舱的方法,”应用数学和计算卷,343年,第229 - 214页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
王朱和b . .“SAIR谣言传播模型的稳定性分析与控制策略在在线社交网络,”信息科学卷,526 - 2020页。
视图: 出版商的网站 | 谷歌学术搜索
p . k . Srijith m .海柏尔k . Bontcheva和d . Preotiuc-Pietro”子故事检测与分级狄利克雷twitter的过程。”信息处理与管理,53卷,不。4、989 - 1003年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
g . Bekoulis j . Deleu t Demeester, c . Develder”Sub-event检测从twitter流作为一个序列标签问题,“2019年,https://arxiv.org/abs/1903.05396。
视图: 谷歌学术搜索
刘y, y王。”的生成和演化“次要公众情绪”在公共危机:基于关注“8·12天津港爆炸”、“中国新闻与传播》杂志上9卷,第133 - 116页,2017年。
视图: 谷歌学术搜索
李,李和y, z . Liu“时间和空间演化的网上公众情绪在紧急情况下,“信息处理与管理卷,57号2、文章ID 102177, 2020。
视图: 出版商的网站 | 谷歌学术搜索
a . Jain j·达哈,诉Gupta,“谣言模型均匀社交网络将延迟专家干预和政府的行动,”非线性科学与数值模拟通信文章ID 105189卷,84年,2020年。
视图: 出版商的网站 | 谷歌学术搜索
l·杨,李z, a . Giua”遏制谣言传播的复杂的社会网络,”信息科学卷,506年,第130 - 113页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
x, j .郭y局域网,j .徐和x Cheng”丛发性话题在微博发现概率模型,”人工智能学报AAAI会议2015年,奥斯汀,TX,美国。
视图: 谷歌学术搜索
c, a .太阳,达塔,“从tweet Twevent:基于航段事件检测,”21 ACM国际会议的程序信息和知识管理,计算机协会毛伊岛,页155 - 164年,嗨,美国,2012年。
视图: 谷歌学术搜索
m . Mathioudakis和n . Koudas Twittermonitor:趋势检测在twitter流”学报2010年ACM SIGMOD国际会议管理的数据美国印第安纳波利斯,在2010年。
视图: 谷歌学术搜索
施蒂格利茨,m . Mirbabaie b·罗斯和c . Neuberger“社交媒体analytics-challenges话题发现、数据收集和数据准备,”国际信息管理杂志》上39卷,第168 - 156页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
林x l, c . Yu, t·杜l .周和g·李,“局部演化模式和时间趋势微博在突发公共卫生事件,“网络信息审查,42卷,不。6,821 - 846年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
M.-C。杨和H.-C。Rim,“确定有趣的推特内容使用局部分析,”专家系统与应用程序第41卷。。9日,第4336 - 4330页,2014年。
视图: 出版商的网站 | 谷歌学术搜索
y胡、l .白和w·张,“OLDA-based方法在线网络舆论话题演化分析,“国防科技大学学报,34卷,不。1,第154 - 150页,2012。
视图: 谷歌学术搜索
答:王和j·张,”主题探索基于主题模型结合层次聚类方法,”学报2020年IEEE 5日信息技术和机电一体化工程会议(ITOEC)中国,重庆,2020年。
视图: 出版商的网站 | 谷歌学术搜索
h . Wei-dong、w .钱和c·杰”跟踪基于突发公共事件的舆论传播和情感的进化在社交网络上,“国际期刊的计算机、通信和控制,13卷,不。1,第142 - 129页,2018。
视图: 出版商的网站 | 谷歌学术搜索
j . Yamin a . Lu和l .帮派”在网上城市突发事件的信息传播模式,”情报杂志,34卷,不。4、91 - 96年,2015页。
视图: 谷歌学术搜索
赵j . Zhang y, y, d . Wolfram和f·马”,公共卫生和社会媒体:Zika病毒相关的研究文章在雅虎回答:“信息科学与技术协会的杂志上,卷71,不。3、282 - 299年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
a . Yadav和d . k . Vishwakarma”情绪分析使用深度学习架构:复习一下,”人工智能审查,53卷,不。6,4335 - 4385年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
f . Hemmatian和m . k . Sohrabi”调查分类技术意见挖掘和情感分析,“人工智能审查,52卷,不。3、1495 - 1545年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
l·张,王,和b . Liu“深度学习情绪分析:一项调查,”威利跨学科评论:数据挖掘和知识发现,8卷,不。4篇文章ID e1253 2018。
视图: 出版商的网站 | 谷歌学术搜索
f . Scholer d·凯利,b . Carterette“信息检索评价使用测试集合,”信息检索期刊,19卷,不。3、225 - 229年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
a . Romascanu h . Ker r .员工et al .,“使用深度学习和社会网络分析理解和管理极端洪水,”突发事件和危机管理杂志》上,28卷,不。3、251 - 261年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
z Singla、美国Randhawa和s . Jain”统计和情绪分析消费者的产品评论,”学报》2017年第八届国际会议上计算、通信和网络技术(ICCCNT)IEEE,新德里,印度,2017。
视图: 出版商的网站 | 谷歌学术搜索
l .陈和f·王,”解释建议基于产品评论的功能情绪,”《22日国际会议上智能用户界面2017年,利马索尔,塞浦路斯,。
视图: 出版商的网站 | 谷歌学术搜索
w . Budiharto和m . Meiliana“预测和分析印尼总统选举从twitter使用情绪分析,“《大数据,5卷,不。1、1 - 10,2018页。
视图: 出版商的网站 | 谷歌学术搜索
d·h . Wang, A . Kazemzadeh f .酒吧,和美国时称,“一个系统实时twitter情绪分析周期,2012年美国总统选举”ACL学报》2012系统示威济州岛,韩国,2012年。
视图: 谷歌学术搜索
v . s . Pagolu k . n . Reddy g .熊猫和b . Majhi”情绪分析twitter的数据预测股票市场走势,”学报2016年国际会议上信号处理、通信、电力和嵌入式系统(范围)IEEE Paralakhemundi,印度,2016。
视图: 出版商的网站 | 谷歌学术搜索
a·米塔尔和a·高尔股票预测使用Twitter情绪分析美国CA,斯坦福大学,斯坦福大学,2012年,http://cs229.stanford.edu/proj2011/GoelMittal-StockMarketPredictionUsingTwitterSentimentAnalysis.pdf。
H.-C。宋子文,nba贾利勒,r·k·Ayyasamy和r·阿克巴”情绪的基本分析和观点挖掘社交媒体:最近的介绍和调查方法和技术,”学报2019年IEEE 9日研讨会上计算机应用与工业电子产品(ISCAIE)IEEE,哥打基纳巴卢山,马来西亚,2019年。
视图: 出版商的网站 | 谷歌学术搜索
f: t . m . Awan j·h·赛义德·a . Kashif和m . Parveen”情绪和情绪诱发冠状病毒病(COVID-19)爆发的新闻标题,“人文和社会科学通信,7卷,不。1、1 - 9,2020页。
视图: 出版商的网站 | 谷歌学术搜索
答:陆、w·林和c . Yu”局部和情感的综合分析微博在突发公共事件舆论,进化”图书馆和信息服务,60卷,第129 - 120页,2017年。
视图: 谷歌学术搜索
f .江Y.-Q。刘,H.-B。鸾et al .,“微博情感分析与表情符号空间模式”,计算机科学与技术杂志》上,30卷,不。5,1120 - 1129年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
a Pak p·帕劳贝克,“Twitter作为情绪的语料库分析和观点挖掘,”《2010年国际会议上语言资源和评估2010年,马耳他瓦莱塔。
视图: 谷歌学术搜索
云苓,a·侯赛因·h·Peng n .霍华德和e·威尔士”合奏的应用卷积神经网络和多个内核学习多通道情绪分析,“Neurocomputing卷,261年,第230 - 217页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
j .徐d·陈裘x, x黄”缓存长期短期记忆神经网络分类文档级别的情绪,“2016年,https://arxiv.org/abs/1610.04989。
视图: 谷歌学术搜索
l .一个w·周,m·欧·g·李,c . Yu和x王,“测量和分析公共事件利益相关者的局部影响和情绪蔓延,“国际信息管理杂志》上,卷。58岁的ID 102327条,2021年。
视图: 出版商的网站 | 谷歌学术搜索
x, j .郭、y局域网和x Cheng“biterm主题模型短的文本,”美国22日国际会议在万维网上里约热内卢,巴西,2013年。
视图: 出版商的网站 | 谷歌学术搜索
t . Mikolov W.-t。Yih g·茨威格,“语言规律在连续空间词表示,”学报2013年大会北美的计算语言学协会章:人类语言技术2013年,亚特兰大,乔治亚州,美国。
视图: 谷歌学术搜索
g . t . Mikolov Sutskever, k . Chen拉和j .院长”的分布式表示单词和短语及其组合,”2013年,https://arxiv.org/abs/1310.4546。
视图: 谷歌学术搜索
b .刘”,文本情感分析基于CBOW模型和深度学习在大数据环境下,“环境智能和人性化计算杂志》上,11卷,不。2、451 - 458年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
问:罗、w .徐和j .郭”研究CBOW模型过度拟合稳定,”《第五届国际研讨会主持检索知识表示和推理,上海,中国,2014。
视图: 出版商的网站 | 谷歌学术搜索
c·多斯桑托斯和m•加蒂,“深卷积神经网络短的文本的情感分析,”美国科尔2014年25日计算语言学国际会议:技术论文都柏林,爱尔兰,2014年。
视图: 谷歌学术搜索
m . Al-Smadi b . Talafha m . Al-Ayyoub y Jararweh,“使用长短期记忆深神经网络基于情感分析的阿拉伯语评论,”国际期刊的机器学习和控制论,10卷,不。8,2163 - 2175年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
g . e .盒子,g·m·詹金斯g . c . Reinsel通用Ljung,时间序列分析:预测与控制美国新泽西州霍博肯市威利,2015年。
r·k·辛格,m .王妃Bhagavathula et al .,“预测COVID-19流行的15大受影响国家:先进的自回归移动平均(ARIMA)模型集成,”JMIR公共卫生和监测》第六卷,没有。2篇文章ID e19115 2020。
视图: 出版商的网站 | 谷歌学术搜索
美国Siami-Namini: Tavakoli和A . s . Namin”比较预测时间序列ARIMA和LSTM的”学报2018年17 IEEE国际会议上机器学习和应用程序(ICMLA)美国奥兰多、IEEE 2018。
视图: 出版商的网站 | 谷歌学术搜索
d·波尔a Bouchachia h . Hellwagner,“社交媒体危机管理:聚类方法sub-event检测”多媒体工具和应用程序,卷74,不。11日,第3932 - 3901页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
a, d .渊源和z谊文,“舆论的形成和演化源于公共安全事件:基于主题和时间序列分析,“公共安全科学,3卷,不。12日,14-31,2020页。
视图: 谷歌学术搜索
l . y . Lai, d .汉周r, g . Wang,“中国微博基于细粒度的情感分类图卷积网络”万维网,23卷,不。5,2771 - 2787年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
y . k . Cheng曰,z的歌,“情绪分类基于词性和self-attention机制。”IEEE访问,8卷,第16396 - 16387页,2020年。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

850年

下载

924年

引用

复杂性

流行时间网络上的传播动力学

Topic-Sentiment演化和扩散的研究时间序列的舆论来自突发事件

文摘

1。介绍

2。相关的研究

2.1。研究公众意见来自突发事件

2.2。对网络舆论的研究话题

2.3。情绪研究网络舆论

3所示。提出的方法

3.1。建设主题识别模型

3.2。情感分类模型的建设

3.3。建设的时间序列模型

4所示。研究设计

4.1。数据收集和预处理

4.2。话题识别模型的设计

4.3。情感分类模型的设计

4.4。时间序列模型的设计

5。结果与讨论

5.1。描述性分析的数据

5.2。导舆论基于主题识别的数据集

5.3。主题的分析,推导出基于时间序列的舆论

5.4。情绪分析,推导出基于时间序列的舆论

5.5。在紧急情况下情感分配派生的公众舆论

6。结论

数据可用性

的利益冲突

确认

引用

版权