文摘
疾病的爆发后,恐慌经常在网上论坛传播,严重影响了正常的经济操作以及防疫程序。提前在线恐慌往往体现在现实世界中,导致严重社会回应公民。本文对超过80000评论进行情感分析COVID-19从中国互联网获取和识别模式。基于这种分析,我们提出了一个基于主体的模型,在这个模型包括两个部分修订西珥模型来模拟离线流行和无尺度网络来模拟网络社区。然后使用这个模型来分析社会距离的影响政策。假设这种政策的存在,网络恐慌模拟对应不同的信息化水平。结果表明,社会信息化水平的增加导致疾病暴发期间大量在线恐慌。减少流行对经济的影响,我们将讨论不同的策略发布疫情信息。我们的结论表明,宣布每日新病例的数量或无症状的人数峰值后感染症状可以帮助减少在线恐慌的强度和延迟的恐慌。反过来,这将使社会生产更有序,减少对经济社会反应的影响。
1。介绍
复杂性科学是非线性科学研究的领域,例如,混沌动力学理论,认为简单的行为在个人层面可能导致总不确定的复杂行为。计算能力的升级,随着时间的推移,细胞自动机已授权的功能,推动更广泛的研究领域。领域的管理和社会研究,谢林(1971)得出结论,简单的规则可以模拟复杂的变化,解释了种族隔离现象使用某些策略和移动两种类型的代理(1]。在这种模型中,细胞被认为是一个代理,完整的模型被称为基于个体模型(ABM)。反弹道导弹模型的可见性增强的标准化描述每个代理的实际行为之间的映射关系和抽象的数学规则(2]。近年来,大量的数据已经从非结构化的文本数据,生成的大量的信息价值。自然语言处理技术的快速发展和计算能力使我们从中获得有用的信息。Khatua、Khatua和威尔士(2019)使用PubMed pretraining模型中抽象和建造高质量的量词向量在特定领域,提高传染病监测的准确性基于社会媒体文本(3]。情绪分析,也称为意见挖掘,是另一个重要的自然语言处理技术。这是一个基于数据的方法用于分析情感倾向。例如,情感分析技术可用于分析恐怖袭击的影响人们的心理4];预测、监控和分析公众舆论在政治问题上由政府(5];并评估用户满意度与某些产品或服务的企业(6]。文本情感分析研究人员甚至是有益的,帮助更合理的设计模型和更现实的调查现象的复杂性。
当前研究的目的是调查在网上的传播模式恐慌和它的负面影响降到最低。恐慌是指一种特殊形式的集体行为,发生在一群主观地认为,资源稀缺,通常是伴随着适应不良的行为(7]。特别是,人们在流行病经历恐慌有可能非理性行为(8]。在学术界,这一现象被称为社会的反应。大量的流行病学研究进行了预测基于社交媒体数据(9)或社会流行病引起的响应(10]。社会应对疫情暴发范围从精神压力和经济衰退爆发从网站和不信任官方公告(11]。欺诈、盗窃、抢劫等破坏社会秩序,成为常见的和防疫订单往往忽略了(12,13]。在金融市场中,投资者情绪显著影响股票市场(14]。社会应对流行病影响股票市场,零售行业,个人收入,最终导致经济衰退。COVID-19爆发后,社会距离政策的实施和国际旅行限制严重影响全球经济活动(15]。国际货币基金组织(imf)估计,发达经济体的平均经济增长率2020年−4.9%是因为COVID-19的影响。疫情还影响到发展中国家。这些国家的平均增长率在2020年−2.4% (16]。
在线恐慌的特点是其快速传输和没有地域限制。这些升级的影响,造成严重的经济损失。2013年4月23日,假新闻报道声称,奥巴马在白宫双胞胎爆炸中受伤是在Twitter上传播,导致股市亏损1365亿美元(17]。在线恐慌也可以导致健康问题人们在伊朗被误导认为饮酒能预防和治疗新型冠状病毒,导致数百人死亡的几个省的伊朗(18]。Nicomedes和阿维拉发现焦虑对于健康是一致的位置无论个人或接触COVID-19患者(19]。谣言是一个重要的源和向量的在线恐慌,和一些研究人员试图解释其机制(20.,21]。COVID-19爆发后,信息之间的关系和网络恐慌,导致被称为一个“infodemic,”研究[22)——信息的流动会导致焦虑和谨慎,而misinfodemics造成恐慌,不信任,和混乱23]。艾哈迈德的Murad调查社交媒体之间的关系和恐慌的传播关于COVID-19问卷调查的基础上,确定假新闻关于COVID-19和传播感染的数量是两个主要贡献者(24]。抢购(PB)是网上搜索的另一个重要主题恐慌往往会导致冲动和强迫性购买,其消极方面都进行了广泛的描述在媒体上(25,26]。
现有研究表明,突然爆发的疾病往往会导致恐慌,导致严重后果。最近,网上恐慌后COVID-19疫情调查。网络有一个特殊的无标度网络的网络结构特征。这意味着恐慌的传播在互联网上是不同的,在真实的环境中。流行信息的传播中扮演着重要的角色在线panic-transparency这个话题是一把双刃剑。反过来,这会增加公众对政府的不信任。它还在互联网上引发了恐慌,影响社会的正常运转和经济。在这篇文章中,我们考虑的区别恐慌的传播在信息时代相比在早些时候,并探索合理的步骤的信息披露有效控制恐慌。现有的研究经验或modeling-based方法用于研究疾病的传播造成的损害。快等人基于个体模型用于分析社会反应的差异造成的几位流行27]。然而,他们的模型假设的关系网络的度分布均匀,没有考虑网络的作用。其他研究用问卷和回归方法分析原因或在线恐慌没有探索其机制的影响。在线恐慌的传播疾病,应该调查一体化的方式来指导信息发布策略。本文提出的模型是基于这一前景。
2。材料和方法
在这项研究中,双网络模型,占在线离线疾病传播和情感传播,提出了。应用该模型研究健康信息的公开披露之间的关系,大众媒体传播的信息,公众的疾病的风险。此外,变化的影响参数对在线测量恐慌的进化。
2.1。社会媒体情感分析
SnowNLP简体中文文本处理工具,可以用来分配情感强度分数,范围在0和1之间,中国文字。它使用分词和火车朴素贝叶斯模型进行情感分析新文本。
在(1)表示两个不同的类别 表示的特性。模型被训练使用训练数据集和局部COVID-19数据收集从博客和评论文章在微博上发表(一个中国的社交媒体平台,类似于Twitter)从1月20日,2020年和2020年4月1日。文本总额是80235年。灵感来自熊et al .(2020),负面评论被定义为一个情感得分低于0.1,而积极评价定义为那些情感得分高于0.9 (28]。
表1和2情感记录的平均分数和负面评论的比例。情感得分平均观察躺在0.368和0.684之间,和负面评论占最多评论总数的29.15%。报告确诊病例的数量增加,负面评论观察增加成比例,增加了1.97倍1月21日和2月4日之间。这表明增加每天的报告病例数变坏的心情在线讨论,同时减少日常报道病例数提高了在线讨论的气氛。前36个新病例3月31日《每日新报告的病例数小于10。突然那天报告病例的数量激增导致的比例迅速增加在互联网上的负面评论。
图1描述了情感话题的分布记录在表1和2。情感上的分布表现出双相分布的趋势,和中立的观点观察没有太大影响。这可以归因于年轻人口的微博用户和匿名用户享受的程度在平台上。此外,每当报告病例的数量高于前一天,积极评价的比例(情感得分> 0.9)是观察到显著减少,而负面评论(情感得分< 0.1)显著增加,即使没有显著差异新病例的数量在一段时期内,总病例数,无症状感染者的数量,和其他形式的报告。因此,很明显,网民主要集中在比较每天报告病例的数量和相应的前一天,但不考虑所使用的统计口径。这个分析帮助我们建立该模型的以下规则。
2.2。基于流行病动力学属性
几项研究已经进行流行病。Kermack McKendrick先生(1927)提出了模型,将中国人口分为三个categories-susceptible,病变,恢复29日]。先生需要注意的是,模型假设,一旦感染,病人因此不能感染,感染患者恢复或死于这种疾病。随后,安德森和可能(1992)提出了西珥模型基于SIR模型(30.]。在这个模型中,人们分为四个classes-susceptible暴露,感染和恢复。考虑场景的患者感染流行病不产生免疫恢复后导致了SIS模型的建议。进一步,疾病可能会出现快速突变,导致感染和恢复患者短期免疫,但是重新磁化率在时间条件。众位模型提出了这个场景。
COVID-19病人表现出弱在潜伏期传染能力(31日]。因此,基于西珥模型和现有的研究中,我们提出一个修改西珥模型使用以下参数:X我表示时间的健康状况t和X我(t){年代,E,我,R},年代,E,我,R表示类的敏感,暴露,感染,和恢复个人分别。随着时间的推移人们旅行之间的四个州。大多数流行病传播主要通过人们之间的密切联系。让我们假设每个人密切接触人们在每一个时间步。我们通过接触感染的概率一个接触的人,包括病人的潜伏期, ,感染的概率,让接触感染者 。进一步,让复苏的概率暴露或被感染的人 。要指出,这包括患者死于该病。恢复所有人不再被认为是感染。最后,让一个暴露的人的概率变得敏感 。占这样一个无症状的人变成一个明确患者的症状。考虑到这些参数,流行病动力学方程如下:敏感: 接触: 感染: 恢复:
健康状况之间的关系和网络社会关系在图中进行了描述2。
2.3。网民属性
网民被分配的健康属性,X我(t),在线恐慌属性,Y我(t)。Y我(t)是用来表示的强度在线代理时的恐慌t。Y我是一个连续变量,Y我 [0,1],0代表缺席的情况下所有的恐慌和1代表最严重级别的网络恐慌。Y我 在初始状态[0,0.1]。
首先,当公众在一个理性的心态,他们愿意倾听公众卫生部门的指导和信任正式发布信息。受欢迎的判断危险,恐惧,和适当的反应是在很大程度上决定了他们的信任在公共卫生部门。其次,在互联网上,恐慌不是地理位置约束及其社区容易跨区域传播。因此,以下三个规则采用适应传输而建模的规则在线恐慌:(1)当与邻居交流,个人更容易受到情绪的最可怕的邻居(2)每当媒体报道疾病相关信息,受欢迎的恐慌有一定概率的增加,增加的值Y我(3)当一个节点被感染,恐慌迅速增加,Y我=k。k是一个常数取决于疾病的严重程度,例如,从疾病和死亡的人数的存在疾病的后遗症
心理学研究已经建立了心理创伤以及信息焦虑随着时间的固定系数的降低α= 0.95。网络进化的每一轮结束时,每个人的恐慌是减,减少恐慌情绪是作为下一轮的初始值。下面的公式是用于此目的:
互联网用户倾向于相信由用户与激进的观点与强烈的情感和同情用户,证实了研究网络口碑的传播。Mudambi和Schuff(2010)发现,用户认为是极端的情感评论比更温和更有用的评论(32]。灵感来自DeGroot模型和认知心理学33,34),我们认为,个人偏见的方式会影响邻居恐慌。特别是,网络中每个节点的在线恐慌是一个加权平均,受周边节点的影响。代理表现出更高的恐慌被分配更高的权重,如下: 在哪里表示的重量的影响我th在所有邻近的代理节点时间t和表示强度的在线代理的恐慌我在时间t。
此外,我们定义以下规则影响的在线个人如下的恐慌表示节点之间的连接的存在与否我和节点j- - - - - -= 1意味着存在两个节点之间的连接:
2.4。网络属性
无标度网络是复杂网络的一种。这种网络利用两个假设的形成无尺度关系网增长假说和偏好连接假设。这意味着新节点不断出现在网络和新节点更倾向于连接与现有节点度较高。这样一个网络的度分布遵循配电, ,在哪里k介于2和3 (35]。李et al。(2015)确定了不变量特征的追随者的计算用户服从幂律分布的指数几乎等于1000万用户资料通过实证研究在中国最大的微博,新浪微博,在推特上有4170万个概要文件(36]。此外,在无标度网络谣言传播得更快,也称为BA网络,比在小世界网络37]。
在这项研究中,使用NetLogo软件构建模型并进行仿真。个人被代理人。代理之间的联系是由之间的网络连接两个相应的人,这是相互的,反映在网络作为一个无向的两个点之间的连接。如图3根据这些规则,构造一个无标度网络包含30000个节点在这项研究中,遵循及其程度分布是2的幂律分布的指数。
2.5。属性相关的公共卫生信息和媒体的披露
向公众传达的信息媒体对公众情绪有重要影响。例如,公众恐惧的飞机失事的概率远高于患心脏病,即便如此,在现实中,飞行安全远高于免于心脏病。年轻的et al。(2013)认为,疾病的报道更频繁地在媒体上吸引更多公众的注意力不管他们的严重性38]。政府信息披露也会影响媒体的判断。政府可以选择发布新病例的数量记录在前一天和总病例数在前一天或不宣布无症状感染者的数量。发布数据时超过历史高点的一半数量的感染、疾病相关的新闻经常出现在社交媒体(8]。在我们的模型中,我们设置初始强度的社交媒体(米)为0和更新它按照下列规则: 在哪里k代表一个常数取决于疾病的严重程度,N(t)表示的情况下由政府宣布的时间t,t_0表示一个即时的时间t,米(t)表示的强度米在时间t。
在线个人,我认为艾滋病的严重性报道,通过社交媒体与概率,π,这是由公共媒体的渗透率:
3所示。结果与讨论
在这项研究中,他(2018)方法总结agent-related变量在模型中使用,作为记录在表中3(39]。某些变量的配置是基于快速et al。(2015) (8]。在COVID-19疫情的爆发,许多国家和地区采用了社会距离政策,包括全职订单和关闭餐馆。我们首先检查社会距离的使用政策和评估模型和现实之间的协议。图4描述了个人的健康状况的变化在该疾病的传播,没有任何社会距离政策的实现。最初,暴露个人的数量增加迅速感染感染的敏感部分人口和达到一个峰值在28天的潜伏期。随着暴露的个体数量的增加,也受感染人群的数量,与峰值在35天。峰值后,显示的数据,暴露和感染者的数量减少慢慢地随着时间的推移,呈现平滑曲线。整个时期的传播,感染的人数增加,最终感染几乎每一个人。在第二模拟,我们添加了一个政策,社会距离22天,当确诊病例的数量迅速增加,减少个体之间的联系。观察社会距离的实现政策来降低病人的总数和保护公众健康。
(一)
(b)
在这一点上,政府的社会距离政策施加影响控制疫情,包括减缓疾病的传播,减少病例数峰,和预防医学的发生。图2描述后,总病例数明显减少社会距离的实现由政府政策。
然后,我们获得的平均搜索量口罩、医用酒精,和N95口罩在1月20日之间,2020年3月10日,2020年,根据百度指数(百度在中国是一种广泛使用的搜索引擎,百度指数是类似于谷歌趋势),和拟合值和平均在线恐慌的程度后社会距离的实现策略。 获得,建议一个合适的配件。这表明,模拟方法具有实际意义,可以作为一个有效的指导政府信息披露政策。鉴于社会距离的成功政策,广泛应用在现实中,在随后的模拟,我们不同的信息披露政策的影响进行了探讨基于社会距离政策已经采用。
3.1。社会信息化的影响
基于社会距离政策在疾病的爆发,我们现在尝试检查的影响社会信息化的程度在线恐慌。两个层次的社会信息化被用于比较分析。
在线恐慌在两个社区的演变具有类似结构经历相同的流行与不同的公共媒体的覆盖率是描绘在图5。社区覆盖率较低表现出较低程度的网络恐慌,和相应的生长速度和峰值在线恐慌的是较低的。然而,快速et al。(2018)发现了一个强度之间存在显著的正相关媒体报道和epidemics-when媒体报道的减少增加了十倍,流行趋势下降了33.5%,和社区的录取率高的公共媒体报道有利于防止流行病的传播(27]。目前,社会信息化水平相对较高。这可以解释所造成的心理伤害越高流行病在现代比过去。例如,COVID-19诱导在线比非典恐慌到一个更高的学位。
(一)
(b)
透明度和信息的充分披露是必要的应对流行病。然而,图5显示在线恐慌很高对应于高水平的社会信息化。因此,信息披露方式的影响在线恐慌应该调查确定最有利的信息披露方式。
3.2。数据信息披露模式的影响
在本节中,我们研究两种截然不同的影响政府对疫情信息的信息披露政策网络恐慌。数据5和6描述恐慌的整体平均水平的变化随着时间的推移,在每个场景中超过50重复模型的运行。两个数据可以用来披露信息epidemic-the现有病例总数和每日新病例的数量。从图可以看出6,采用后者统计有效减少在线恐慌和延迟它的峰值相比,其他情况下,给政策制定者们更多的时间来应对这种疾病。因此,报告每日新病例的数量是一个更有效的政策。
无症状感染人数的披露是另一个决定是由政策制定者。无症状感染者感染并不会出现任何症状,但可以被测试和检测率增加。无症状感染病例的数量通常在总体披露。很难估计,这个数字在暴发的早期阶段,因为一个高速率的测试是必需的,这通常是实现。无症状感染者不需要专业的医疗,和他们中的大多数自己愈合。因此,在我们的模拟,我们选择了四个要点——第一天,15天,30天,和45程对应一开始,通货膨胀,峰,分别和衰退阶段的流行。
提供的数据显示在图7收益率,披露无症状感染患者更好的公共资讯计量学一旦每天新感染的人数显著降低在经济衰退阶段,表现出最低的峰值在线恐慌。一般来说,公共卫生部门发布信息越快,它的透明度和可信度就越高。这也使得它更容易平静谣言和促进公众舆论的稳定演化。然而,无症状感染的患者数量的增加不能仅仅归因于升级的流行病。也显著影响检出率的增加,这反过来,随时间增加。因此,通过披露的数量无症状感染者在衰退阶段的流行,政策制定者可以积极地影响公众舆论,从而减少峰值在线恐慌。
4所示。结论
在这项研究中,一个以代理人为基础的模拟使用考虑在线和离线的影响因素对在线恐慌。在离线分析、改进的传染病动力学模型的基础上,提出了西珥传染病动力学模型来模拟离线流行病传播。在网络组件,在线社会网络分析提出一个无标度网络社区的关系网络,用于模拟网络的传播恐慌。COVID-19被选为一个案例研究来模拟网络的传播恐慌和百度搜索指数被用来适应数据在线恐慌的程度来验证模型。不同的信息披露策略的有效性(如类型的情况下披露,披露无症状感染者)在疾病暴发应对网络恐慌也被评估。通过收集中国社交媒体的短文情绪分析,研究疾病的传播分为增加和下降阶段的时间和它的发展阶段。我们分析了网民的情绪变化对发布的流行数据在两个时期。然后,我们媒体渗透在社会恐慌的影响进行了探讨。研究发现,高媒体渗透率导致社会恐慌反应。在过去,当媒体普及率很低,pandemic-induced在线恐慌慢慢上升,很快就开始减弱。 This research is expected to help mitigate the economic impact of epidemics by optimizing information dissemination policies, increasing public trust, and reducing panic.
本研究的结论是,社会距离的政策是有效的这种政策的存在,仿真结果表明,增加社会信息化水平诱导更多的实质性的在线恐慌爆发期间。减少流行对经济的影响,我们建议政府应该披露的数量每天新发感染而非感染病例的总数和保留宣布无症状感染的数量直到症状感染的高峰期。根据我们的模拟,这应该减少在线恐慌的强度和延迟的峰值,这也会减少对经济社会反应的负面影响。
最后,本研究还有助于经济发展。2020年,一些国家采取刺激政策,如积极的财政和宽松的货币政策,帮助企业渡过难关,刺激消费者支出。研究结论证明清晰的方法来控制和减少网络恐慌,这反过来将有助于提高公众信心和刺激消费者支出。这将赋予政府的刺激政策。此外,这个模型可以扩展业务领域,以帮助企业和商业组织做出更好的决策。例如,该模型适用于预测想参加的人的比例在流行病的销售促销活动,可以通知决定举办这样一个活动。
本研究患有某些缺点。只使用两类基于NLP情绪分析,从而支持基于代理模型的假设。然而,在现实世界中,情绪可能属于多个类别。因此,我们打算在未来pretrain模型采用基于深度学习完整的模型训练和情感分析的方法,例如,这个词嵌入模型,进一步完善模型。
数据可用性
可以从文本数据和程序代码https://github.com/downw/SocialMediaText。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究得到了国家自然科学基金批准号下的中国71904106,教育部人文社会科学项目批准号下的中国19 yjc870019,中国博士后科学基金会资助下不。2018 m632688,山东省博士后科学基金批准号下201903009。