文摘

全球大流行,COVID-19,是一个2019年的小说《冠状病毒引起的急性呼吸道传染病。构建网上流行监督系统提供COVID-19动态预测和分析社区引起了业界的关注和应用。在先前的研究中,分为若干部分的模型和深层神经网络(款)扮演了重要的角色在预测和分析流行的动态。然而,区划的模型符合历史数据的能力有限,从而导致不满意的预测精度参数估计的困难。款,缺乏可解释性很难解释预测结果;因此,它不能提供深入了解的大流行的传导机制。我们提出一种融合模型利用这两种模型的优点和解决他们的缺点。从先进的融合模型提取epidemic-related知识SEIDR区划的模型指导格勒乌的训练模型,可保存的可解释性和实现良好的性能预测流行病动力学。这个模型可以帮助提高在线疫情监督系统通过提供更准确的预测结果和深入的分析。跨多个流行广泛的实验数据集从六个欧洲国家表明,我们的模型优于现有最先进的基线预测活动的确诊病例。 More importantly, by analyzing the effective reproductive number, our method can reveal the risk of the second wave of the epidemic in Europe and justify the importance of social distancing to control the outbreak of the epidemic.

1。介绍

COVID-19是呼吸道传染病引起的严重急性呼吸系统综合症冠状病毒2 (SARS-CoV-2)。截至2021年10月,全球已报告2.41亿多例,导致超过490万人死亡。欧洲是受灾最严重的地区之一的大流行。截至2021年10月,在已报告7100万例,与超过130万人死亡(1]。所有的欧洲国家都面临着前所未有的卫生挑战,因为这严重的流感大流行。

此时,越来越大量epidemic-related数据发布在网络上,这很有可能使更好的流行动态预测和分析(2]。这些数据开放计划支持工业和应用程序社区人员共同构建全球疫情监督系统,开展COVID-related数据分析或动态预测抗击致命病毒(3- - - - - -6]。例如,系统调用COVID19-Projections使用一个基于ai模型使COVID-19动态预测和已经被疾病控制和预防中心(CDC)作为一个工具来帮助公共卫生决策(6]。一般来说,这样的监督系统的主要任务是使准确COVID-19预测,为制定防疫政策提供分析。

先前的研究已经显示预测的意义和重要性,了解未来动态的流行病传播模式7- - - - - -10]。首先,大流行动态的预测可能揭示了重要的时间点提前,从而提供充分的准备和响应时间处理棘手的挑战带来的传染病。其次,分析传播模式,如有效的生殖(R)数量、死亡率和回收率,为未来防疫可以提供宝贵的见解。最后,了解流行的动态可以协助评估现有的防疫措施的有效性。例如,高死亡率可能提高医疗资源短缺的风险,政府可能需要投入更多相关资源来控制疫情的爆发。

最近的研究工作对COVID-19流行病分析或建模可以分为两种类型:分为若干部分的模型和款模型。区划的模型,包括SI,先生,西珥和SIS模型(9- - - - - -11),是一种数学模型,模拟不同populational中的个体隔间交互。最早的区划的模型是模型介绍了爵士于1927年(11,12]。爵士模型首先分配人口隔间与不同的标签(例如,易感,感染,或恢复),然后构造过渡方程模型不同的隔间之间流动。通过估计过渡方程中的参数(例如,死亡率、回收率和感染率),分为若干部分的模型能够预测一些至关重要的流行因素,如疾病如何传播或感染总数。至于DNNs-based模型,最近的研究集中在预测未来的动态拟合历史疫情大流行的数据(例如,确诊病例和恢复情况下),目的是更快的收敛和减少偏差。大多数的解决方案是基于Bi-LSTM等各种类型的复发性神经网络,LSTM,格勒乌13- - - - - -16]。

尽管他们取得了一些进展,上面的方法仍然是远离令人满意的性能方面的COVID-19的分析任务可解释性预测精度

例如,最近的解决方案基于区划的模型试图增加模型的复杂性,这样他们可以更精确地模型传输模式通过考虑的因素如病毒测试能力有限和隔离人口(17,18]。然而,由于增加,复杂的模型结构,这些解决方案需要大量的参数估计,这通常是非常困难的在实践中,从而导致不满意的预测结果的准确性(19]。另一方面,尽管DNNs-based解决方案可以预测的动态精度高的大流行,他们无法提供可解释性预测结果和传导机制(20.]。因此,一些传播模式,比如过渡率,不能推断,这阻碍了一个深入的理解COVID-19大流行。例如,现有DNNs-based无法预测的有效的解决方案RCOVID-19的可信度和可解释性20.,21]。此外,最近的研究也表明,神经网络模型遭受过度拟合问题的历史流行数据通常不足(19]。

尽管两种解决方案的缺点,他们的技术优势是互补的。区划的模型已经有更多的优点比神经网络模型的可解释性,提供可辩解的和值得信赖的分析结果COVID-19流行病。神经网络模型的进步在于他们representation-learning能力强的历史数据,可以更准确地预测COVID-19未来的动力。因此,本文的新颖之处在于,它的关键利用互补性的区划的模型和神经网络模型设计一个高度精确和可翻译的融合模型COVID-19预测和分析。

具体地说,我们首先引入了先进的区划的模型称为SEIDR模型,这可以更好的模型COVID-19流行通过考虑部分报道COVID-19感染和隔离状态的人口(22,23]。基于SEIDR模型,我们提出了一个SEIDR-guided格勒乌模型。这种融合模型可以提取从区划的流行知识模型指导格勒乌的训练模型,可维护可解释性和减少过度拟合问题。之后,我们从六个欧洲国家收集流行历史数据在不同的地区,包括日常确诊病例,恢复的情况下,和死亡之日起第一例在每个国家9月30日,2020年。我们建议的融合模型运用到这些现实世界的流行的数据集,我们表明,我们建议的模型明显优于西珥模型等先进的基线。我们还证明,活跃的确诊病例的预测和分析有效的生育数量的六个国家,我们的方法可以揭示COVID-19的第二波疫情的风险在欧洲在它发生之前和证明社会距离的重要性来控制疫情的爆发。

本文的贡献总结如下:(我)我们提出了一个SEIDR-guided格勒乌融合模型,它可以提取从SEIDR流行知识模型指导格勒乌的训练模型。这种融合模型利用SEIDR模型的优点和格勒乌模型,可以保持可解释性,克服过度拟合,获得最先进的性能而言,预测未来COVID-19动力学。(2)我们集中评估我们的融合模型在现实世界流行来自六个欧洲国家的数据。我们的实验表明,我们的模型明显优于现有的基线如西珥模型的预测的活跃的确诊病例的评估R数字(生殖)在六个国家。(3)我们也成功地揭示了风险分析的第二波疫情在欧洲在它发生之前和证明的重要性,社会距离来控制疫情的爆发的流行病建模。

2.1。区划的基于模型的方法

区划的模型是应用最广泛的方法来分析和预测传染病动力学,也包括这个COVID-19流行病[8- - - - - -10,24- - - - - -26]。使用的典型管道分为若干部分的模型是设计分为若干部分的模型代表的传播流行(例如,西珥模型),推断模型的参数(例如,回收率),然后基于推断预测和分析动力学参数。例如,Pandey等人部署西印度COVID-19流行的数据模型,然后预测COVID-19传播的动力学在印度(9]。侯等人修改原西珥模型通过引入人与人之间相互作用的影响。他们收集了在中国流行来自不同省市的数据并进行了分析调查社会距离如何影响COVID-19流行的动态(10]。彭等人也洛佩兹和Rodo调查不同antiepidemic措施如何影响西珥COVID-19流行通过扩展的动态模型,考虑更多的因素(24,25]。此外,先生等人利用一个模型来比较这个传输模式(即。,室al model parameters) between Italy and Hunan province, which has a similar population [8]。

总之,现有用地区划的模型来预测和分析COVID-19动力学主要是基于西珥和模型和爵士试图延长COVID-19区划的模型更好地描述模式的大流行。考虑更多的情况下使得区划的模型的结构更加复杂和难以解决他们的参数,这也导致了低精度的流行动态预测19]。

2.2。深层神经网络方法。

相关的研究倾向于预测未来动态拟合历史疫情大流行的数据(例如,确诊病例和恢复情况下),目的是更快的收敛和减少偏差。大多数的这些方法都是基于模型如Bi-LSTM LSTM,格勒乌13- - - - - -16,27- - - - - -29日]。例如,印度Arora等人收集疫情数据从3月14日,2020年5月14日,2020,然后利用修改LSTM模型以适应和预测流行动态。他们的结果表明,模型能够很好地预测未来时短时间内(1 - 3天左右)14]。梅林等人提出了一种模糊响应聚合方法,它可以合奏COVID-19防疫不同的简单的神经网络预测。他们训练模型在墨西哥的疫情数据,证明了整体模型优于单一模型(28]。此外,Zeroua等人训练有素的多个深度学习模型,包括简单RNN LSTM,双向LSTM,格勒乌和VAE,历史上流行数据。他们进一步比较了不同模型之间的性能预测流行病动力学(15]。

一句话,以前作品使用深层神经网络方法预测COVID-19流行病动力学主要集中在拟合历史数据与更快的收敛和减少偏差。模型的可解释性COVID-19传播模式的不足,如恢复率和死亡率,无法推断。缺乏可解释性限制流行病的进一步理解。例如,COVID-19动力学的有效的繁殖数量很难分析现有的神经网络模型。

3所示。融合模型框架

在本节中,我们首先介绍我们的概述提出区划的COVID-19防疫和格勒乌融合模型分析和预测。然后,我们提出两个组件的细节的融合模型,分别包括SEIDR区划的模型和SEIDR-guided格勒乌融合模型。最后,我们介绍融合的损失函数模型。

3.1。框架概述

我们提出了一种融合模型框架,如图1,由以下组件组成。SEIDR区划的模型。我们引进了先进的区划的模型来满足这个COVID-19流行病的传播模式,称为SEIDR模型(24,25]。特别是SEIDR模型分离人证实了测试和严格隔离(即。,证实了活跃的情况下,调用D室)从所有受感染的人群。然后D舱可以进一步代表日报报道感染。更详细的提出了SEIDR模型,如参数和微分方程,将在下一节中介绍。SEIDR-Guided格勒乌融合模型。我们提出了SEIDR-guided格勒乌融合模型的可解释性预测和减少过度拟合利用epidemic-related从SEIDR模型中提取知识。具体地说,我们首先利用格勒乌模型以适应历史疫情数据。格勒乌模型优化的参数通过最小化之间的错误输入疫情数据和格勒乌的输出(即模型。,预测),类似于以前COVID-19预测工作。然后,我们从SEIDR提取epidemic-related知识模型,其中包括参数和预测结果之间的约束(例如,确诊病例和死亡的预测应该满足尽可能多的死亡率)。这些约束最终应用于培训格勒乌模型的目标函数。更详细的SEIDR-guided格勒乌融合模型将介绍如下。

3.2。SEIDR区划的模型

在这项工作中,我们引入一个SEIDR区划的模型,满足现有COVID-19流行的两种情况(24,25]。

首先,解决日报报道感染的情况,不能代表真正的感染人数在整个人口,SEIDR模型分离出人已通过测试和严格隔离受感染的人群。这些证实了活跃的情况下可以代表日报报道感染和可以被视为一个新的隔间 的模型。第二,应对挑战,许多感染(即。,confirmed active cases) are quarantined and cannot spread the virus, the SEIDR model divides all compartments into two parts: the quarantine part and the free part. People who are in the free part can infect susceptible individuals, whereas people who are in the quarantine part cannot. According to the antiepidemic measures in most countries, confirmed active cases are treated in hospitals or under strict home quarantine so that they can hardly contact other people. Thus, the model puts the compartment 进入检疫和其他部分隔间进入自由。死亡报告室 和报道复苏室 不包括在上面的两个部分,因为他们不愿与人交流。

1(b)礼物SEIDR的结构模型。在这个图中,每个矩形代表一个隔间,矩形之间的箭头表示不同隔间之间的转移。有六个车厢SEIDR模型。的年代一个是那些能合同。的E一个是那些已经感染了但还没有传染性。的一个是那些感染但不确认测试。的D后一个是那些已确认和报告测试。R一个分别报道复苏和死亡报告。之间的转移概率参数对箭头代表不同的隔间单位时间,相当于一天在这工作。更详细的参数如表所示1

值得一提的是,敏感案件的数量通常是大,所以暴露易感个体和人之间的转移概率是接近于零。这种现象导致难以估计转移概率和影响其他模型中参数的估计。因此,我们引入了参数 以前的作品一样的感染者每天可以感染病例数(30.]。 可以计算如下: 在哪里 是指持续时间从发病到诊断。我们设置 根据前面的调查(30.]。考虑到人在暴露的隔间和那些感染感染易感个体间有不同的能力(31日),我们进一步引入参数 代表的比例之间的感染能力暴露人口和人口感染。因此,人口从 可以表示成

基于不同的隔间之间的结构和流动SEIDR模型,我们有以下微分方程包含人口之间的约束不同的隔间:

3.3。SEIDR-Guided格勒乌融合模型

为了保持预测的神经网络模型的可解释性COVID-19流行病动力学,减少过度拟合的问题,我们提出一个SEIDR-guided格勒乌融合模型,该模型可以利用epidemic-related从SEIDR模型中提取知识。这种融合模型的培训可以进一步分为两个阶段。

第一阶段是符合历史流行疫情数据通过最小化之间的错误输入数据和模型的输出。具体来说,我们设计一个格勒乌模型如图1(a),当疫情数据 和前一天的隐藏状态 输入到格勒乌模型,格勒乌细胞将输出隐藏状态 的这一天。然后 可以用来预测疫情国家吗 天也被输入到下一个格勒乌细胞预测的流行状态 的一天。输入疫情数据 和相应的预测 可以表示如下: 在哪里 意味着增加活跃的情况下与确认 一天; 意味着复苏情况下而增加 一天; 意味着同比增长证实死亡 的一天。

第二阶段的培训这种融合模型提取从SEIDR pandemic-related知识模型和使用这些知识来指导训练格勒乌模型图1(a)。SEIDR模型的微分方程表示的参数之间的一些约束SEIDR模型和人口不同的隔间。例如,方程(5)表明,积极的确诊病例和死亡的人数应该满足的死亡率 尽可能多的。这些约束可以被视为epidemic-related知识限制格勒乌之间的关系模型的输出(例如,限制的预测价值一个D符合方程(5))。

根据SEIDR的微分方程模型,我们可以获得约束关系如下:

利用这些约束关系知识的可解释性预测和减少过度拟合问题,我们首先将SEIDR模型的参数添加到融合模型和这些参数和格勒乌参数一起训练。然后,我们添加约束为代表 的损失函数,目的是让他们尽可能接近于零。

3.4。的损失函数

我们提出的损失函数SEIDR-guided格勒乌融合模型包含两个部分:拟合损失 和约束损失

使用拟合损失最小化之间的错误输入疫情数据和预测数据(即。,increase in the number of confirmed active cases, recoveries cases, and deaths) for better fitting the historical data. It can be represented as follows: 在哪里 是历史的天数COVID-19流行病数据用于训练模型。

至于约束损失,这个损失函数是用来限制融合模型的参数之间的关系及其输出通过利用从西珥模型中提取知识。它可以表示如下: 在哪里 是历史的天数COVID-19流行病数据用于训练模型和 意味着约束关系

只使用拟合损失经常遭受过度拟合问题的历史流行数据通常不足,这可能会限制性能的预测。与此同时,约束损失可以从区划的模型中提取知识进一步减少模型参数的搜索空间和抑制过度拟合的问题。我们终于使拟合损失的综合利用和限制损失。

由拟合损失 和约束损失 ,COVID-19流行预测的系统优化的一个端到端的方式。我们减少损失函数如下:

4所示。实验和结果

在本节中,我们进行实验来评估我们的提议COVID-19融合模型预测和分析六个欧洲国家的传播模式的基础上推断,我们的模型的参数。我们的目标是回答以下研究问题:(我)RQ1:可以SEIDR-guided格勒乌融合模型比现有的方法如西珥和格勒乌?(答案是分段4.3。)(2)RQ2:多少天的数据融合方法需要训练模型具有良好的性能吗?可以融合模型实现良好的性能在不同阶段的流行病?(答案是分段4.4。)(3)RQ3:如果融合模型达到更好的性能,我们可以进行更深入的分析COVID-19流行基于这个模型?(答案是分段4.5。)(iv)RQ4:我们能获得有意义的结果的基础上,分析不同的国家?(答案是分段4.6。)

4.1。数据收集

我们使用JHU CSSE COVID-19数据集作为源数据(3]。这个数据集包含确诊病例的时间序列数据,恢复的情况下,和死亡。数据每天更新,报道的动态COVID-19流行全世界。我们研究欧洲国家因为以下几点:(1)欧洲发达的医疗系统和相对可靠的数据;(2)欧洲有更多的国家与不同的数据。因为它是“硬”的结果,每个国家由于空间限制,选择六个典型国家根据地理位置和疫情,包括意大利在南欧,西欧的德国,瑞士和奥地利在欧洲中部,丹麦在北欧,东欧和俄罗斯。至于时间,我们选择在第二波疫情的数据作为训练集(例如,第一个病例在每个国家的日子2020.8.31)预测积极确诊病例在第二波的第一个月(如。,2020.9.1 2020.9.30)。因此,我们可以分析第二波疫情的风险,吸引了太多的关注在COVID-19预测工作(32,33]。

4.2。实验设置

我们SEIDR-guided格勒乌融合模型中实现PyTorch (https://pytorch.org/)。我们用亚当优化器(34)最初的学习速率为0.0005,因为它可以自动调整学习速率在训练阶段。我们将隐藏状态的大小设置为256。此外,符合先前的作品(31日),参数 与历史数据训练阶段计算使用方程(1),而这个参数用于预测阶段的平均价值的最后10天的培训数据。

4.3。预测活动的确诊病例

接RQ1,我们比较我们的模型对现有方法,包括西珥模型、SEIDR模型和格勒乌模型,探讨我们是否SEIDR-guided格勒乌融合模型优于现有方法。我们部署四个模型在六个国家流行的历史数据,分别。对于每个国家,数据跨天的第一个确诊病例8月31日报道,2020年,用于训练模型,当观测数据跨度从9月1日,2020年9月30日,2020年,是用来比较不同方法之间的性能。

2展示了确诊病例(即动态活跃。,室D在每个国家不同的模型预测的)。符合之前的作品(13),我们进一步计算出平均绝对误差(MAE)、根均方误差(RMSE)和R2_score评估不同模型的性能预测COVID-19流行动态。表2提出了不同的误差测量不同的模型,我们可以两个观察。首先,在不同模型预测疫情动态,我们提议SEIDR-guided格勒乌融合模型获得最佳的性能在所有六个国家。第二,在六个不同的国家中,俄罗斯的动态的预测是最坏的一个,而意大利则得到最好的性能。

基于流行病动力学预测的SEIDR-guided融合模型(如图2和六个国家的参数推断的融合模型(见表3),我们可以让几个观察每个国家。(我)在意大利,每日死亡率约0.67%,回收率约为2.7%。大约36%的感染者每天可以证实。预测的情况下,9月30日51000年,而地面真理是51263。(2)在德国,每日死亡率约为0.32%,回收率在6.1%左右。我们预计9月30日的活跃的确诊病例是25800年,而地面真值是26557。(3)在俄罗斯,每日死亡率约0.07%,每日回收率约为3.2%。我们预计9月30日的活跃的确诊病例是195400年,而地面真值是195381。(iv)在瑞士,我们预计9月30日的活跃的确诊病例是8300年,而地面真值是8508。此外,每日在瑞士死亡率约为0.38%,而《每日回收率约为5.6%。(v)在丹麦,每日死亡率约0.35%,每日回收率约为6.6%。据预测,活跃的确诊病例在丹麦将迅速增加,绕过6450例9月30日,这个数字比以前更高的峰值4月10日,2020年。(vi)至于奥地利,每日死亡率约0.24%,每日回收率约为5.2%。我们的模型预测,奥地利的活跃的确诊病例可以得到大约9700 9月30日,而地面真值是8370。

我们还可以观察到一些不同国家的不同的参数表3。例如,俄罗斯的 是5x与其他地方相比,小的原因可以总结为指的新闻在网络上:(1)俄罗斯人倾向于将他们的医生症状出现后不久(https://edition.cnn.com/2020/05/13/opinions/russia-low-covid-19-mortality-rate-sepkowitz/index.html);(2)俄罗斯的老年人要少得多,他们尤其容易受病毒(https://health.economictimes.indiatimes.com/news/industry/why-is-russias-coronavirus-death-rate-so-low/75748618);(3)俄罗斯有一个保守的计算方法;他们将死亡的冠状病毒只有死亡可以直接联系(https://www.scmp.com/news/world/russia-central-asia/article/3084458/why-russias-coronavirus-death-rate-so-low)。

4.4。随着时间的推移COVID-19预测的性能

为了回答RQ2,我们进行两个实验探讨时间因素如何影响我们的融合方法的预测性能。首先,我们进行实验来测试多少天的数据我们的方法需要火车模型具有良好的性能。具体来说,我们选择数据30、45、60、90和180天前第二波疫情作为训练集(例如,30、45、60、90和180年前几天2020.9.1)预测积极确诊病例在第二波的第一个月(例如,2020.9.1 2020.9.30)。图3介绍了活跃的确诊病例曲线模型预测不同的训练集。结果表明,我们的融合方法可以获得令人满意的性能,当训练数据超过60天,这是与最先进的COVID-19预测方法(9,10,14,15]。

第二,我们进行实验来测试我们的融合模型是否能获得令人满意的性能在大流行的不同阶段(例如,在一开始,巅峰,和减少大流行时期)。具体来说,我们选择4个时间点代表大流行(2020.7.15)前的阶段,开始时(2020.9.1),(2020.9.15)峰值,减少时期大流行(2020.6.1)。鉴于我们的数据不包括第二波疫情的减少阶段,我们使用减少时期以前的流行而不是)。对于每一个时间点,这次我们选择之前的数据作为训练集和预测活性在30天内确诊病例。图4介绍了活跃的确诊病例曲线模型预测不同的预测点。结果表明,我们的融合方法可以获得令人满意的性能的不同阶段COVID-19大流行。这意味着我们的融合模型可以准确预测的动态COVID-19流行。

4.5。有效的繁殖数量分析

要回答RQ3,我们进一步分析了COVID-19有效繁殖数量的六个选定的欧洲国家。有效的繁殖数量(被称为 )代表新COVID-19的平均数量由传染病引起的感染。有效的繁殖数量常被用来分析传播流感大流行的严重程度在一个区域(35]。一般来说, 意味着疫情蔓延,而 意味着流行将来总有一天会消失。在这项工作中,我们计算的曲线有效的繁殖数量随着时间的推移,这些国家基于推断的参数SEIDR-guided格勒乌融合模型。有效的繁殖数量可以按照下列方程计算(35):

5显示了曲线的有效繁殖数量加班6选择国家,和一些观察从这些曲线可以发现:(我) 意大利开始的峰值1.46,跌破1在3月12日。然而,这往往会增加在最近几天,在位置附近波动 ,这表明疫情可能复发。(2) 德国达到了最高点2.35 2月28日,跌破1在3月24日。然而, 德国6月后开始增加,现在它往往在位置附近波动 这一结果表明,流感大流行在德国第二波的风险很高。(3) 俄罗斯于2月28日达到峰值9.97,跌破1在5月8日。现在倾向于保持稳定的位置附近 这个结果显示了第二波的高风险的俄罗斯COVID-19大流行。(iv) 瑞士的开始在2月25日的高点2.19,跌破1 3月6日。在那之后, 瑞士的再次增加,超过了1 6月中旬。现在倾向于波动的位置 这一结果表明,流感大流行在瑞士可能复发。(v) 丹麦在3月4日达到峰值6.37,跌破1 3月26日。在那之后, 不断波动的位置 往往会增加,这意味着丹麦的大流行可能复发。(vi) 奥地利开始在2月25日的高点2.19,跌破1在3月23日。现在它显示了很大的波动 ,往往会增加。这一结果表明,流感大流行在奥地利第二波的风险很高。

4.6。结果和影响

为了回答RQ4,我们从上面的预测和分析,提取两个发现积极的确诊病例和有效的繁殖数量,可以总结如下:

4.6.1。暴露的风险的第二波疫情在欧洲

我们建议SEIDR-guided格勒乌融合模型揭示了第二波疫情在欧洲的风险通过预测这些活跃的确诊病例,分析有效的生育数量的六个欧洲国家。一方面,我们的融合模型预测,活跃的六个国家确诊病例在未来都将增加。例如,我们预测,活跃的确诊病例在瑞士将迅速增加,超过6个月前的峰值水平在不久的将来。另一方面,有效的繁殖数量分析表明,基于我们提出的模型 意大利、德国、瑞士、丹麦、奥地利都大于1,倾向于保持位置周围波动 虽然俄罗斯的 小于1,它倾向于保持稳定的位置靠近 这些结果揭示了高COVID-19的第二波疫情的风险。

4.6.2。表明社会距离控制的重要性COVID-19流行病

我们建议SEIDR-guided格勒乌融合模型还表明社会距离控制的重要性COVID-19流行病。在这部作品中,SEIDR模型将被感染的人不是检疫部分暴露人口 (即。,asymptomatic infected population) and infective population (即。,symptomatic infected population), and the parameter 介绍了代表之间的感染能力的比率 先前的工作表明, 有感染能力低于 由于更少的病毒携带,所以 可以小于131日]。然而,我们发现SEIDR-guided格勒乌融合模型 大多数国家大于1的拟合历史COVID-19疫情数据。例如, 奥地利和俄国大约是2.7和1.5,分别。这个结果表明 有感染性的能力比 一些近期作品COVID-19得到类似的发现。例如,杨等人发现 人口可能受到症状和减少他们的活性物,虽然 人口不得(7]。 可以接触更多的人,从而导致更高的感染能力。这一结果表明,很难控制COVID-19流行而不降低 与他人的互动。特别是,无症状感染人口为代表 是一个很高的比例,根据最近的一项调查(17,18]。

我们进一步调查是否减少 的流动性可以减缓疫情的传播通过测试参数 影响SEIDR模型的预测。具体来说,我们拒绝 奥地利和瑞士的SEIDR模型和比较活跃的情况下预测之前和之后的调整参数。如图6,SEIDR模型的预测未来的感染是减少了调整后的参数。这个结果表明减少 的流动性对控制COVID-19大流行是有意义的。因此,我们建议采取更多的行动来减少 的流动性,如进行社会距离或增加测试来过滤掉的数量无症状感染人群。

5。讨论

在本节中,我们指出一些局限性和未来工作有前途的研究方向。评估在其他大洲。通过这个研究六个欧洲国家流行的历史数据,我们提出一种融合模型来预测和分析的动态COVID-19通过提取epidemic-related知识从SEIDR区划的模型指导格勒乌的训练模型。然而,世界上不同大洲进行了各种antiepidemic措施根据他们的经济、文化、和医疗条件在这大流行,导致不同的传播模式。可能出现一个问题,如果这SEIDR-guided格勒乌融合模型可以成功地预测和分析COVID-19流行在更多的国家。因此,一个有前途的研究方向是研究这个模型的普遍性通过收集更多的数据在世界上其他国家,然后研究如果发现和模型可以转让或其他任何可以发现有趣的发现。多国学习方法。在当前的研究中,我们训练SEIDR-guided格勒乌模型分别为每一个欧洲国家。这是因为模型的参数可能是非常不同的在不同的国家,可以与他们的医疗资源,人口,防疫措施。相比,训练一组参数对所有国家来说,训练参数分别为每个国家可以帮助得到一个更准确的预测和分析。然而,常见的不同的国家仍然存在(即知识。,不同的国家有相同的基本繁殖数量)。因此,另一个有前途的研究方向结合流行来自多个国家的数据提高COVID-19动态的预测和分析。例如,我们可以利用多任务学习同时处理不同国家的预测任务。在不同时期。在这项研究中,我们选择时间跨度在第二波疫情作为训练数据来预测积极确诊病例在第一个月的第二波疫情分析第二波疫情的风险。然而,我们的模型在不同时期的有效性仍值得研究,这可以被看作是另一个有前途的研究方向。之间为解决这一问题,我们使用数据2020.6.1 2020.8.31训练,结果见表4表明,融合模型仍然是最好的在所有的方法。加强网上流行监督系统。在本文中,我们提出了一个融合模型,该模型可以预测COVID-19大流行的动态,同时保持足够的可解释性。基于良好的预测和解释能力,我们的方法可以提高网上流行监督系统,如下所示。首先,我们的工作可以提高疫情监督系统通过提供更准确的预测,这是用户最关心的功能。第二,我们的工作可以加强疫情监督系统(即通过提供COVID-19传输模式。等我们的融合模型,可判断的参数有效的繁殖数量 和死亡率)。这些模式可能提供有价值的洞察未来的防疫和帮助公共卫生专家更好地了解疫情。第三,我们的模型能够模拟流行病发展的监督系统。用户可以探索一个防疫措施可能造成的影响,通过调整不同的模型参数和观察的预测结果。

6。结论

在这项研究中,我们提出一种融合模型,提取流行知识从先进的区划的模型指导培训。这样做可以保护融合模型的可解释性和进一步减少过度拟合的问题。评估我们的模型,我们收集了六个欧洲国家的流行历史数据从第一种情况出现在每个国家的日子,10月30日,2020年。基于这些流行的数据网络,我们表明,我们的模型可以实现先进的性能在几个任务,包括积极的预测确诊病例,分析有效的繁殖数量。我们的研究结果揭示了风险的第二波COVID-19流行在欧洲和证明的重要性,社会距离来控制疫情的爆发从数学建模的角度。

数据可用性

作者使用了JHU CSSE COVID-19源数据集,其中包含日常确认的时间序列数据,恢复,和死亡世界各地。这个数据集的链接https://coronavirus.jhu.edu/

的利益冲突

作者宣称没有利益冲突。

确认

这项工作得到了国家自然科学基金(62172011)。