文摘
在过去的两年里,整个世界对抗COVID-19大流行。COVID-19迅速增加的情况下可以归因于几个因素。最近的研究表明,在环境温度变化与案件的增长相关联。在这项研究中,我们模拟了每月增长率在126个国家每百万COVID-19病例的感染下使用各种增长曲线结构方程建模。此外,引入了环境温度作为时变协变量来提高模型的性能。生长曲线模型的参数估计,并因此,结果讨论了影响国家从2020年8月到2021年7月。
1。介绍
冠状病毒病(COVID-19)在武汉市首次报道,中国。几个人在武汉的海鲜市场与未知的病毒性肺炎(1- - - - - -3]。在接下来的几个月里,病毒,严重急性呼吸系统综合症冠状病毒2 (SARS-CoV-2),中国然后在世界范围内蔓延到其他城市。2020年1月30日,世界卫生组织(世卫组织)总干事宣布爆发COVID-19国际关注的突发公共卫生事件。2020年3月,超过一百个国家面临的挑战由于这种病毒,感染病例,从COVID-19识别几乎世界各地。2020年3月以来,目前针对SARS-CoV-2特定疫苗。没有特定的治疗药物或疫苗,控制SARS-CoV-2的传播几乎是不可能的,任何国家的健康管理系统是不够充分的应对这次大流行(4- - - - - -7]。
根据世界卫生组织的报告(8),2.14亿多例报道全球到2021年8月底,其中大约447万死亡发生。这里,注意到受感染病例和死亡的增长率在不同地区是不同的。很多原因可以影响增长率的情况下,在一个地区或国家,如健康管理系统,政府政策和环境因素。在初始阶段,部分或完全封锁检疫发挥了重要作用在控制病毒的传播。工作由Bacchetti et al ., (9),显示锁定高度有效地降低死亡率在污染地区早期的大流行。此外,马尔克斯et al。10)认为,空气污染导致COVID-19发病率和死亡率更高。Azuma等人研究了各种环境因素的作用SARS-CoV-2在室内空间的传播(11]。
在2020年第一季度,在研究COVID-19病例和相关气象因素在中国的122个城市,没有证据发现COVID-19的案件数量将下降当天气变得温暖12]。相反,在实验室的早期研究Casanova et al。13可迅速灭活)证实冠随着温度的增加从4°C到40°C。尽管2020年第二季度的数据非常有限,Mandal和Panwar14和邵等。15)怀疑SARS-CoV-2的传播也可能受到温度变化的影响。此后,许多研究人员已经建立了温度和COVID-19用例之间的关系(16- - - - - -18]。对于特定的地理区域,存在一些其他因素之间的关系研究(19- - - - - -22]。
建模的呼吸道疾病总是高优先级的人员。此外,COVID-19爆发对每个人都提出了一个新的挑战来处理这种情况。在过去的几个月里,已有多种方法被用来适应COVID-19增长的情况下。Balli, (23),提出了时间序列预测模型获得疾病曲线使用机器学习方法和预测流行趋势。为此,线性回归,多层感知,随机森林,利用支持向量机学习方法。此外,susceptible-infected-recovered(先生)模型是一个著名的和广泛使用的呼吸道疾病的方法。经典的爵士模型更新,通过融合四个新因素是至关重要的数据的拟合COVID-19情况下(24]。一些作品已经修改了爵士模型在相同的方式25- - - - - -27]。
使用广义物流和广义理查兹模型,吴et al。28)在中国提出了适合COVID-19情况;然后,执行类似的锻炼其他33个国家,这是当时处于欠发达阶段。此外,一些分数阶动力学模型的分析提出了病毒的传播(29日- - - - - -33]。很少有研究人员尝试COVID-19动力学模型拟合的情况下在环境温度。施等。34)使用修改后的susceptible-exposed-infectious-recovered (M-SEIR)模型,通过融合温度系数来模拟COVID-19疫情动态在武汉。在其他的研究中,他们检测了之间的关联动力学的新病例的流行病学参数和温度使用集成一个自回归移动平均(ARIMA)模型(35]。此外,沙et al。36)提出了区划的传播动力学的数学模型下的COVID-19卡普托分数阶导数。Hilbert-type不平等中发挥重要作用的数学模式复杂分析,数值分析,微分方程定性理论和实施(37- - - - - -39]。
一般来说,横向或纵向时间序列,基于数据的方法是利用反应变量时观察到的时间。这些方法适用性问题和相应的优点和缺点。在这项研究中,我们使用结构方程建模(SEM)和纵向数据。这些模型通常被称为潜在的曲线或生长曲线模型(GCMs)。本文的其余部分组织如下。节2,各种事实一直在探索使用适当的情节每百万(CPM)和温度情况下超过几个月。然后,在节3,我们为所有国家数据建立各种模型,为进一步分析选择最合适的一个。节4,温度已经添加的时变协变量建模增强认为GCM的性能。节5,所有与他们的解释结果进行了讨论。此外,完整的文章一直在总结和结论部分6。
2。探索性数据分析
在这项研究中,取得了全球COVID-19病例的数据https://ourworldindata.org。总共126个国家被认为是病例记录从2020年8月到2021年7月。在一个月内给出的CPM代表记录的病例数在正月十五。因此,每月收集温度被认为是国家的首都https://www.weather-atlas.com。值代表温度在一个月内的平均温度。
在开始分析之前,让我们探索和讨论一些隐藏的事实数据。每月一个简单的轨迹图从2020年8月到2021年7月所有国家在图给出1。在这期间,很容易观察到的增长CPM在所有国家在第一个月高,然后稳定在大多数国家在未来几个月。然而,许多国家经历了CPM突然快速增长在过去的几个月里。
图2(一个)显示一组框情节理解的几个月数据的性质。框情节在这个图显示在几个月内CPM分布。可以看出,CPM的中位数和均值比和几个月的意思是增加明显大于中位数在所有。因此,分布在所有月积极倾斜。此外,中位数和分散的几个月在大规模增加。在少数国家,CPM非常高,所以这些国家作为离群值在最初几个月;然而,在最后一个月,几乎所有与样品的性质。相关矩阵图的CPM月也显示在图2 (b)。除了前三个月,相关性高好几个月时间接近,但倾向于降低随着时间增加的相关性之间的分离测定。相反,在头几个月,相关性下降为即将到来的几个月但又开始增加。这是薄弱的证据;然而,这是第一个表明季节可能与CPM的增长。此外,一些基本统计信息理解的特点,给出了观测数据表1。
(一)
(b)
全球气温的分布在图中给出了几个月3。从图可以看出3(一个)向上,全球温度分布变化在今年上半年下半年然后向下。然而,这并不意味着所有国家遵循相同的模式。这可以从图3 (b),每个月,密度图被画。密度的情节是多通道,因为过去几个月来,每个国家根据其位置导致温度分布在全球地图。一般来说,随着纬度的增加温度降低。这个latitude-wise不同模式的温度可能产生重大影响的增长CPM在各自的国家。
(一)
(b)
3所示。模型构建和启发
传统方法研究线性和非线性的变化框架是回归和方差分析(方差分析)。这些方法基本上处理平均水平差异,以及个人,从残差变化是观察。利用信息从残差几个随机效应方差分析等方法,提出了多级建模和分层线性建模。这些模型的帮助下探索不同个体随机系数。然而,这些模型的局限性在于他们是基于单个响应变量。一个响应变量不能捕获所有的复杂性增长模式(见[40])。
作为这项研究的目的是观察个体内的变化对所有国家和个人间的差异考虑时间,所以,拥有这样的特点,结构方程建模提出了纵向数据。全球大气环流模型,通常应用在社会和行为科学建模,用于研究这些变化。GCM,响应变量是观察到的命令时间而定常或时变反是;也可能存在。GCM的基础和假设检验个人改变和个人间的差异进行了讨论和派生(41]。在[42),作者讨论了不同的模型,分析了皮质醇的GCM生产数据。纵向研究使用生长曲线模型的详细信息,你可以参考(43- - - - - -46]。对于理解基于潜变量与各自的模型R代码,你可以遵循[47]。
作为本研究的主要目标是找到一个更好的模型CPM轨迹,如图1,因此,在本节中,一些可能的全球大气环流模型,如线性、指数,潜伏,然后介绍了多相CPM配件可以提供更好的替代品。GCM的总体结构可以作为 (在哪里t]n是一个multioccasion向量代表CPM的观测值吗nth国家tth月。一组向量Λ0,Λ1,Λk共同负责的个体内的变化,即。,each of these captures the growth of CPM in a country over the months. This vector defines the shape of the interindividual change such as linear and exponential for a country. The latent or unobserved variables which are denoted byτ0,τ1,τk在个体内的变化在国家定义个人间的差异。在定义模型(1),每个个人间的差异变量τ0,τ1,…,τk与相应的个体内的改变变量Λ吗0,Λ1,…,Λk。
一般来说,潜在的变量的集合τ0,τ1,…,τk与平均向量(多元正态分布µ0,µ1,…,µk)和随机方差和协方差σij;我,我= 1,2,…k。均值向量捕获模式的个体内的变化和差异,和协方差代表国家之间的内部和不同的程度。时间剩余变量,ε(t]n,假定意味着0和相同的方差,σ2在每个场合;此外,它被认为是不相关的其他变量。
让我们首先描述,推导出一些模型使用(1CPM),然后选择最佳模型。很少有合适的轨迹拟合模型,被认为是线性的,指数,潜伏,多相。
3.1。线性增长曲线模型
在线性GCM,结果变量的增长是一条直线的形式可能是积极的,消极的,时间或不变的方向。可以被两个向量,线性GCMΛ0和Λ1几个月,因为不同的国家在从模型(1)。模型应用于2020年8月至2021年7月,因此,我们有 在Λ0用于描述的初始水平的测量结果变量,当其他效应是0,而Λ1负责C的增长或下降n。这意味着国家可以通过两种方式相互之间的差别,如他们潜在的拦截(τ0)和潜在的斜率(τ1)。所有条目Λ0是固定为1,这意味着跨月拦截影响所有措施以同样的分数。
3.2。二次生长曲线模型
一般来说,在测量变量随时间的变化是非线性的。所以,我们想要引入更多复杂的模型来捕捉这种非线性。为此,我们引入另一个向量Λ2负责二次改变个体内的变化和个人间的差异。在这里,另一个两个向量Λ0和Λ1负责拦截和线性的变化轨迹。我们定义三个向量Λ0(t]=[1,1,1,1,1,1,1,1,1,1,1,1],Λ1(t]=[0,1,2,3,4,5,6,7,8,9,10,1],和Λ2(t)=(Λ1(t])2=[0、1、4、9、16、25岁,36岁,49岁,64年,81年,100年,1]。
初始水平的结果变量描述τ0后,然后,在每个连续的时间段,线性和二次变化是由向量τ1和τ2。
3.3。指数生长曲线模型
在指数GCM,两个向量,Λ0和Λ1,负责指数个体内的变化,而这些可以定义等 在哪里λ可以从观测估计。国家之间的个别间变化描述由两个潜在的随机变量τ0和τ1。在这里,随机变量τ0n可以被解释为最高级别的Cn。的和潜在的斜率分数和潜在的渐近分数(τ0n+τ1n)代表的价值Cn[0]。随机变量τ1n代表一个国家的潜在变化n(t从最初的水平到即将到来的几个月。的参数λ显示的速度的水平Cn(t)改变了这里的渐近水平和建模是相同的所有国家,这意味着任何个人的速度n(t)水平变化是单向(不断增加或减少对他或她的渐近能力,τ0n)和常数(指数)在整个观测期间从2020年8月到2021年7月。这种假设可以放松在进一步的研究中。
3.4。潜在的增长曲线模型
基础为潜在的自由GCM估计系数,这样可以实现最优轨迹的变化按数据的性质,而在早些时候讨论了模型,根据系数已经提前固定。在这里,等基础系数定义
我们固定的第一个和最后一个基础系数为0和1,作为模式识别是很有必要的。在潜在的GCM的情况下,个体内的变化的非线性模式由向量Λ捕获1(t)和一个个人间的差异变量τ1。
3.5。多相生长曲线模型
一个多相GCM是基于不同的样条回归模型,对不同时段相连。是观察到,不同国家面临许多COVID-19波,因此多相CPM建模的模型可能是一个好的选择。图1显示了这样的模式,其中的变化率COVID-19情况下不是统一考虑几个月。从许多可能的多相模型,尤其是国会议员[3,4,5],已经被建模。后缀向量指定长度的阶段考虑在模型中。作为数据取自2020年8月至2021年7月,因此,向量(7,25,37表示三个阶段是作为第一阶段(2020年8月,2020年9月和2020年10月),二期(2020年11月,2020年12月,2021年1月和2021年2月),和第三阶段(2021年3月,2021年4月,2021年5月,2021年6月和2021年7月)。在国会议员[3,4,5]模型中,第一阶段称为基线阶段,通过Λ建模0,而第二阶段和第三阶段通过Λ建模1和Λ2,分别。因此,这三个向量成为个体内的变化 的值λjs可以估计的数据。
个人间的差别是由潜在的随机变量τ0,τ1,τ2。潜变量的方法τ0,τ1,τ2代表平均基线C(t]n水平,大量的t]n第二阶段的变化,和数量,t]n分别在最后阶段。同时,潜变量的方差代表国家在这些方面不同程度的个体内的变化和个人间的差异是一个方面如何与个人间的差异可以被定义的其他方面的协方差。
考虑中找到最好的模型,一些著名的模型拟合标准,如Akaike信息准则(AIC),贝叶斯信息准则(BIC) Tucker-Lewis指数(TLI),均方根误差近似(RMSEA)χ2统计与自由度(测向)已经采取了。AIC值较低,BIC RMSEA,χ2统计和更高的值统计表明TLI的选择一个合适的模型。根据这些标准,它可以从表2多相模型,MP[3,4,5],表现比别人。因此,可以得出结论,多相GCM是考虑模型中最合适的。系数的估计认为全球大气环流模型给出了表3和讨论的部分5。多相GCM、情节结构如图4。在情节结构,虚线显示固定因子载荷和黑暗线显示了估计因子载荷的元素。预计,添加合适的协变量,多相GCM的总体性能也会提高。
4所示。建模与时变协变量
许多因素影响CPM的生长,但环境温度有自己的重大影响。早些时候,节2它已经表明,可能会有一些CPM和温度之间的依赖关系。同时,从数据2(一个)和3(一个)中,可以看出,每月获得CPM取决于全球温度的模式。如果温度作为协变量添加所有国家的数据,那么这个模型将表现强劲。
一般来说,两种类型的预测变量是用于纵向研究。协变量是常数的测量时间称为定常协变量(TIC)随着时间的推移,不同时期称为时变协变量(TVC)。在这里,在这项研究中,温度是一个TVC月,直接影响了CPM系数,说,γ(t]。现在,定义的模型(1)在TVC的存在可以重新定义如下: 在哪里T(t]n代表的温度nth的国家tth月。所有模型的TVC表现比各自的模型在前一节中介绍。同时,我们尝试不同的阶段可能的组合和TVC构建多相模型。在考虑模型中,是优于与AIC BIC, TLI RMSEA,然后呢χ218722年统计数据(d.f)值。18843年02。50,0。79年0。07年,361。44(194),分别。在表3的估计系数考虑与TVC模型得到。对于多相GCM ,情节结构如图5。在情节结构,虚线显示固定因子载荷和黑色线表示估计因子载荷的元素和tvc的估计系数。
5。结果
在本节中,我们讨论的结果表3和4。在表3四个模型的参数估计。对于线性GCM,意味着基线水平C(t]n是77。1223 (τ0),然后测量增长的增加0。0554 (τ1)个月。在二次GCM,意味着基线水平的结果变量是77。5197年和抑制和增量在线性和二次阶段是0。3052和0。分别为0240。76年是指数GCM的基线水平。9430年的总和τ0和τ1。在这之后,增长t]n观察到有一个指数15吗。9286年一些限制或一个国家的能力。从潜在的GCM平均基线值是77。2063年,平均总数量的增长−0。2633.估计的价值C(t]n在任何一个月可以通过[77计算。2063 + (−0。2633)λt),例如,在2020年10月的估计价值C(t]n是76。99637年。为考虑多相模型,国会议员[3,4,5],平均基线值是77。0714年。平均增长数量从2020年11月到2021年2月−0。5005年,额外的增长数量是0。2096年从2021年3月到2021年7月。
与潜在的GCM相似,可以估计C(t]n使用多相的各自的系数的估计模型。的协方差τ0,τ1和τ2表中所有模型还提供了。方差方面代表了国家不同程度在个体内的初始水平变化和协方差表示个人间的差异。
在表4估计,各种模型的系数是观察TVC,温度。在这个表中,所有系数可以用类似的方式解释如表3,除了由于协变量的回归系数。回归系数可以被定义为一个单位温度变化的时间t这是相关的γ(t)单位的变化(t]。这里,值得注意的是,几乎在所有的月,温度与CPM的增长呈现负相关。
6。结论
在这项研究中,由于COVID-19 CPM的增长被认为是一个变量。对于不同的国家,CPM的轨迹是研究从2020年8月到2021年7月。个体内的变化和个人间的差异被抓获使用线性、指数,潜伏,多相模型。根据一定标准,多相GCM执行优于其它模型。因此,它可以优先用于分析。许多因素负责CPM的快速增长的国家。此外,这些因素影响不同的国家有不同的权重。因此,在这项研究中,环境温度被认为是协变量显著影响CPM的增长。不同模型拟合的数据没有,协变量。根据不同的拟合标准,注意到这个模型介绍了改善当温度作为协变量。 So, we can say that temperature may be one of the reasons responsible for the changes in CPM over the months. Nevertheless, other possible factors may have an important role in the growth of CPM and can be included in the model for further study. The inclusion of other factors in models may improve results. Furthermore, for the study of growth in CPM for a particular region, there may be differences in the model-based outcomes.
数据可用性
使用的数据来支持这个研究的发现了从相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是支持的塔伊夫大学的研究人员,支持项目没有。塔伊夫大学TURSP-2020/318塔伊夫,沙特阿拉伯。这部分工作由学院卓越计划(埃克斯波特学院/动力/ 2021 - 22/32443)大大学的委员会(UGC),印度。