文摘

在当前的场景中,大流行疾病的爆发COVID-19极大的兴趣。广泛的统计分析这一事件仍在,但它是立即评估疾病所需的动力为了安排适当的检疫活动,估计所需数量的地方医院、个体防护水平,隔离受感染的人的速度,等等。在本文中,我们提供了一个方便的方法的数据对比,可以帮助政府和私人组织。迄今为止,事实和数据总量的确诊病例,每日确诊病例,死亡人数,每日死亡在亚洲国家已报告。此外,提出了一个统计模型来提供一个最好的描述COVID-19总死亡数据在亚洲国家。

1。介绍

冠状病毒病(COVID-19)是一种新发现的冠状病毒引起的传染性疾病。“冠状病毒”这个名字来源于拉丁语电晕,意为“皇冠”或“花环。“这个名字是指病毒粒子的特性外观(病毒的感染性形式)电子显微镜。

冠状病毒第一次被发现是在1930年代驯化的急性呼吸道感染鸡传染性支气管炎病毒(IBV)造成的。之后,在1940年代,两个动物冠状病毒,鼠肝炎病毒(MHV)和传染性胃肠炎病毒(TGEV)、分离(1]。第一次人类冠状病毒被发现在1960年代(2]。最早的研究来自人类胚胎气管器官从呼吸道获得文化的成人感冒,后来被命名为人类冠状病毒229 e和人类冠状病毒OC43 [3]。其他人类冠状病毒已经被确认,包括2003年冠,HCoV NL63 2004年,2005年HKU1, MERS-CoV([2012年4])。这些都涉及严重的呼吸道感染。

最近,一种新的冠状病毒中观察到一个叫做中国武汉市著名的海鲜批发市场,有大量的人来卖或买活海鲜。2019年12月31日,武汉市卫生委员会(WMHC)报道,一群27原因不明的肺炎病例。之后,2020年1月11日,世界卫生组织(世卫组织)这部小说命名SARS-CoV-2冠状病毒,这种病毒导致COVID-19,看到5]。

冠,MERS-CoV和covid - 2019病毒是高致病性Betacoronaviruses和负责导致呼吸道和胃肠综合症。冠状病毒感染的平均潜伏期为5天,和一个区间,可以达到16天。患者的遗传性感染SARSCoV平均7天之后出现症状。然而,COVID-19初步数据表明,传输可能发生,即使没有症状和体征的出现;看到https://en.wikipedia.org/wiki/Coronavirus_disease_2019

2。细节和对比COVID-19情况下的亚洲国家

亚洲是由于COVID-19受影响最严重的地区之一。在本节中,我们提供了详细的信息和比较的情况下,总死亡人数,总恢复,和活跃的情况下,亚洲国家。详细描述的情况下,总死亡,全部恢复,和活跃的情况下,亚洲国家到2020年4月8日,提供了表12。详情,我们参考https://www.worldometers.info/coronavirus/的国家。注意图形可视化的总情况下,总死亡,全部恢复,活跃情况下COVID-19的亚洲国家显示在附录中一个。我们提供一个非常简单的方法进行比较,不仅局限于亚洲国家,也可以申请每个国家来分析疾病的影响。

3所示。提出了统计模型的家庭

在大数据科学的实践,特别是统计理论,是一个有兴趣增加定义新的统计模型或统计模型的新家庭提供更好的描述考虑的问题;参见[6,7]。更多细节,我们指的是(8]。

通常,添加额外的参数(s)分布函数的类提供更大的灵活性,提高了特征,并提供了更适合的真实数据比其他修改模型。但不幸的是,另一方面,再参量化的问题出现。为了避免这些问题,并提供一个更好的描述真实的自然现象,我们进一步把这个分支统计理论,提出一种新的统计模型。提出了一类分布可能被称为一个新的灵活的扩展X(NFE -X)类的分布。

是一个随机变量的密度 ,让 是一个函数的 随机变量的 累积分布函数(cdf)的T - 家庭的分布(9)是由 在哪里 满足某些条件,看到9]。相对应的密度函数(1)是

如果 ,和设置 在(1提出了类的),我们得到了cdf的分布。随机变量 据说NFE - 类的分布,如果累积分布函数(cdf) , 是由

相对应的密度函数(3)是

该方法最突出的动机之一是引入一个新的类分布在不添加额外的参数结果在避免重新调节问题。第二部分提供了一个特殊的子模型的类称为一个新的灵活extended-Weibull (NFE-Weibull)分布和调查其密度函数的图形化行为。

4所示。子模型描述

本节提供了一个特殊的子模型NFE - 类的分布。让 是由威布尔分布函数的模型 ,在哪里 然后,由cdf NFE-Weibull的表达式 与密度函数

对不同的模型参数值,块的密度函数NFE-Weibull画在图模型1

5。数学性质

在本节中,NFE-Weibull分布导出的一些数学和统计特性进行了讨论。

5.1。分位数函数

的分位数函数NFE - 家庭是函数 满足的非线性方程

通过使用(3)(7),一些代数操作后,我们得到的 在哪里 的解决方案是

5.2。时刻

在这里,我们得到的一些时刻NFE -X家庭。为了简单起见,我们省略的依赖 在参数向量 密度(4)可以表示如下:

使用pdf和cdf(威布尔分布的9),我们得到 在哪里 对任何正整数 , th的NFE-Weibull分布的时刻

使用(10)(11),我们得到了 thNFE-Weibull分布的时刻。

我们得到的前四个时刻NFE - 分布。形状的影响参数对偏斜度和峰度可以检测到的时刻。基于时刻,我们获得NFE-Weibull分布的偏斜度和峰度措施。NFE-Weibull的偏态分布是获得使用以下表达式: 在哪里 是随机变量的第二个和第三个的时刻吗 pdf (6)。此外,的峰度 是派生 在哪里 第四的时刻吗 这些措施不太敏感的离群值。情节的均值,方差,偏斜度和峰度NFE-Weibull分布显示在数字23

5.3。在其他手段和时刻

以下结果提出了一个原始的扩张 在哪里

几个关键条件时刻可以获得积分 不同的价值观 最有用的下面。对于任何 ,(我) th有条件的时候 是由, (2) th逆转的时刻 是由 (3)的平均偏差 的意思是,说 是由 在哪里 (iv)的平均偏差 关于中值,说 是由 剩余寿命的参数也可以决定使用 数的值 特别是,(v)平均剩余寿命的定义是 并给出方差剩余寿命 (vi)平均剩余寿命的定义是逆转 剩余寿命的定义是和方差逆转

6。最大似然估计和蒙特卡罗模拟

部分处理模型参数的估计和蒙特卡罗模拟来评估估计的性能。

6.1。最大似然估计

最大似然估计过程是普遍采用的方法估计模型参数。获得的估计是基于这个过程享受理想的渐近性质,因此,他们常常利用获得置信区间(CI)和测试统计假设。假设 是一个随机样本的观测值的大小 获得(4)。相应的对数似函数可以表示为

可以最大化对数似函数直接或通过求解非线性微分获得的似然函数。对数似函数的一阶偏导数与尊重 是由

设置 等于零,解决数值收益率(ml)的极大似然估计 一个优化等软件R函数optimnlminb可以用来发现了什么 (即最小负对数似函数。,最大化对数似函数)。虽然在这些衍生品的规范是可选的R功能,快速和快速收敛可能实现如果负对数似函数的表达式。在我们的实现中(R准则给出了附录B),我们使用optim()前庭功能参数方法=“君”获取毫升。

6.2。蒙特卡罗模拟

建立数值调查检查行为的ml NFE-Weibull模型。对于不同的样本大小,措施偏见,绝对的偏见,和均方误差(为了)计算估计的性能进行评估。(我)我们从NFE-Weibull产生500大小的分布; (2)一个优化算法需要一组参数的初始值。特定的模型参数值 是选为 ; ; (3)毫升的参数 计算每个 和所有集(iv)计算偏差、绝对偏差和均方误差

仿真结果显示在数字4- - - - - -6

7所示。建模COVID-19死亡人数的亚洲国家

我们前面提到的,广泛的统计分析事件发生的由于COVID-19仍然是。但是,现在马上需要提出一个合适的模型来提供更好的描述COVID-19总死亡数据来估计所需数量的地方医院、个体防护水平,隔离受感染的人,等等。在本节中,我们模型COVID-19总死亡发生在亚洲国家4月8日,2020年。NFE-Weibull分布应用于这个数据集相比,威布尔,等其他知名分布拟合Marshall-Olkin威布尔(割),并取幂威布尔分布(EW)。重要的是要强调,电子战分布是一个流行的模型分析数据在应用领域,特别是在医学科学,看到10]。割分布是另一个嵌套模型,提供了威布尔和伽马分布的特点,看到11]。竞争的cdfs分布如下:(1)威布尔分布 (2)电子战分布 (3)割分布

选择一个合适的近似模型是理想的分配一些偏好选择。因此,我们认为某些分析措施为了验证分布更适合考虑数据。这些分析措施包括(i)等四种歧视措施Akaike信息准则(AIC),贝叶斯信息准则(BIC) Hannan-Quinn信息准则(HQIC),和一致的Akaike信息准则(CAIC)和(2)三个拟合优度措施包括安德森亲爱的(广告)检验统计量,Cramer-Von-Messes (CM)测试数据,和Kolmogorov-Smirnov (KS)与相应的测试统计数据 值。这些统计数据模型与最低的值被认为是最佳人选模型。这些措施可以探索的公式(12]

COVID-19总死亡数据的亚洲国家,标准错误(在括号中)的估计模型的参数表中提供3。NFE-Weibull和其他考虑模型的分析方法提供了表45

正如我们看到的,结果(表45)表明,NFE-Weibull分布分析措施和最大的较小值 值显示,该模型提供了更好的选择比其他视为竞争对手。因此,该模型可以作为最佳人选模型建模COVID-19总死亡数据的亚洲国家。在结果表中提供的支持45的估计cdfs分布绘制在图7生存,而kaplan meier块拟合分布和其他呈现在图8。从数据78,很明显,该模型适合估计cdf密切和生存函数比其他竞争对手。

8。结束语

COVID-19是最致命的病毒,极大地影响了日常生活事务。政府和其他组织应该感兴趣的比较提供依据,并提供一个更好的描述数据的考虑得到可靠的感兴趣的参数估计。在本文中,简要比较COVID-19事件等情况下,总死亡人数,总恢复,活跃情况下提供的亚洲国家。这样明确的比较应有助于促进COVID-19影响的人民。此外,介绍了统计模型的一个新类。一些数学提出了类的属性。模型参数的最大似然估计。最后,提出了类的一个特殊的子模型称为新的灵活扩展的详细研究了威布尔分布。该模型提供的灵活性可以非常有用的充分描述总死亡数据在亚洲国家由于COVID-19。我们注意到,该模型可以提供一个紧密配合COVID-19总死亡数据。

附录

答:显示COVID-19事件

数据9- - - - - -12提供了图形化显示COVID-19事件发生的亚洲国家。

注意:由于BT的死亡人数,KH,洛杉矶,密苏里州,MV,锰、NP、TL, VN零“0”。因此,这些国家的策划总死亡的省略。

b R准则

责任。R代码分析

下面的代码已经被用于计算模型参数的值。

注意:在这里,点用于模型。

库(AdequacyModel)

data = c(8 14日,9日,5日,20日,3333年,9日,4178240年,3993年,69年,72年,93年,6、7、1,4,19日,65年,3,2,60182,6日,41岁,6200年,7日,1、2、5,30812年,12、3)

排序(数据)

数据

# # # # # # # # # # # # # # # # # PDF模型

pdf_pm < -函数(par, x)

{

θ=标准[1]ηθ= par [2] 2 埃塔 (x ^(θ1)) exp(η x ^θ) ((1-exp(η x ^θ))) (2 - ((1-exp(η x ^θ))^ 2)) (1 / (exp ((1-exp(η x ^θ))^ 2)))

}

# # # # # # # # # # # # # # # # #提供建议的模型

cdf_pm < -函数(par, x)

{

θ=标准[1]

η= par [2]

1 - (1 - ((1-exp(η x ^θ))^ 2))/ (exp (1-exp(η x ^θ))^ 2)))

}

set.seed (0)

善良。适合(pdf = pdf_pm cdf = cdf_pm开始= c(1, 1),数据=数据,方法=“君”,域= c(0,正),标定= NULL)

B.2。R绘图代码估计分布函数。

8 x = c(14日,9日,5日,20日,3333年,9日,4178240年,3993年,69年,72年,93年,6、7、1,4,19日,65年,3,2,60182,6日,41岁,6200年,7日,1、2、5,30812年,12、3)

x (x)

# NAPTW

θ= 0.3147927

η= 0.2818076

x <传言称(x)

F1 < -ecdf (x)

ecdf < f1 (c (x)) proposedcdf < 1 - (1 - ((1-exp(η x ^θ))^ 2))/ (exp (1-exp(η x ^θ))^ 2)))情节(x, ecdf lty = 1, lwd = 4,类型=“s”, xlab = " x ", ylab = " G (x;0.3147927,0.2818076)”,ylim = c (0, 1), xlim = c(最小(x)最大(x)),坳= "黑色")

票面价值(新= TRUE)

情节(x, proposedcdf xlab = " x ", ylab = " G (x;0.3147927,0.2818076)”,ylim = c (0, 1), xlim = c(最小(x)最大(x)),坳= "红色",lty = 5, lwd = 4, type = " l ")

票面价值(新= TRUE)

传说》(1500,0.4,c(“真实数据”、“模型”),坳= c (1、2), lty = c(1、5),电池=“n”, cex = 1.2)

B.3。R代码绘制安装生存函数。

8 x = c(14日,9日,5日,20日,3333年,9日,4178240年,3993年,69年,72年,93年,6、7、1,4,19日,65年,3,2,60182,6日,41岁,6200年,7日,1、2、5,30812年,12、3)

总结(x)

库(生存)

δ=代表(1、长度(x))

x <传言称(x)

公里= survfit (Surv (x,δ)~ 1)

情节(公里,conf.int = FALSE, ylab = " S (x);0.3147927,0.2818076)”,xlab = " x ", lty = 1,坳= "黑色" pch = 19日,lwd = 4)

θ= 0.3147927

η= 0.2818076

党卫军< -函数(x)

{

((1 - ((1-exp(η x ^θ))^ 2))/ (exp (1-exp(η x ^θ))^ 2)))

}

行(seq(3993,长度。= 100),学生(seq(3993,长度。= 100),坳=“红色”,lty = 5, lwd = 4)传说(0.7,1500 c(“真实数据”、“模型”),坳= c (1、2), lty = c(1、5),电池=“n”, cex = 1.2)

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

没有利益冲突有关的出版。

确认

第一作者也承认的支持山东省社会科学规划研究项目:研究慈善组织的吸引力的背景下社会治理创新(ProjectNo。19 cshj07)