文摘

我们学习了最常见的一种分布,即林德利分布,这是一个重要的连续混合分布的能力代表不同的系统。我们研究了该分布的三个参数,因为其高灵活性造型生活数据。由五个不同的参数估计方法,即最大似然估计,普通最小二乘法、加权最小二乘法,最大间距的产物,和Cramer-von米塞斯。仿真实验进行了不同的样本大小和不同的参数值。生成的数据的不同的方法比较,均方误差和平均绝对误差。此外,我们比较真实的数据的方法,它表示在伊拉克安巴尔省/ COVID-19数据。

1。介绍

林德利分布于1958年提出了林德利(1];然而,实际的兴趣始于2008年,当时Ghitany et al。2)研究了其性能及应用。从那时起,这个分布已被开发为普遍分布在2009年由Zakerzadeh林德利& Dolati [3),两个参数林德利分布在2013年由夏克尔et al。4),另一个两个参数分布林德利同年夏克尔& Mishra [5),林德利分布位置参数作为一个带三个参数的分布在2016年由Abd El-Monsef [6),另一个带三个参数的分布在2017年由夏克尔林德利et al。4]。

林德利分布是由两个连续分布混合不同的权重;第一个是指数分布 ,第二个与2和伽马分布 ,也就是说, 在哪里

因此,生成的函数如下:

林德利(1)使用 ;因此,概率密度函数(p.d.f)如下:

Ghitany et al。2]介绍了它的累积分布函数(c.d.f)如下:

参数估计的两个参数林德利分布是由许多研究者,如Al-Bayati [7],Sharafi [8],Demirci bic (9]。然而,林德利三参数分布的参数只有在最大似然方法估计是夏克尔et al。10]。因此,在本研究中,分布参数估计使用不同的方法。

2。材料和方法

2.1。林德利三参数分布

提出的参数分布(THPL)林德利夏克尔et al。10];重量 使用,如下所示: 导致以下:

数据12显示p.d.f.和c.d.f.不同的参数值。

的分位数函数拟合林德利分布是由以下几点: 在哪里 表示-兰伯特的分支 函数。

2.2。几个THPL分布参数的估计

著名的五个方法估计参数林德利分布的参数,包括最大似然(ML),普通最小二乘(OLS),加权最小二乘(WLS),最大间距(MPS)的产物,和Cramer-von米塞斯(CVM)。

2.3。最大似然估计

积极的对数似向量的观察 根据参数可以编写林德利分布如下: 在哪里 是样本均值。

夏克尔et al。10派生的最大似然估计(标定) , ,通过求解非线性方程组如下:

我们也可以获得企业最大化(11)通过fminunc在MATLAB函数。

2.4。普通和加权最小二乘估计

假设 是一个随机样本的次序统计量的概率分布。的 - - - - - -顺序统计量的均值和方差如下:

OLS和WLS情郎et al .(1988年提出的11]。我们可以得到OLS估计参数的最小化以下函数的参数,如下: 在哪里 代表的理论c.d.f.观察 分布的研究 代表经验c.d.f.通常估计 ;然后,我们得到如下:

这个函数可以代替后获得林德利三参数分布 在前面的方程中定义其c.d.f.方程(8),如下:

我们可以通过最小化确定OLS估计(16)的参数通过fminunc函数或通过求解以下方程:

我们可以通过最小化获得WLS估计参数的函数的参数如下:

这个函数可以代替后获得林德利三参数分布 在前面的方程中定义其c.d.f.方程(8),如下:

WLS估计可以通过最小化(19)的参数通过fminunc函数或通过求解以下方程:

2.5。最大间距估计的产物

1979年国会议员被程&派生阿明(12];该方法的思想是最大限度地增加以下功能: 在哪里

这个函数可以代替后获得林德利三参数分布 在前面的方程中定义其c.d.f.方程(8),如下: 在哪里

我们可以通过最大化识别议员估计(22)通过fminunc函数或通过求解以下方程: 在哪里

注意,如果有一个领带,我们找不到的自然对数 相应的观测。因此,我们替换 观察的p.d.f。,也就是说,

2.6。Cramer-von米塞斯估计

在1971年提出了CVM麦克唐纳(13]。该方法的思想是减少以下函数:

这个函数可以代替后获得林德利三参数分布 由其c.d.f在前面的方程。,这是定义在方程(8),如下:

我们可以通过最大化确定CVM估计(27)通过fminunc函数或通过求解以下方程:

3所示。结果与讨论

3.1。模拟

比较五个评估方法,数据产生的带三个参数的分布的基础上,分位数林德利函数定义在方程(10)。数据生成的四种不同的情况下,如表所示1。为每一个案例中,使用的样本大小不同(10、30、60、80、150和250年)。实验重复了10000次的组合。然后,参数估计的五个评估方法;比较的方法使用均方误差(MSE)和平均绝对误差(MAE)。表2显示了这些标准的公式。所有操作进行了2020年MATLAB代码(见1)。

3- - - - - -6说明我们的模拟研究。根据不同的方法进行了比较。这些结果表明,估计有属性的一致性和方法因为家中小企业和梅斯为他们减少增加样本量。

的偏好可以总结在表的方法7,这表明,国会议员和WLS最适合小样本大小(10、30)。国会议员、标定和WLS最好介质样品尺寸(80),和国会议员和企业最适合大样本大小(150、250)。

3.2。应用程序

83 COVID-19患者的生存时间死亡是由研究人员记录医疗部门在伊拉克安巴尔省/ Al。表8包含这些数据。

林德利三参数分布的参数估计的五个方法。此外,Kolmogorov-Smirnov 值, 及其相关 值计算,以确保这些数据按照三林德利分布。表9显示数据分布的参数分布林德利所有方法。

我们注意到所有的 值大于0.05,表明数据按照三林德利分布。

我们画p.d.f. c.d.f.林德利三参数分布基于以下几点: 在哪里 是参数估计。

根据方程(29日)和(30.),p.d.f.和c.d.f.可以画人物34

我们注意的行为估计函数是相对较近的经验函数。这一发现是一个好迹象,估计模型可以代表COVID-19数据。

4所示。结论

拟合的参数分布林德利(THPLD)是由五个不同的估计方法。进行模拟研究,这些方法比较使用MSE和梅。估计都是一致的,因为他们的MSE和梅值减少随着样本容量的增加。议员和WLS方法在小样本。国会议员,大中型企业,WLS介质样品。大中型企业和国会议员在大样本。

在实用方面,结果表明COVID-19数据按照三林德利分布。p.d.f.和c.d.f.估计基于五个方法,然后,这些函数被吸引。图形显示的行为估计函数接近经验函数。

clc
清晰的
%的试验(10000)。
m = 1; m = 0 (3、5); MSE = 0(3、5);美= 0(3、5);绝笔= 0 (3、5);
j = 1: m
%样本的大小,θ,α和β的值,你可以改变他们。
P = [10 1 3 2];% (n T B)
n =(1页);%样本的大小
T =(2页);%θ
一个= P (3);%α
B = P (4);%β
i = 1: n
结束
x =圆(x ', 4);
z = (x);
信谊T B
%初始
y0 = [P P (2) (3) (4)];
%的程序
S1 = 0; S2 = 0; S3 = 0;
i = 1: n
S1 = S1 + x / n;
S2 = S2 +日志( (x (i)));
S3 = S3 + x (i) ^ 2 / n;
结束
;
F = @ (y)双(LL (y y (1), (2), (3)));
(选项卡,fval exitflag1] = fminunc (F, y0);
T_ML =选项卡(1);
A_ML =选项卡(2);
B_ML =选项卡(3);
% OLE。
S = 0;
i = 1: n
;
结束
(T, A, B) =年代;
F = @ (y)双(S (y y (1), (2), (3)));
(选项卡,fval exitflag2] = fminunc (F, y0);
T_LS =选项卡(1);
A_LS =选项卡(2);
B_LS =选项卡(3);
% WLS。
S = 0;
i = 1: n
;
;
结束
(T, A, B) =年代;
F = @ (y)双(S (y y (1), (2), (3)));
(选项卡,fval exitflag3] = fminunc (F, y0);
T_WLS =选项卡(1);
A_WLS =选项卡(2);
B_WLS =选项卡(3);
%的议员
信谊u
;
;
S = 0;
y (1) = 0; z (n + 1) =正;
因为我= 1:n + 1。
y (i + 1) = z(我);
D (i) = CF (y (i + 1) CF (y (i));
如果D (i) = = 0
S = S +日志(pdf (y (i)));
其他的
S = S +日志(D (i));
结束
结束
S (T, A, B) = - S / (n + 1);
F = @ (y)双(S (y y (1), (2), (3)));
(选项卡,fval exitflag4] = fminunc (F, y0);
T_MPS =选项卡(1);
A_MPS =选项卡(2);
B_MPS =选项卡(3);
% CVM
S = 0;
i = 1: n
;
结束
S (T, A, B) = + 1 / ( n);
F = @ (y)双(S (y y (1), (2), (3)));
(选项卡,fval exitflag5] = fminunc (F, y0);
T_CVM =选项卡(1);
A_CVM =选项卡(2);
B_CVM =选项卡(3);
E = [P (2) T_ML T_LS T_WLS T_MPS T_CVM; P (3) A_ML A_LS A_WLS A_MPS A_CVM; P (4) B_ML B_LS B_WLS B_MPS B_CVM]; %真实的大中型企业,OLS, WLS,国会议员,CVM。
E_ML = (E (:, 2) - E (: 1));
E_LS = (E (:, 3) - E (: 1));
E_WLS = (E (:, 4) - E (: 1));
E_MPS = (E (:, 5) - E (: 1));
E_CVM = (E (:, 6) - E (: 1));
%如果马克斯(abs(和(E (: 2:6), 2) / 5 P(: 2:4) ')) <总和(P (: 2:4))
(exitflag1 + exitflag2 + exitflag3 + exitflag4 + exitflag5)
如果(exitflag1 + exitflag2 + exitflag3 + exitflag4 + exitflag5) > = 5
M = M + E (: 2:6)
MSE = MSE + [E_ML E_LS E_WLS E_MPS E_CVM]。^ 2
美=美+ abs ([E_ML E_LS E_WLS E_MPS E_CVM])
结束
结束
M = M / M;
MSE = MSE / m;
美=美/ m;

数据可用性

从作者数据要求。

的利益冲突

作者宣称没有利益冲突。

确认

作者感谢Adnan m·侯赛因他编程的贡献。