概率与统计学报

概率与统计学报/2017年/文章

研究文章|开放访问

体积 2017年 |文章ID. 6303462 | https://doi.org/10.1155/2017/6303462

吉米·雷耶斯,奥斯瓦尔多·贝内加斯,Héctor W. Gómez 修改Slash Lindley分布“,概率与统计学报 卷。2017年 文章ID.6303462 9. 页面 2017年 https://doi.org/10.1155/2017/6303462

修改Slash Lindley分布

学术编辑:RamónM.Rodríguez-Dagnino
已收到 2016年9月27日
修改 2017年1月17日
公认 2017年1月29日
发表 2017年2月19日

摘要

在本文中,我们介绍了一种新的分布,称为改进的斜杠林德利分布,可以被视为林德利分布的延伸。我们表明,这一新的分布在山牙病和偏斜方面提供了比林德利分布更具灵活性。我们派生了新分布的时刻和一些基本属性。时刻估计和最大似然估计使用数值程序计算。我们对最大可能性估算器进行了模拟研究。与其他较小型号相比,建议模型的适合表示良好的性能。

1.介绍

林德利分布是由林德利提出的[1]具有所提供的密度函数 我们通过写作表示这一点 ,在那里 是形状参数。相应的累积分布函数(C.D.F.)是 Ghitany等人详细研究了Lindley分布的性质[2]。Jodrá[3.]使用兰伯特 用林德利或泊松 - 林德利分布生成随机变量的功能。Ghitany等。[4.]提出从随机变量生成的电源楣(PL)分布 提高到权力 ;也就是说,如果 然后 参数有PL分布吗 ,密度函数给出 我们通过写作表示这一点 。半正态分布适用于拟合阳性数据。我们说一个随机变量 按照比例参数进行半正常分布 如果它的密度函数由 在哪里 表示标准正态分布的密度函数;我们通过写作表示这一点

Olmos等人。[5.[介绍适用于拟合斜线半正态分布的正数据的新分布,该分布是具有比HN分布重的右尾的分布。当形状参数时,它是特定的情况 倾向于无限。我们说一个随机变量 遵循带有刻度参数的斜线半正态分布 和久星病程参数 如果它的密度函数由 我们通过写作表示这一点

在用重尾部的对称分布研究,Reyes等。[6.]介绍一类标准斜杠分布的修改,该分布将被称为修改斜杠(MS)分布,并被描述如下:我们会这么说 有MS分布和参数吗 如果它可以表示为 在哪里 为了 。这里 是独立的随机变量吗 ;的密度函数 尾部比标准斜线分布较重,结果具有较高的峰氏症。什么时候 我们获得标准的正态分布。变量的密度函数 是(谁)给的 在哪里 是kurtosis参数;请参阅Reyes等。[6.] 更多细节。使用相同的想法,Reyes等。[7.扩展了斜正态模型,Reyes等[8.延长Birnbaum-Saunders模型。GUI [9.]介绍斜线林德利(SL)分布,并将其应用于沉淀和血浆铁蛋白浓度的数据。gui等人。[10.]介绍Lindley-Poisson(LP)分布并将其应用于终身数据。

本文的重点是引入称为修改斜线Lindley(MSL)分布的新分布。由于其混合方法,新建的分布将具有比其父母林德利分布更重的尾部,因此将更适合于建模可能具有重型尾部和/或异常值的正数据集。这种新的分布非常适合使用非常不典型的观察(异常值)建模正数据;正如我们在应用程序中所看到的,MSL分布更好地模拟患有非典型缓解时间的生存癌患者的数据。

本文的结构如下。部分2致力于开发MSL分布的随机表示及其对密度函数衍生的用途以及其时刻,不对称和峰氏菌系数的推导。在部分3.,使用时刻估计器和最大似然估计来讨论推断的MSL分布。我们还介绍了一个关于生存时间的真实数据的说明性示例。此示例显示所提出的分发是此数据集的非常适当的模型。

2. MSL分发

在本节中,我们考虑随机表示,密度函数(具有一些图形表示)和修改的斜杠林德利分发的属性。

2.1。随机代表

给出了新分布的随机表示为 在哪里 是独立的随机变量 。我们称之为分配 MSL分布,我们使用符号

2.2。密度函数

以下结果表明,可以使用随机表示生成随机变量MSL的密度函数(8.)。

命题1。 。然后,密度函数 是(谁)给的

证明。使用随机表示(8.)从雅各比转换方法中,它如此 因此, 通过边缘化,结果马上就会出现。

以下命题表明,MSL分布是由LI分布的混合在比例参数上的混合物产生 和形状参数 ,参数为2的指数分布。

命题2。 ;然后

证明。我们可以写

在图中1,我们说明了MSL分布的密度函数的行为。

2.3。时刻

命题3。如果 , 这 th的时刻 是(谁)给的

证明。从所提供的随机代表(8.),其中 是独立随机变量吗 这两个期望都是已知的。

备注4。在图中1观察到参数 小于1时,为单峰分布;参见图1(a)

推论5。 。然后它遵循

证明。这是一个主张的直接后果3.

推论6。 。然后偏斜系数是 峰度系数是 在哪里 , 和

证明。结果是通过使用以下偏光和峰氏菌分系数获得的

在图中2,我们说明了MSL分布的不对称和Kurtosis的行为

备注7。可以看出,对于参数的小值 不对称和Kurtosis系数高。此外,对于参数的高值 非对称系数和峰度系数趋向于非对称系数 分配。

3.推理

在本节中,我们使用最大可能性和矩形方法研究新模型的参数估计。

3.1。时刻估计方法

是一个随机的样本 具有密度函数的分布(9.)。然后使用(15.) 和 (16.)更换 经过 经过 我们有以下系统: 用适当的数值方法求解了该方程组 。因此,我们获得了瞬间估算者

在下列主题中,提出了这些估算者的渐近融合。

命题8。 是一个随机的样本 分配。让 表示 。如果 我们有相应的矩估计吗 在哪里 在哪里 , 和 是digamma的功能和 , 和

证明。它直接通过使用标准的大型样本理论结果,适用于时刻估算器,如例如森和歌手在森和歌手中所讨论的[11.]。

3.2。最大可能性估计

我们现在将讨论最大的似然估计。给定随机样品 从分布来看 ,可以写入日志似然函数 在哪里 因此,最大似然方程由 表达的地方 应给予 在哪里

解决方案(26.)可以使用诸如Newton-Raphson程序的数值程序获得。

3.2.1。仿真研究

通过使用Ghitany等人考虑的代表。[2]要生成随机变量的随机数 以及(8.),可以为此产生随机数 分布,导致以下算法:(1)模拟 (2)模拟 (3)模拟 (4)计算 (5)模拟 (6)计算

然后跟着

表格1示出了仿真研究结果,示出了从分配的人口的大小50,100,150和200的尺寸为50,100,150和200的1000个产生的样本的行为的结果 。对于生成的每个样本,使用牛顿Raphson程序数值计算MLES。报告了手段和标准偏差(SD)。观察到偏差变小作为样本大小 随着人们的期望,增加。


(SD) (SD) (SD) (SD) (SD) (SD) (SD) (SD)

1.0 1.0 0.9851(0.2747) 1.1886(0.1853) 1.1223(0.2278) 0.9640(0.0898) 1.0552(0.1605) 1.0387(0.0808) 0.9750(0.1027) 1.0379(0.0774)
2.0 1.0954(0.2110) 2.2455(0.7985) 0.9489 (0.1667) 2.1419(0.5861) 1.0248(0.1516) 2.0774 (0.4849) 1.0227(0.1460) 1.8972 (0.3098)
3.0 1.0226(0.1422) 3.1068(0.6515) 1.0112(0.1059) 3.0265(0.6214) 1.0258(0.0926) 3.0183(0.6211) 0.9985(0.0860) 2.9957 (0.6083)
2.0 1.0 1.9635(0.4886) 1.0926 (0.1390) 2.0276 (0.1597) 0.9809(0.1084) 2.0243 (0.1293) 1.0164(0.0456) 1.9755(0.0347) 0.9842(0.0110)
2.0 1.9682 (0.5096) 2.1367 (0.7198) 2.0142(0.2867) 2.1358(0.6465) 2.0142(0.2867) 2.1358(0.2661) 2.0301 (0.2264) 1.9619(0.1602)
3.0 1.9751(0.2893) 2.9374 (0.8254) 2.0568(0.1853) 3.1459(0.6483) 2.0381(0.1450) 3.1482(0.5828) 2.0167(0.1401) 3.1034(0.5469)
3.0 1.0 3.1778(0.9120) 0.9904(0.2537) 2.9683(0.4836) 1.0102 (0.0915) 3.0395(0.2637) 1.0109 (0.0865) 2.9991(0.1343) 0.9842 (0.0554)
2.0 2.9809(0.9879) 2.1940(0.6991) 2.9259(0.5831) 2.1793(0.5714) 2.9457(0.5517) 2.1249(0.5237) 3.0159(0.3946) 2.1202(0.4817)
3.0 2.9091 (0.5866) 3.1248 (0.7443) 3.0304 (0.5791) 2.9697(0.7089) 3.0304 (0.5791) 2.9697(0.7089) 2.9849(0.2684) 3.0498 (0.6866)
4.0 1.0 4.0870(0.9069) 1.0462 (0.1096) 3.8912(0.6294) 0.9819(0.0913) 4.0325 (0.5819) 0.9854 (0.0862) 3.9763(0.5440) 1.0341(0.0645)
2.0 4.5154 (0.5064) 1.9870(0.2169) 3.9653 (0.4912) 2.0438(0.1484) 3.9788 (0.2978) 2.0708 (0.1426) 3.9912(0.0041) 2.0024(0.1401)
3.0 4.1487 (0.8627) 3.2438 (0.7974) 4.0190(0.4633) 3.1469 (0.4665) 4.0825(0.3607) 3.1308(0.3849) 4.0508(0.2894) 3.0714(0.2110)

3.3。具有真实数据集的说明性示例

在此考虑在李和王报告的128例膀胱癌患者的随机样品中的缓解时间(以月)的缓解时间(月)的数据集[12.]。数据如下:0.08,2.09,3.48,4.87,6.94,8.66,13.11,23.63,0.20,2.23,3.52,4.98,6.97,9.02,13.98,0.40,2.26,3.57,5.06,7.09,9.22,13.80,25.74,0.50,2.46,3.64,5.09,7.26,9.47,14.24,25.82,0.51,2.54,37.7.17,7.28,9.74,14.76,27.31,0.81,2.62,3.82,5.32,7.32,10.06,14.77,32.15,2.64,3.88,5.32,7.39,10.34,14.83,34.26,0.90,2.69,4.18,5.34,7.59,1.66,15.96,36.66,1.05,2.69,4.23,5.41,7.62,10.75,16.62,43.01,1.19,2.75,4.26,5.41,7.63,17.12,46.12,1.26,2.83,4.3,5.49,7.66,11.25,17.14,79.05,175,2.87,5.62,7.87,11.64,17.36,1.40,3.02,4.34,5.71,7.93,11.79,18.10,1.46,4.45,5.85,8.26,11.98,19.13,1.76,3.25,4.55,6.25,8.37,12.02,2.02,3.31,4.51,6.54,8.53,12.03,20.28,2.02,3.36,6.76,12.07,21.73,2.07,3.36,6.93,8.65,12.63,22.69。对于此数据集,我们为MSL模型提供了基本的描述性统计和最大似然参数估计值;看表23.。我们将这些结果与SL,SHN,LP和PL模型的比较,表示括号中的相应标准错误。


不对称 久星病



模型 ML估计 AIC. BIC.

= 0.374(0.020), = 2.803(0.032) 823.835 829.559.
= 0.194 (0.169), = 0.535(0.534), = 2.100(0.512) 825.445 834.002
= 6.178(0.863), = 2.038(0.447) 826.287 831.991
= 3.174(0.997), = 0.113 (0.020) 826.769 832.423
= 0.830 (0.047), = 0.294(0.037) 830.708 836.411

使用Section中的结果3.1,瞬间估算器被计算导致以下值(括号中的标准错误): = 0.446 (0.063) = 2.024(0.007);这些被用作最大可能性方法的初始估计。

我们计算了akaike信息标准aiC(见Akaike [13.)和贝叶斯信息准则BIC(参见Schwarz [14.])。这些标准揭示了MSL模型呈现了所研究的数据集的最佳拟合。

图的左侧3.显示这些数据的Boxplot。QQ图表的QQ图表,用于缓解时间数据,该数据与MSL模型配有参数的最大似然估计值;这些如图所示3.与SL,SHN,LP和PL模型相比。数字4.显示经验C.D.F.与c.d.f.由MSL,SL,SHN,LP和PL估计;这些还显示了用于缓解时间数据集的MSL模型的良好一致性。

4.讨论

我们引入了一个新的发行版,基于 分布,称为修改斜线林德利分发。它被生成为两个独立随机变量的商,一个是林德利分发和指数分布的另一个力量。林德利分销是一个特殊的案例。计算瞬间估计器,可用于使用Newton-Raphson初始化最大似然估计。通过计算不对称和Kurtosis系数,我们示出了MSL能够容纳具有更高峰度的数据。我们展示了一个图示,实际数据集,我们认为MSL分布提供比SL,SHN,LP和PL分布更好地适合数据。

信息披露

该手稿的初步结果在2016年“第二十六届COMCA大会Matemática Capricornio”会议记录中作为摘要发表。

相互竞争的利益

作者声明本文的发表不存在利益冲突。

致谢

J. Reyes和H.W.Gómez的研究得到了Semillero UA-2016(智利)的支持。

参考文献

  1. D. V.林德利,“基准分布和贝叶斯定理”,皇家统计学会杂志。系列b方法,卷。20,pp。102-107,1958。查看在:谷歌学术|Zentralblatt Math.|Mathscinet.
  2. M. E.Ghitany,B. Atieh和S. Nadarajah,“林德利分销及其应用”,数学和计算机在模拟中第78期4,第493-506页,2008。查看在:出版商网站|谷歌学术|Mathscinet.
  3. P. Jodrá,“通过Lambert利用林德利分布或泊松-林德利分布的计算机生成随机变量W.功能”,数学和计算机在模拟中,卷。81,没有。4,pp。851-859,2010。查看在:出版商网站|谷歌学术|Mathscinet.
  4. M. E. Ghitany, D. K. Al-Mutairi, N. Balakrishnan, and L. J. Al-Enezi, " Power Lindley distribution and associated inference, "计算统计和数据分析, vol. 64, pp. 20-33, 2013。查看在:出版商网站|谷歌学术
  5. N. M. Olmos, H. Varela, H. W. Gómez,和H. Bolfarine,“半正态分布的扩展”,统计论文,卷。53,不。4,pp。875-886,2012。查看在:出版商网站|谷歌学术|Mathscinet.
  6. J. Reyes,H.W.Gómez和H.Bolarine,“改进的斜杠分布”,统计数据,卷。47,没有。5,pp。929-941,2013。查看在:出版商网站|谷歌学术|Mathscinet.
  7. J. Reyes,H.W.Gómez,I.Vidal,“修改了歪斜斜线分布”,统计中的通信。理论与方法第45卷第5期4, pp. 1070-1080, 2016。查看在:出版商网站|谷歌学术|Mathscinet.
  8. J. Reyes, F. Vilca, D. I. Gallardo, H. W. Gomez,《修正的Birnbaum-Saunders分配》,数学与统计杂志,卷。46,没有。112,pp。2016年1-1。查看在:出版商网站|谷歌学术
  9. W.GUI,“林德利斜线分布的统计性质和应用”,应用统计科学学报,卷。20,没有。3,pp。283-298,2012。查看在:谷歌学术|Mathscinet.
  10. W. GUI,S. Zhang和X. Lu,“Lindled-Poisson分布在终身分析及其性质”中,“数学与统计杂志,卷。43,不。6,pp。1063-1077,2014。查看在:出版商网站|谷歌学术|Zentralblatt Math.|Mathscinet.
  11. P. K. SEN和J. M. SINGER,统计学中的大样本方法,查普曼和霍尔,纽约,纽约,美国,1993。查看在:出版商网站
  12. 李e.t.和王j.w.,生存资料分析的统计方法,Wiley系列在概率和统计中,Wiley-Interscience [John Wiley&Sons],Hoboken,NJ,美国,2003年第3版。查看在:出版商网站|Mathscinet.
  13. H. Akaike,“统计模型识别的新观点”,IEEE自动控制交易第19卷第2期6,第716-723页,1974。查看在:谷歌学术|Mathscinet.
  14. G. Schwarz,“估计模型的维度”,统计史,卷。6,不。2,pp。461-464,1978。查看在:出版商网站|谷歌学术

版权所有©2017 Jimmy Reyes等。这是分布下的开放式访问文章创意公共归因许可证如果正确引用了原始工作,则允许在任何媒体中的不受限制使用,分发和再现。


更多相关文章

PDF. 下载引用 引文
下载其他格式更多的
订单印刷副本订单
意见1265.
下载710.
引用

相关文章

年度文章奖:由主编评选的2020年杰出研究贡献。阅读获奖物品