修改Slash Lindley分布

摘要

在本文中，我们介绍了一种新的分布，称为改进的斜杠林德利分布，可以被视为林德利分布的延伸。我们表明，这一新的分布在山牙病和偏斜方面提供了比林德利分布更具灵活性。我们派生了新分布的时刻和一些基本属性。时刻估计和最大似然估计使用数值程序计算。我们对最大可能性估算器进行了模拟研究。与其他较小型号相比，建议模型的适合表示良好的性能。

1.介绍

林德利分布是由林德利提出的[1]具有所提供的密度函数我们通过写作表示这一点,在那里是形状参数。相应的累积分布函数（C.D.F.）是 Ghitany等人详细研究了Lindley分布的性质[2]。Jodrá[3.]使用兰伯特用林德利或泊松 - 林德利分布生成随机变量的功能。Ghitany等。[4.]提出从随机变量生成的电源楣（PL）分布提高到权力；也就是说,如果然后参数有PL分布吗和，密度函数给出我们通过写作表示这一点。半正态分布适用于拟合阳性数据。我们说一个随机变量按照比例参数进行半正常分布如果它的密度函数由在哪里表示标准正态分布的密度函数;我们通过写作表示这一点。

Olmos等人。[5.[介绍适用于拟合斜线半正态分布的正数据的新分布，该分布是具有比HN分布重的右尾的分布。当形状参数时，它是特定的情况倾向于无限。我们说一个随机变量遵循带有刻度参数的斜线半正态分布和久星病程参数如果它的密度函数由我们通过写作表示这一点。

在用重尾部的对称分布研究，Reyes等。[6.]介绍一类标准斜杠分布的修改，该分布将被称为修改斜杠（MS）分布，并被描述如下：我们会这么说有MS分布和参数吗如果它可以表示为在哪里和为了。这里和是独立的随机变量吗；的密度函数尾部比标准斜线分布较重，结果具有较高的峰氏症。什么时候我们获得标准的正态分布。变量的密度函数是（谁）给的在哪里是kurtosis参数;请参阅Reyes等。[6.] 更多细节。使用相同的想法，Reyes等。[7.扩展了斜正态模型，Reyes等[8.延长Birnbaum-Saunders模型。GUI [9.]介绍斜线林德利（SL）分布，并将其应用于沉淀和血浆铁蛋白浓度的数据。gui等人。[10.]介绍Lindley-Poisson（LP）分布并将其应用于终身数据。

本文的重点是引入称为修改斜线Lindley（MSL）分布的新分布。由于其混合方法，新建的分布将具有比其父母林德利分布更重的尾部，因此将更适合于建模可能具有重型尾部和/或异常值的正数据集。这种新的分布非常适合使用非常不典型的观察（异常值）建模正数据;正如我们在应用程序中所看到的，MSL分布更好地模拟患有非典型缓解时间的生存癌患者的数据。

本文的结构如下。部分2致力于开发MSL分布的随机表示及其对密度函数衍生的用途以及其时刻，不对称和峰氏菌系数的推导。在部分3.，使用时刻估计器和最大似然估计来讨论推断的MSL分布。我们还介绍了一个关于生存时间的真实数据的说明性示例。此示例显示所提出的分发是此数据集的非常适当的模型。

2. MSL分发

在本节中，我们考虑随机表示，密度函数（具有一些图形表示）和修改的斜杠林德利分发的属性。

2.1。随机代表

给出了新分布的随机表示为在哪里和是独立的随机变量那。我们称之为分配MSL分布，我们使用符号。

2.2。密度函数

以下结果表明，可以使用随机表示生成随机变量MSL的密度函数（8.）。

命题1。让。然后，密度函数是（谁）给的和和。

证明。使用随机表示（8.）从雅各比转换方法中，它如此因此, 通过边缘化，结果马上就会出现。

以下命题表明，MSL分布是由LI分布的混合在比例参数上的混合物产生和形状参数，参数为2的指数分布。

命题2。让和；然后。

证明。我们可以写

在图中1，我们说明了MSL分布的密度函数的行为。

（一种）

（b）

2.3。时刻

命题3。如果，这th的时刻是（谁）给的

证明。从所提供的随机代表（8.），其中和是独立随机变量吗这两个期望都是已知的。

备注4。在图中1观察到参数小于1时，为单峰分布;参见图1（a）。

推论5。让。然后它遵循

证明。这是一个主张的直接后果3.。

推论6。让。然后偏斜系数是峰度系数是在哪里，和。

证明。结果是通过使用以下偏光和峰氏菌分系数获得的

在图中2，我们说明了MSL分布的不对称和Kurtosis的行为和。

（一种）

（b）

备注7。可以看出，对于参数的小值不对称和Kurtosis系数高。此外，对于参数的高值非对称系数和峰度系数趋向于非对称系数分配。

3.推理

在本节中，我们使用最大可能性和矩形方法研究新模型的参数估计。

3.1。时刻估计方法

让是一个随机的样本具有密度函数的分布（9.）。然后使用（15.）和（16.）更换经过和经过我们有以下系统：用适当的数值方法求解了该方程组和。因此，我们获得了瞬间估算者的。

在下列主题中，提出了这些估算者的渐近融合。

命题8。让是一个随机的样本分配。让和表示。如果和我们有相应的矩估计吗在哪里在哪里那，和是digamma的功能和，和。

证明。它直接通过使用标准的大型样本理论结果，适用于时刻估算器，如例如森和歌手在森和歌手中所讨论的[11.]。

3.2。最大可能性估计

我们现在将讨论最大的似然估计。给定随机样品从分布来看，可以写入日志似然函数在哪里因此，最大似然方程由表达的地方和应给予在哪里。

解决方案（26.）可以使用诸如Newton-Raphson程序的数值程序获得。

3.2.1。仿真研究

通过使用Ghitany等人考虑的代表。[2]要生成随机变量的随机数以及(8.），可以为此产生随机数分布，导致以下算法：（1）模拟。（2）模拟。（3）模拟。（4）计算。（5）模拟。（6）计算。

然后跟着。

表格1示出了仿真研究结果，示出了从分配的人口的大小50,100,150和200的尺寸为50,100,150和200的1000个产生的样本的行为的结果。对于生成的每个样本，使用牛顿Raphson程序数值计算MLES。报告了手段和标准偏差（SD）。观察到偏差变小作为样本大小随着人们的期望，增加。



		（SD）	（SD）	（SD）	（SD）	（SD）	（SD）	（SD）	（SD）

1.0	1.0	0.9851（0.2747）	1.1886（0.1853）	1.1223（0.2278）	0.9640（0.0898）	1.0552（0.1605）	1.0387（0.0808）	0.9750（0.1027）	1.0379（0.0774）
	2.0	1.0954（0.2110）	2.2455（0.7985）	0.9489 (0.1667)	2.1419（0.5861）	1.0248（0.1516）	2.0774 (0.4849)	1.0227（0.1460）	1.8972 (0.3098)
	3.0	1.0226（0.1422）	3.1068（0.6515）	1.0112（0.1059）	3.0265（0.6214）	1.0258（0.0926）	3.0183（0.6211）	0.9985（0.0860）	2.9957 (0.6083)
2.0	1.0	1.9635（0.4886）	1.0926 (0.1390)	2.0276 (0.1597)	0.9809（0.1084）	2.0243 (0.1293)	1.0164（0.0456）	1.9755（0.0347）	0.9842（0.0110）
	2.0	1.9682 (0.5096)	2.1367 (0.7198)	2.0142（0.2867）	2.1358（0.6465）	2.0142（0.2867）	2.1358（0.2661）	2.0301 (0.2264)	1.9619（0.1602）
	3.0	1.9751（0.2893）	2.9374 (0.8254)	2.0568（0.1853）	3.1459（0.6483）	2.0381（0.1450）	3.1482（0.5828）	2.0167（0.1401）	3.1034（0.5469）
3.0	1.0	3.1778（0.9120）	0.9904（0.2537）	2.9683（0.4836）	1.0102 (0.0915)	3.0395（0.2637）	1.0109 (0.0865)	2.9991（0.1343）	0.9842 (0.0554)
	2.0	2.9809（0.9879）	2.1940（0.6991）	2.9259（0.5831）	2.1793（0.5714）	2.9457（0.5517）	2.1249（0.5237）	3.0159（0.3946）	2.1202（0.4817）
	3.0	2.9091 (0.5866)	3.1248 (0.7443)	3.0304 (0.5791)	2.9697（0.7089）	3.0304 (0.5791)	2.9697（0.7089）	2.9849（0.2684）	3.0498 (0.6866)
4.0	1.0	4.0870（0.9069）	1.0462 (0.1096)	3.8912（0.6294）	0.9819（0.0913）	4.0325 (0.5819)	0.9854 (0.0862)	3.9763（0.5440）	1.0341（0.0645）
	2.0	4.5154 (0.5064)	1.9870（0.2169）	3.9653 (0.4912)	2.0438（0.1484）	3.9788 (0.2978)	2.0708 (0.1426)	3.9912（0.0041）	2.0024（0.1401）
	3.0	4.1487 (0.8627)	3.2438 (0.7974)	4.0190（0.4633）	3.1469 (0.4665)	4.0825（0.3607）	3.1308（0.3849）	4.0508（0.2894）	3.0714（0.2110）

3.3。具有真实数据集的说明性示例

在此考虑在李和王报告的128例膀胱癌患者的随机样品中的缓解时间（以月）的缓解时间（月）的数据集[12.]。数据如下：0.08,2.09,3.48,4.87,6.94,8.66,13.11,23.63,0.20,2.23,3.52,4.98,6.97,9.02,13.98,0.40,2.26,3.57,5.06,7.09,9.22,13.80，25.74,0.50,2.46,3.64,5.09,7.26,9.47,14.24,25.82,0.51,2.54,37.7.17,7.28,9.74,14.76,27.31,0.81,2.62,3.82,5.32,7.32,10.06,14.77,32.15，2.64,3.88,5.32,7.39,10.34,14.83,34.26,0.90,2.69,4.18,5.34,7.59,1.66,15.96,36.66,1.05,2.69,4.23,5.41,7.62,10.75,16.62,43.01,1.19,2.75，4.26,5.41,7.63,17.12,46.12,1.26,2.83,4.3,5.49,7.66,11.25,17.14,79.05,175,2.87,5.62,7.87,11.64,17.36,1.40,3.02,4.34,5.71,7.93,11.79，18.10,1.46,4.45,5.85,8.26,11.98,19.13,1.76,3.25,4.55,6.25,8.37,12.02,2.02,3.31,4.51,6.54,8.53,12.03,20.28,2.02,3.36,6.76,12.07,21.73，2.07,3.36,6.93,8.65,12.63,22.69。对于此数据集，我们为MSL模型提供了基本的描述性统计和最大似然参数估计值;看表2和3.。我们将这些结果与SL，SHN，LP和PL模型的比较，表示括号中的相应标准错误。


			不对称	久星病


模型	ML估计	AIC.	BIC.

	= 0.374（0.020），= 2.803（0.032）	823.835	829.559.
	= 0.194 (0.169),= 0.535（0.534），= 2.100（0.512）	825.445	834.002
	= 6.178（0.863），= 2.038（0.447）	826.287	831.991
	= 3.174（0.997），= 0.113 (0.020)	826.769	832.423
	= 0.830 (0.047),= 0.294（0.037）	830.708	836.411

使用Section中的结果3.1，瞬间估算器被计算导致以下值（括号中的标准错误）：= 0.446 (0.063)= 2.024（0.007）;这些被用作最大可能性方法的初始估计。

我们计算了akaike信息标准aiC（见Akaike [13.)和贝叶斯信息准则BIC(参见Schwarz [14.]）。这些标准揭示了MSL模型呈现了所研究的数据集的最佳拟合。

图的左侧3.显示这些数据的Boxplot。QQ图表的QQ图表，用于缓解时间数据，该数据与MSL模型配有参数的最大似然估计值;这些如图所示3.与SL，SHN，LP和PL模型相比。数字4.显示经验C.D.F.与c.d.f.由MSL，SL，SHN，LP和PL估计;这些还显示了用于缓解时间数据集的MSL模型的良好一致性。

4.讨论

我们引入了一个新的发行版，基于分布，称为修改斜线林德利分发。它被生成为两个独立随机变量的商，一个是林德利分发和指数分布的另一个力量。林德利分销是一个特殊的案例。计算瞬间估计器，可用于使用Newton-Raphson初始化最大似然估计。通过计算不对称和Kurtosis系数，我们示出了MSL能够容纳具有更高峰度的数据。我们展示了一个图示，实际数据集，我们认为MSL分布提供比SL，SHN，LP和PL分布更好地适合数据。

信息披露

该手稿的初步结果在2016年“第二十六届COMCA大会Matemática Capricornio”会议记录中作为摘要发表。

相互竞争的利益

作者声明本文的发表不存在利益冲突。

致谢

J. Reyes和H.W.Gómez的研究得到了Semillero UA-2016（智利）的支持。

参考文献

D. V.林德利，“基准分布和贝叶斯定理”，皇家统计学会杂志。系列b方法，卷。20，pp。102-107，1958。查看在：谷歌学术|Zentralblatt Math.|Mathscinet.
M. E.Ghitany，B. Atieh和S. Nadarajah，“林德利分销及其应用”，数学和计算机在模拟中第78期4，第493-506页，2008。查看在：出版商网站|谷歌学术|Mathscinet.
P. Jodrá，“通过Lambert利用林德利分布或泊松-林德利分布的计算机生成随机变量W.功能”,数学和计算机在模拟中，卷。81，没有。4，pp。851-859,2010。查看在：出版商网站|谷歌学术|Mathscinet.
M. E. Ghitany, D. K. Al-Mutairi, N. Balakrishnan, and L. J. Al-Enezi， " Power Lindley distribution and associated inference， "计算统计和数据分析， vol. 64, pp. 20-33, 2013。查看在：出版商网站|谷歌学术
N. M. Olmos, H. Varela, H. W. Gómez，和H. Bolfarine，“半正态分布的扩展”，统计论文，卷。53，不。4，pp。875-886,2012。查看在：出版商网站|谷歌学术|Mathscinet.
J. Reyes，H.W.Gómez和H.Bolarine，“改进的斜杠分布”，统计数据，卷。47，没有。5，pp。929-941,2013。查看在：出版商网站|谷歌学术|Mathscinet.
J. Reyes，H.W.Gómez，I.Vidal，“修改了歪斜斜线分布”，统计中的通信。理论与方法第45卷第5期4, pp. 1070-1080, 2016。查看在：出版商网站|谷歌学术|Mathscinet.
J. Reyes, F. Vilca, D. I. Gallardo, H. W. Gomez，《修正的Birnbaum-Saunders分配》，数学与统计杂志，卷。46，没有。112，pp。2016年1-1。查看在：出版商网站|谷歌学术
W.GUI，“林德利斜线分布的统计性质和应用”，应用统计科学学报，卷。20，没有。3，pp。283-298,2012。查看在：谷歌学术|Mathscinet.
W. GUI，S. Zhang和X. Lu，“Lindled-Poisson分布在终身分析及其性质”中，“数学与统计杂志，卷。43，不。6，pp。1063-1077，2014。查看在：出版商网站|谷歌学术|Zentralblatt Math.|Mathscinet.
P. K. SEN和J. M. SINGER，统计学中的大样本方法，查普曼和霍尔，纽约，纽约，美国，1993。查看在：出版商网站
李e.t.和王j.w.，生存资料分析的统计方法，Wiley系列在概率和统计中，Wiley-Interscience [John Wiley＆Sons]，Hoboken，NJ，美国，2003年第3版。查看在：出版商网站|Mathscinet.
H. Akaike，“统计模型识别的新观点”，IEEE自动控制交易第19卷第2期6，第716-723页，1974。查看在：谷歌学术|Mathscinet.
G. Schwarz，“估计模型的维度”，统计史，卷。6，不。2，pp。461-464，1978。查看在：出版商网站|谷歌学术

概率与统计学报

摘要