文摘
提出了一种包含重尾分布时距家族的成员,被称为“新exponential-X家庭的分布。“作为一个特例,本文研究提出的子模型类命名为“新指数威布尔分布(NEx-Wei)。“一些数学性质包括风险率函数,普通的时刻,矩生成函数,和次序统计量进行了讨论。此外,我们采用的标定方法(最大似然估计)估计模型参数。短暂的蒙特卡罗模拟研究进行了评估的表演毫升基于偏见和均方误差。最后,我们提供了一个全面研究来说明介绍的方法通过分析三个真实数据集从不同的学科。分析拟合优度指标建议的分布是相对于其他知名的分布。我们希望提出的类可能会产生更多的新分布拟合单调和非数据领域的可靠性分析和生存分析。
1。介绍
在许多实际工程等领域,生物医学,和精算科学,观察自然界中通常是积极的和有一个单峰,hump-shaped分布。在这样的场景中,极端值形成厚尾,因此,要求重尾分布模型的数据。例如,在工程、建模相关的异常现象的统计分布的反面是主要的兴趣。地震、洪水、飓风、海啸、电和断电市场风险的这种极端的例子/罕见事件(1]。保险损失,数据通常是记录在一个积极的规模,单峰,hump-shaped,积极倾斜和有一个厚尾2]。同时,在医疗服务的研究中,医疗费用,穿过一个给定的阈值(3)和呆在医院的长度通常表示高度倾斜,跟踪数据4]。
所有上述场景,它们发生的速度与分布的形状和沉重的尾巴。经典分布不适合建模这种类型的数据(5]。研究人员已经观察到使用伽马指数和威布尔模型在建模保险数据气馁,因为他们的低效率的结果。因此,它已经得出结论,最好是使用概率分布有最大的灵活性,以获得更高的精度比指数分布[建模重尾分布的数据6]。为此,努力在引入新“重尾分布”;参见[7- - - - - -11]。
分布,对反面的概率大于经典指数模型被称为重尾分布(12]。例如,对于一个累积分布函数, 对于任何 进一步的细节给出了(13,14]。
在文献中提出的相关方法,文中提到的引用,可能是非常有用的在现有分布带来更大的灵活性。然而,他们缺乏灵活性的推理和计算得出其分布特性(8]。另一个突出的方法涉及到两个或两个以上的组成分布基于预定义的权重,使一种改进的适合重尾分布的损失(15- - - - - -18]。因此,重要的模型引入一个新类可以从现有的经典分布或分布的新家庭模式重尾分布数据从各个领域的生活。
出于这些问题,本文提出了一种新颖的形式给出的重尾分布的家庭使用时距技术没有添加额外的参数。建议的方法,称为“分布”的新exponential-X家庭提供一个可靠的适合保险数据。
本文的其余部分安排如下:部分2讨论了该方法的基础上,时距家庭;看到Alzaatreh et al。19]。部分3提出了一种新的指数威布尔分布(NEx-Wei)。提出了家庭的一些基本的数学性质研究部分4。基于最大似然估计方法的参数估计中所描述的部分5。在同一节中,Mote卡洛模拟研究也在进行。应用建议的家庭从车辆保险损失的分布数据,工程和医学部分中所示6。最后,部分7给工作的结论的基础上,提出分布。
2。该方法
在本节中,我们引入一个新的改性方法来获得一个新的寿命分布。介绍了该方法通过结合指数模型在PDF(概率密度函数) 提出的与时距家族Alzaatreh et al。19]。
考虑一个随机变量T随机变量,是一个基线与PDF ,在哪里 为 。让X是一个随机变量与提供(累积分布函数) 根据参数向量 。让 被提供的函数y,满足以下三个条件。(我) ,(2) 可微的单调递增,(3) 作为 和 作为 。
根据Alzaatreh et al。19]定义的CDF实验组的时距家族的方法 在哪里 满足某些条件(》)。时距分布的PDF,对应方程(1),是由
通过使用时距的分布,提出了一些新颖的分布类的文学作品。表1提供了一些 表达式的一些广泛使用的时距家族的成员。
现在,通过使用 和设置 在方程(2),我们得到了CDF新Exponential-X家庭,由 在哪里 的提供基线分布可能取决于哪一个 。PDF NEx-X家族的相关方程(4)是 在哪里 。
同样,高频(风险函数)和科幻小说(生存函数)的NEx-X家庭提供(6)和(7),分别。
的关键动机NEx-X家庭方法如下:(我)一个相对简单的方法扩展可用的分布。(2)进一步提高现有分布的功能。(3)定义一个特殊的子模型进行封闭运作,科幻,高频。(iv)提供更适合重尾分布数据。
此外,最重要的动机是,该方法引入了新的发行版没有插入额外的参数,因此避免了重新调节的困难。
3所示。特殊的子模型,提出新颖的家庭
在这部分的文章中,一个特殊的子模型的基础上,提出家庭称为NEx-Wei分布介绍。让 和 的相应的运作和PDF的威布尔分布 , 和 ,在哪里 。然后NEx-Wei模型定义的运作
表达式PDF,科幻(生存函数),函数高频(故障率函数)给出了方程(8)- (10),分别。
不同形状的 NEx-Wei分布的各种参数值画在图1。
图2图形化显示 NEx-Wei模型的模型参数的不同组合。从图2,我们可以看到 NEx-Wei分布有6个不同的模式包括(i)增加,(2)减少,(3)reverse-J形状,(iv)单峰,(vi)略浴缸的形状。因此,该模型能够和成为一个重要的模型,以适应几个生命周期数据在应用领域,特别是在可靠性工程、生物医学、经济学、和财务分析。
4所示。基本的数学性质
该部分提出了一些数学NEx-X家族的属性,如分位数函数和普通的时刻,它可以进一步被用来获得模型的一些重要特征。除了这些属性,生成函数也是派生。
4.1。分位数函数
分位数函数(QF),也称为逆分布函数(IDF),是一个重要的统计术语用于生成随机数(RNs)的方法。这些RNs可以用于模拟估计的性能进行评估。在节4IDF方法已实现从NEx-Wei生成RNs模型。对于该模型,QF给出 在哪里方程解吗 和u区间上的均匀分布(0,1),表达式可以用于从任何子用例生成RNs NEx-X家庭的分布。
4.2。rth时刻
的rth时刻是一个重要的和有用的圣(统计工具)来获取模型的某些特征和特性。这些特征被称为(我)集中趋势:处理均值点的分布,(ii)色散:衡量一个模型的方差(iii)偏态:它描述的尾巴行为模型,和(四)峰度:有助于研究分布的尖峰。提出NEx-X家族的rth表达的时刻是派生
由(5),我们有
利用级数展开
当更换通过 在(15),我们得到
同时,利用泰勒级数表示
通过替换通过 在(17),我们得到
此外,结合二项展开式
当更换通过 和通过 ,分别在(20.),我们到达
此外,一个简单的通用表达式MGF (NEx-X随机变量的矩生成函数) ,说 ,是由
通过使用(23)和(24),我们得到的MGF NEx-X分布的家庭。
4.3。次序统计量
在分布理论中,OS(顺序统计量)非常重要。他们出现在可靠性分析、估计理论的问题,在很多方面和生活测试。他们可以描述元素或组件的寿命可靠性的系统。
让 是一个随机的样本问选择从NEx-X CDF实验组和PDF的(5)和(6),分别。的密度函数是由
我们表达了1年代t顺序统计量为 和问th顺序统计量为 然后, 为 我们可以利用二项式的扩张如下:
使用方程(5)和(6在方程(),27),我们获得的DF(密度函数) 。
4.4。剩余剩余寿命和反向
NEx-X RL(剩余寿命)的随机变量X所表达的, ,是派生
除了RL,我们获得RRL NEx-X分布的剩余寿命(反向)用 。NEx-X分布的是派生
5。估计和仿真
本节分为两个部分。第一小节提供了一个详细描述实现的最大似然估计估计参数 NEx-Wei模型的,而第二个小节提供了一个全面的蒙特卡罗模拟研究评估毫升的该方法的性能。
5.1。最大似然估计
几种方法估算的参数分布在文献中介绍了。初速(最大似然估计)是最常用的方法之一。这种方法提供了估计具有几个重要的特性,可用于建设的置信区间以及其他测试检查统计显著性。关于毫升的详情,请参见[30.]。本节提供了一个讨论的ml估计方法NEx-Wei分布的模型参数。
假设 pdf给定的观测值在方程(9),和作为相关的参数。相应的方程(9),对数似函数
衍生品的方程(30.)对所需的参数和设置它等于零
5.2。模拟
毫升的行为提出的参数分布的评估基于模拟数据在这一节中。三套NEx-Wei模型的参数在仿真评估。过程描述如下:(我)与N= 750,样本的大小n= 25、50、100…750生成从NEx-Wei分布参数和 。(2)计算毫升的 。(3)计算偏差和均方误差(MSE)所需的模型参数是通过 (iv)重复步骤(3) 。
仿真结果对估计参数的家中小企业和偏差值表中提供2并以图形方式显示在数字3- - - - - -5。从仿真结果表2,我们得出这样的结论:所有参数的偏差是积极和估计的偏差,为了减少随着样本容量的增加。
6。应用程序
本节评估的适用性NEx-Wei模型在应用领域,包括金融、工程和医学科学。在所有这些领域,适合NEx-Wei模型的比较与其他熟悉的分布。
检查的分布,我们考虑不同的适合措施为了检查竞争对手提供了最适合的数据集。拟合优度的措施包括厘米(Cramer-von-Misses)测试统计,广告(Anderson-Darling)检验统计量,KS (Kolmogorov-Smirnov)另类投资会议(Akaike信息标准)、BIC(贝叶斯信息准则),纠正Akaike信息准则(CAIC)和HQIC (Hannan-Quinn信息标准)P值。
一般来说,一个分布为这些分析措施和较小的值更大p价值可以被视为适合底层数据集。基于分析措施,结果表明,NEx-Wei分布产生更大的分配的灵活性在所有其他应用分布。
6.1。应用在车辆保险损失数据
第一个案例是保险,车辆保险损失被认为是。数据从网站:http://www.businessandeconomics.mq.edu.au/our-depatments-/Apllied-Finance-and-Acturial-Studies/research/books/GLMs-for-insurance-Data。一些基本措施,给出了数据集的最小= 1.0,1日四分位数= 23.25,中值= 41.60,= 55.89,第三四分位数= 73.20,最大= 194.00,偏态= 1.253132,峰度= 4.08863,方差= 2334.975,= 193.00。
相应的数据集,NEx-Wei分布的比较与其他著名的分布是由包括APT-Wei(α力量改变了威布尔)31日],脱胶[32),凯文分布,Burr-XII (B-XII)分布33],MO-Wei分布[34],Kumaraswamy威布尔(Ku-Wei)分布35]。考虑这些分布进行比较的原因是他们经常应用在金融和金融风险管理建模问题。
此外,分析数据,并给出了拟合模型的最大似然估计表3。分析措施的数值拟合模型中提供的表4和5。对于这些数据,分析测量值NEx-Wei AIC = 325.3758, BIC = 328.3072, CAIC = 325.7896, HQIC = 0.03211 = 326.3475厘米,广告= 0.1968,KS = 0.0827,p值= 0.968。
基于这些分析方法,该模型更适合比其他竞争模型来考虑数据。在表中的数值例证的支持4和5,估计PDF和CDF块NEx-Wei分布呈现在图6。此外,人民党情节和kaplan meier生存情节呈现在图7,而图8显示框和QQ的情节。显然,这些情节揭示NEx-Wei更适合的模型。
6.2。在可靠性工程中的应用
第二个案例研究从可靠性工程关于切削层的失效时间机器(36]。数据集的基本措施是由最低= 1.0,1日四分位数= 20.75,中值= 43.75,= 124.10,第三四分位数= 143.50,最大= 970.50,偏态= 2.917965,峰度= 11.85639,方差= 41601.74,= 969.5。
的性能评估模型通过比较它与其他著名的模型如Kumaraswamy威布尔(Ku-Wei) [35),两个参数的威布尔,延长α能力威布尔(EAP-Wei) [37),β威布尔(B-Wei) [38),而新的阿尔法力量威布尔(NAP-Wei) [39)模型。此外,Ku-Wei、EAP-Wei NAP-Wei模型在文献中广泛应用的建模故障时间数据。
对应于第二个数据集,提出了ml的参数的值在表6,而提议和其他竞争力模型的分析结果被发表在表7和8。对于这些数据,分析措施NEx-Wei模型AIC值= 331.8761,BIC = 334.6107, CAIC = 332.3376, HQIC = 332.7325,厘米= 0.07430,广告= 0.40100,KS = 0.13626,p值= 0.6545。
图9给出了相应的估计PDF和CDF的情节。此外,图10让人民党和kaplan meier生存的阴谋,而图11显示框和QQ的情节。结果显示,由于积极倾斜的数据(见箱线图),新提出的模型与数据的吻合程度优于其他方法。
6.3。应用在生物医学科学数据
第三个案例研究从生物医学科学,数据集包含44观察报告(40]。这个数据集表示一组患者的生存时间从头部和颈部癌症。头部和颈部癌症的一些基本措施给出的数据最小= 12.20,1日四分位数= 67.21,= 223.50,中值= 128.50,第三四分位数= 219.00,最大= 1776.00,方差= 93287.41,= 12.20,偏态= 3.38382,峰度= 16.5596。
对应于第三个数据集,我们应用NEx-Wei模型与其他几个竞争模型,即两个参数的经典威布尔,FRL-Wei [41],APT-Wei [31日],MO-Wei [34)分布。
此外,数据集,毫升的数值NEx-Wei分布和其他竞争模型参数表9。分析措施的数值拟合模型的表10和11。数据集,分析措施的NEx-Wei AIC值= 565.1568,BIC = 568.7252, CAIC = 565.4495, HQIC = 566.4801,厘米= 0.08657,广告= 0.51532,KS = 0.1006,p值= 0.7278。
在表中的数值例证的支持10和11,估计PDF和CDF块NEx-Wei分布呈现在图12。此外,人民党情节和kaplan meier生存情节呈现在图13,而图14显示框和QQ的情节。结果显示,由于积极倾斜的数据(见箱线图),密切关注,新提出的模型与数据的吻合程度。
7所示。结论
本文提出了一个新的家庭的概念分布,称为新exponential-X家庭或NEx-X。这个家庭的分布范围广泛的应用程序没有额外的参数添加到现有分布。该方法的一个特殊的子模型称为NEx-Wei(新指数威布尔)详细推导和研究。除此之外,一般表达式的不同统计特性提出家庭已经推导出包括分位数函数,时刻,时刻生成函数,次序统计量。大中型企业(最大似然估计)方法被用于估计未知参数,此外,蒙特卡罗模拟研究进行了评估该模型估计的性能。可靠性工程领域的、保险和医药,我们分析了三个数据集,提出了类提供了一个非常适合所有数据集。我们希望这本小说改善的理论分布会在可靠性工程中的应用更有吸引力,医疗和其他相关领域。
数据可用性
数据集的引用在本文给出。
的利益冲突
作者宣称没有利益冲突。