文摘
统计分布的建模的使用真正的自然现象在文献中得到了相当大的关注。最近的研究指出潜在的统计分布在应用科学的建模数据,特别是在金融科学。其中,两个参数Lomax分布是一个著名的模型可以有效地用于建模数据在管理科学、银行、金融和保险精算科学。在本文中,我们引入一个新的参数扩展Lomax分布通过使用类的分布。新模型可以被称为Lomax-Claim分布。Lomax-Claim模型的参数估计使用最大似然估计方法。最大似然估计的行为进行了一个简短的蒙特卡罗研究。凯文的潜力和适用性要求模型说明了分析数据集来自金融科学代表车辆保险损失数据。对于这个数据集,提出了模型与凯文,凯文,转化凯文,取幂Lomax分布。显示最适合竞争的分布,我们认为某些分析工具如Anderson-Darling测试统计,Cramer-Von米塞斯检验统计量,以及Kolmogorov-Smirnov检验统计量。 Based on these analytical measures, we observed that the new model outperforms the competitive models. Furthermore, a bivariate extension of the proposed model called the Farlie–Gumble–Morgenstern bivariate Lomax-Claim distribution is also introduced, and different shapes for the density function are plotted. An application of the bivariate model to GDP and export of goods and services is provided.
1。介绍
凯文或帕累托二世(移位的帕累托)分布提出了凯文在上世纪中期业务失败的数据模型。这个模型已广泛应用在各种领域,尤其是在收入和财富不平等,大小城市,金融和保险精算科学。此外,它已被应用到模型收入和财富数据,计算机服务器上的文件的大小分布、可靠性、寿命测试和曲线分析(1]。
一个随机变量表示X遵循两个参数Lomax称分布的累积分布函数(cdf)用 是由 在哪里 。概率密度函数(pdf),生存函数(sf)和风险率函数(hrf) Lomax随机变量给出 分别。
凯文模型可以通过多种方式获得。它可以作为一种特殊形式的皮尔森获得第六类型分布。它也被认为是指数和伽马分布的混合物。在一生的场景中,凯文分布属于减少故障率分布的领域。这个分布已被证明为一个重要的选择指数,威布尔和伽玛分布模型重尾分布的数据集。由于Lomax分布的重要性和适用性,它已经广泛推广和修改,以获得一个更灵活的扩展凯文的分布,例如,电力Lomax分布(2),转化Lomax分布(3),取幂Lomax分布(4),加权Lomax分布(5),指数Lomax分布(6],γLomax分布[7),泊松Lomax分布(8),一个扩展Lomax分布(9],Marshall-Olkin扩展Lomax [10),取幂威布尔洛马克斯(11],Kumaraswamy广义电力Lomax [12],Marshall-Olkin长度偏差Lomax [13],龚帕兹Lomax [14],half-logistic Lomax [15),甘力克罗马克斯(16),转化威布尔凯文(17,转化取幂Lomax [18]。
在本文中,我们关注的是提出一个新的带三个参数的修改Lomax分布称为Lomax-Claim (L-Claim)分布建模财务数据。L-Claim分布采用类的方法介绍了索赔分布Ahmad et al。19]。类的提供和pdf索赔分布,分别
在这篇文章中,L-Claim分布及其统计特性将密集的统计处理。然而,L-Claim分布的灵活性和适用性检查应用程序到保险损失保险数据。
本文的其余部分进行如下。节2介绍了L-Claim分布。部分3致力于L-Claim分布的双变量扩展。分位数函数和一些可能的阴谋的意思是,方差,偏态和峰态提供了第四节。第五节致力于L-Claim分布的极大似然估计。蒙特卡罗模拟进行研究第六节。L-Claim模型的实际应用到保险损失数据Farlie-Gumble-Morgenstern二元Lomax-Claim (FGMBL-Claim)应用于GDP和出口商品和服务的提供8节。在上一节中给出了一些结论。
2。L-Claim分布
在下一节中,我们研究一个带三个参数的L-Claim分布和形状的pdf进行调查。的运作和pdf L-Claim分布可以通过替换表达式(1)和(2)(3)和(4),分别。
一个随机变量X有L-Claim如果它的运作是由分布
相对应的pdf (5)是由
一些可能的行为的pdf L-Claim分布如图1。故事情节在右面板的图1勾勒出了 (红线), (绿线) (黑线),而故事情节的左面板图1提出了对 (红线), (绿线) (黑线)。
(一)
(b)
从图1,很明显,当参数和增加和 ,然后提出L-Claim拥有沉重的尾巴。由于右偏态和重尾分布行为的模型,它可以是一个好的候选模型建模重尾分布数据是非常重要的在金融和保险精算科学。
的科幻和hrf L-Claim分布随机变量给出 分别。一些可能的行为的hrf L-Claim分布如图所示2。故事情节在右面板的图2勾勒出了 (红线), (绿线) (黑线),而故事情节的左面板图2提出了对 (红线), (绿线) (黑线)。
(一)
(b)
正如我们上面说的,两个参数传统Lomax分布属于类减少故障率分布。然而,从图中提供的情节2,很明显,L-Claim分布有单峰和增加故障率函数。从今以后,除了重尾分布的行为,这是另一个凯文分布提出了模型的优越性。
3所示。Farlie-Gumble-Morgenstern二元Lomax-Claim分布
相关函数是用来表示两个边际单变量分布的联合运作。如果单变量提供的吗 ,联合运作用 由相关函数的定义 在哪里之间的依赖措施吗和 。的共同运作和pdf Farlie-Gumble-Morgenstern(女性生殖器切割)连系动词(康威(20.分别给出])
随机变量表示 遵循FGMBL-Claim分布是否定义为其提供 在哪里 。相应的pdf是
不同的情节FGMBL-Claim分布提供了数据3和4。而cdf实验组的和科幻的情节FGMBL-Claim分布在图提供5。
(一)
(b)
(c)
(d)
(一)
(b)
(c)
(d)
(一)
(b)
4所示。分位数函数
分布的分位数函数是非常有用的申请由蒙特卡罗模拟产生随机数。假设X遵循L-Claim分布分位数的函数X通过反相可以吗 在(5)。我们获得
中提供的非线性表达式(12)可用于获得L-Claim分布的随机数。
此外,形状的影响参数对偏斜度和峰度对分位数能被探测到的措施。我们获得L-Claim分布的偏斜度和峰度措施使用(12)。Bowley的偏态(Bowley [21])的X给出如下: 而沼泽的峰度(沼泽22])如下:
这些措施不太敏感的离群值。此外,他们确实存在没有时刻的分布。一些可能的阴谋的均值,方差,偏斜度和峰度L-Claim分布提供了数据6和7。
(一)
(b)
(c)
(d)
(一)
(b)
(c)
(d)
5。参数估计
几种方法的估计未知参数研究和应用的文献。其中,最大似然估计的方法是应用最广泛的方法。通过这种方法获得的估计有一些可取的属性,可以有效地用于建立信心。在本节中,我们采用这个方法来获取模型参数的估计。让 观测值的随机样本取自L-Claim分布与参数 ,和 。对数似函数对应于(9)是由
(提供的表达式8)可以使用牛顿的典型的解决方法或定点迭代方法。的偏导数8),代表参数
6。蒙特卡罗模拟研究
本节涉及的性能评估L-Claim分布的极大似然估计的蒙特卡罗模拟研究。两组不同的参数的仿真执行的L-Claim分布。仿真研究进行如下:(1)不同大小的随机样本 从生成L-Claim分布。(2)通过最大似然估计模型参数的方法。(3)750年重复计算偏差,绝对的偏见,这些估计的均方误差(为了)。(4)公式获得的偏见和家中小企业 分别。(5)步骤(4),也是重复的参数 。
为模拟数据集1箱线图和核密度估计量都呈现在图8。而对于模拟数据集2,箱线图和核密度估计是呈现在图9。
(一)
(b)
(一)
(b)
L-Claim分布的仿真结果提出了表1和2。支持表中提供的结果1和2,仿真结果也在数据图形化显示10和11。
(一)
(b)
(c)
(d)
(一)
(b)
(c)
(d)
7所示。L-Claim车辆保险损失数据的应用
重尾分布的主要应用极值理论或保险损失现象。在本节中,我们说明L-Claim分布的适用性通过分析车辆保险损失数据。数据是可用的http://www.businessandeconomics.mq.edu.au。我们比较L-Claim分布的两个参数的拟合优度结果Lomax分布和拟合电力凯文(P-Lomax) (2),转化凯文(T-Lomax)分布3,取幂凯文(E-Lomax)分布4]。我们估计未知参数的拟合分布通过使用最大似然方法R-script充足率模型与“Nelder-Mead”方法;请参阅附录。拟合优度统计包括Anderson-Darling(广告),Cramer-Von米塞斯(CM),以及Kolmogorov-Smirnov (KS)与相应的值是用来比较拟合模型。
表3给出了ml模型的参数。而分析表提供了措施4。一般来说,这些措施的值越小,适合的数据就越好。进行分析后,我们观察到L-Claim分布给出了最低的值分析措施在所有的拟合模型。所以,L-Claim分布可以选为最佳模型建模重尾分布的金融数据集。此外,在结果表中提供的支持3,估计pdf和cdf, kaplan meier生存和probability-probability (PP)和quantile-quantile (QQ)块模型的箱线图绘制在图的数据12。图中提供的情节12表明L-Claim分布提供了一种保险损失数据的紧密配合。
(一)
(b)
(c)
(d)
(e)
(f)
8。FGMBL-Claim经济数据的应用
经济是一个重要的部门在许多发达国家和发展中国家。因此,政府和其他负责任的机构总是感兴趣的GDP增长和出口的商品和服务。证明的有效性提出FGMBL-Claim分布,我们认为GDP的增长和出口的商品和服务。总结认为数据基于响应变量的措施如商品和服务的出口和GDP增长提供在表5。
8.1。测试正常的经济数据
评估数据的正常要求许多统计测试,因为正常的数据是一个基本的假设参数测试。有两种主要的方法评估正常数值和图形等。在本节中,我们检查正常的变量 使用Shapiro-Wilk (SW)正常测试和Anderson-Darling(广告)正常测试。此外,我们使用图形化的方法基于quantile-quantile ( )情节。的情节吸引给定样本和正态分布之间的关系,提供了一个视觉判断是否钟形分布。这情节一个45度的参考线和假定正常如果所有的点大约下降沿参考线。
8.1.1。Shapiro-Wilk正常测试
SW正常测试可以执行如下: :数据通常是分布式vs。 :数据不是正态分布。应用软件的正常测试后,我们观察到的SW值和0.9421和0.9336,分别由相应的吗p值为0.0948和0.0650,分别自p值大于0.05水平的意义。因此,我们得出这样的结论:数据的分布显著的正态分布。在简单的单词,我们可以假设常态。从图13,我们可以看到数据是正态分布的点是分散在对角线。
(一)
(b)
8.1.2。Anderson-Darling正常测试
Anderson-Darling(广告)测试是另一个突出的方法检查的正常数据。在本节中,我们执行广告正常测试检查数据的常态。根据这个测试,零假设和备择假设可以定义如下: :数据通常是分布式vs。 :数据不是正态分布。进行分析后,广告正常检验统计量的值和由0.6533和0.7338给出各自的值为0.0798和0.0719。我们可以看到值的广告检验统计量大于0.05。因此,我们不能拒绝零假设,得出的数据是正态分布的。从图中提供的情节14,我们可以看到数据是正态分布的点是分散在对角线。
(一)
(b)
8.2。经济数据的建模
提出FMGBL-Claim分布的主要兴趣是申请数据分析的目的,使其可在许多应用领域。所示,这方面考虑经济学数据集基于GDP增长和出口的商品和服务。测试的总时间(TTT)情节是一个实证情节和用于模式识别的目的。经济数据集的TTT图呈现在图15。
(一)
(b)
在本节中,我们使用经济数据来说明该模型。我们证明FGMBL-Claim模型的适应能力比Farlie-Gumbel-Morgenstern二元凯文(FGMBL)分布(23]。“更好”这个词的使用FGMBL-Claim分布的最小值考虑合适的措施;这需要澄清;下面给出细节。
首先,我们估计未知参数拟合模型的使用极大似然方法使用R- script库(BB)。并给出了模型参数的估计价值表6。我们所知,没有强大的ml的物理解释,并通过优化技术。在这里,我们使用牛顿迭代过程利用图书馆(BB)来估计模型参数,使FGMBL-Claim分配足够灵活来捕获数据背后的信息。
做的比较是基于一些歧视措施如Akaike信息标准(AIC)和贝叶斯信息准则(BIC)。后进行分析,并给出了拟合模型的歧视措施表7。这些措施的最大价值被认为是糟糕的性能。结果表中提供7显示,FGMBL-Claim分布是最佳人选模型经济学数据,因为它有最小的值拟合的措施。
9。结束语
在这项研究中,一个新的扩展Lomax分布称为Lomax-Claim模型介绍。拟议中的分布是非常灵活和具有沉重的尾巴。参数的最大似然估计。此外,蒙特卡罗模拟研究提供评估评估人员的行为。提出L-Claim模型是通过分析说明了重尾分布车辆保险损失数据集,是由一些著名的竞争和比较模型。真正的应用程序中,我们表明,L-Claim模型提供了一个更好的适合重尾分布车辆保险损失数据比其他发行版。此外,二元延长L-Claim分布称为Farlie-Gumble-Morgenstern二元Lomax-Claim分布。最后,二元延长L-Claim分布分析相关经济数据所示GDP和出口的商品和服务。
附录
R-code分析
请注意。在接下来的R用于代码 ,年代用于 , 用于 ,和点用于拟议的模型。库(AdequacyModel)数据阅读。c年代v (file.choose(), header = TRUE)=数据[6]=数据[! is.na(数据)]嘘(数据)# # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #概率密度函数# # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #pdf_pm函数(par,x){一个=标准[1]年代= par [2] =标准[3](一个∗∗年代∗((1 +∗x)∧(−一个−1)∗(1−((1 +∗x)∧(−一个)))∗(2−−1年代)∗(1−(1∗x)∧(−一个)))))/ (((1−−1年代)∗(1−(1∗x)∧(−一个)))))^ 2)}# # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #概率密度函数# # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #cdf_pm函数(par,x){一个=标准[1]年代= par [2] =标准[3](s∗((1−((1∗x)∧(−一个)))∧2))/ (1−−1年代)∗(1−(1∗x)∧(−))))}set.seed (0)善良。适合(pdf = pdf_pm cdf = cdf_pm开始=c(0.5,0.5,0.5),数据=数据,域=方法= " Nelder-Mead。c(0,正),标定= NULL)
数据可用性
这项工作主要是方法论的发展和应用于辅助数据,但如果需要,数据将提供。
的利益冲突
作者宣称他们没有利益冲突的报告对于本研究。
确认
这项研究是由美国统计,亚兹德大学亚兹德,伊朗。