文摘
本文的目的是探讨一个新的家庭分布基于反三角函数的反正切函数。在精算学的背景下,重尾分布概率分布是非常有益的,扮演着重要的角色在造型数据集。精算师都致力于寻找这种分布为了得到一个很好的适合复杂经济和保险精算数据集。目前的研究需要一个看一个受欢迎的方法生成新的发行版是优秀的候选人处理重尾分布数据。该家庭的分布称为arctanx家庭介绍了分布和使用反三角函数。特定目的的力量,我们研究了Arctan-Weibull分布开发家族的一个特例。估计的参数Arctan-Weibull分布、频率论的方法,即。最大似然估计,使用。严格的蒙特卡罗模拟分析是用来确定所得估计的效率。Arctan-Weibull模型演示了使用一个真实的保险数据集。Arctan-Weibull比较知名的两个,三个,四个参数的竞争对手。竞争中威布尔分布,卡帕,Burr-XII, beta-Weibull。 For model comparison, we used the most precise tests used to know whether the Arctan-Weibull distribution is more useful than competing models.
1。介绍
众多学科的研究重尾概率分布检验,包括精算科学、生物医学科学、工程、风险管理和经济学。近年来,一些程序提出了生成一个新类的重尾分布概率分布与足够的描述和高度的灵活性。在这些技术中,使用三角函数和他们的逆的最前沿的发展概率分布的新家庭。真正的金融和保险精算学的基本功能是准确预测大型货币金融损失。低估的损失暴露了公司严重的操作风险,包括破产和低估了溢价。减轻这种情况下,提供精确的预测精算学损失,精算师经常提出灵活的重尾分布。
金融和保险精算数据集通常是重尾分布,unimodal-shaped,右撇子,和积极的1,2]。复杂的金融数据集可以通过开发新的家庭更好的模仿的概率分布1- - - - - -5]。建议的模型显著提高定量分析方法的有效性,和大量的工作一直致力于建立新的统计模型。然而,许多基本与实际数据似乎存在困难,真的不适合最常见的统计模型。为了捕捉真实现象,常用的统计分布。统计分布的理论被广泛研究的新发展的效用。描述不同的实际现象,分布开发的几个家庭。最近的事态发展在分布理论和它的使用已经导致许多普通家庭的出现概率分布,已经成功地应用于各种统计和概率问题。更多细节,请参阅[6- - - - - -10]。
构建灵活的参数化模型来模拟各种类型的数据应用统计是一项艰巨的任务。一般来说,这允许的发现现实世界现象的新功能以及提供建议的预测。创建了几个家庭的分布在这方面使用各种技术,如(i)诱导的形状,偏态、峰态参数(6];(2)复合分布的7];转换技术(11- - - - - -13];(iv)有限的混合分布(14- - - - - -16];和(v)两个或两个以上的组成分布(17]。有关这些技术的更多信息,请参见[6- - - - - -10]。
不幸的是,上述归纳古典概率分布的技术可能面临一些限制,比如(i)添加更多参数的概率模型增强了它的灵活性,通常导致reparameterization问题等方法。(2)有一个模型参数数量的增加,这使得它很难检查模型参数。(3)温顺的cdf减少几个扩展方法,这使得手工计算统计特征更加困难。(iv)其他归纳方法使pdf更复杂,主要计算困难。添加额外的额外参数为已存在的模型提高模型的灵活性,这是一个理想的特点。另一方面,它使它更难以得出结论,额外的阅读[18,19]。
为了使模型更加灵活,大多数统计模型提出在文献中有大量的参数。这些估计,根据一些作者,是很难获得使用数字资源。然而,最好创建模型与一个小数量的参数,但造型数据的高度的灵活性。为了实现这一目标,一小群研究人员决定寻找新的发行版使用三角函数以及它们的倒数(见[18- - - - - -27])。
本研究的基本目的是为了现在和检查的新家庭与少量参数概率分布,但高度的数据建模的灵活性。为此,一组研究人员决定寻找新的发行版使用三角函数以及它们的倒数。谢诺斯et al。20.)开发了一个新家庭的分布称为正弦Kumaraswamy-G概率分布的家庭。Souza et al。21)引入了一个新的家庭使用正弦函数的概率分布。Souza et al。22)提出了一个新的家庭使用正切函数的概率分布。Souza [28]介绍了概率分布的其他家庭使用cos和正割函数。马哈茂德et al。27)开发了一个新的家庭使用正弦分布的概率分布。谢诺斯et al。23)开发了一个新家庭的基于正弦和余弦函数的概率分布。
另一方面,其他研究人员开发出一种新的家庭使用逆三角函数的概率分布。肺et al。18)开发了一个新的家庭使用反正弦函数的概率分布。拉赫曼et al。29日)开发了一个新的家庭使用反正弦分布的分布。谢诺斯et al。24)开发了一种新的基于反余弦函数分布。Chaudary [26]介绍了反正切Lomax分布利用反正切分布。缪斯et al。30.)引入了一个新的多功能log-logistic使用正切函数分布。此外,其他研究人员讨论了三角函数的应用程序及其逆;有关更多信息,请参见[19,24,27,31日- - - - - -33]。
鉴于前面的讨论,统计学家愿意提出新的分布或分布家庭基于一个容易表达pdf(概率密度函数)和一个封闭的和易于操作的形式提供(累积分布函数)。因此,摘要正在努力开发一种新的分布家庭避免上述问题,同时提供最适合的金融数据集。拟议的家庭被称为arctanx家庭的分布(缩写为“x”)和开发利用反正切函数。拟议的家庭有一个简单的pdf的表达式以及关闭并提供形式。
这里作者的知识,没有发表的研究中对其数学和实践特征基于反正切函数的目的是开发一个新家庭的分布在当下文学。本文写作的原因之一就是解决这个意想不到的差距。我们获得的一些基本的数学和统计特性的新家庭使用的一般设置arctanx类,如故障率函数(hrf),幸存者函数(sf)、分位数函数(qf),时刻和矩生成函数(mgf)偏态、峰态和剩余寿命函数。
本文的其余部分安排如下:arctanx家族及其主要数学属性部分中讨论2。部分3礼物arctanx家族的特殊情况。Arctan-Weibull分布介绍部分4。检查Arctan-Weibull分布的数学和统计特性部分5。部分6用于估计arctanx家庭参数。部分7概述了建议模型的蒙特卡罗模拟。节8提出模型的优越性和解释说,使用真实数据的应用程序。最后,部分9包含最终结果和主要的言论和整个工作总结。
2。arctanx家族的分布
在x家族的这一部分中详细提供。在x家族有很多优点;其中一个优点是,它有一个很容易表达pdf和驯良的封闭运作形式。如果我们假设X是一个随机变量,属于arctanx家族,那么它的运作可以写成以下表达式:
在这里, 被认为是基线(或父母)提供的随机变量根据参数向量 ,如果有pdf ,则表示为类的pdf
互补cdf(或生存函数)可以写成如下:
瞬时失败率(或风险率函数(hrf))可以写成如下:
复古的风险(或逆转故障率函数)可能表现在以下方式:
,综合风险率(或累积故障率函数)是由
2.1。分位数函数
分位数函数(也称为逆cdf) arctanx家族的遵循通过反相arctanx分布函数。可能是写如下的切三角函数: 在哪里 。分位数函数表达式可用于生成随机数从x分布。
2.2。时刻
精算学和金融领域的科学时刻是非常重要的,特别是在应用程序。它给研究者一个手的关键属性和特征提出分布在考虑。rth时刻在x分布家庭计算
使用pdf方程(在x的家庭的8),我们得到
我们使用泰勒级数
让 ,在方程(10];我们得到了
借助于方程(7),用方程(9),我们将有以下结果: 这样 。
在x家族的矩量母函数可以表示一般形式如下:
3所示。arctanx家族的特殊情况
本节讨论某些情况下的预期arctanx家族分布累积分布函数通过使用不同的基地。在表1,我们现在十五提出家庭的特殊情况,包括威布尔龚帕兹,log-logistic,凯文,Kumaraswamy,帕累托,正常,Dagum, Burr-XII,瑞利,γ,·林德利指数,甘力克和均匀分布。
作为一个例子,在替代参数化的情况下,选择cdf 威布尔分布和介绍Arctan-Weibull分布如下。
一个随机变量X据说威布尔分布形状参数 和尺度参数 用X∼魏 。它的运作是由以下定义:
pdf是由
我们可以把可靠性(生存)函数如下:
hrf给出的
复古的风险率是由
综合风险率函数是由 在哪里 是一个向量的未知参数。
4所示。Arctan-Weibull分布
威布尔分布有一个简单的数学定义。它是容易处理的数学。这也是一个模型,该模型可用于各种各样的情况。威布尔分布的损失被认为是一种通用的模型建模的一般保险由于其充分的能力和高度的正偏态模型数据,这是一个典型的索赔金额。因此,这部分的纸是专门介绍新提出的分布是w和推导的基本概率函数包括pdf, hrf,提供,幸存者函数,综合风险功能,复古的风险。考虑到威布尔分布的运作。的cdf w分布 ,可以表示为
给出相应的pdf上述运作
科幻小说是表示如下:
hrf获得的
倒故障率函数如下:
累积风险函数可以用如下: 这样 是向量参数在所有上述方程,分别。
数据1,2,3表现出一些可能的w分布形状的pdf,提供,和科幻小说功能探索的行为模式密度,提供和科幻函数对不同模型参数的值。
5。该模型的属性
本部分介绍用数值例子来得到一些统计和数学w分布的性质,如分位数函数、偏态和峰态,时刻,和残余和反向剩余寿命函数。
5.1。分位数函数
逆cdf函数主要是在理论领域的就业分布理论,如thesimulations和适用性。仿真软件使用一个随机样本分位数函数来创建。的分位数函数w分布用 在哪里均匀分布从0到1。
的分位数函数w模型如下:
中、下四分位数和上四分位数w分布可以很容易获得通过使用分位数函数设置 ,分别。
5.2。偏态和峰态
高尔顿偏态(或不对称)和摩尔人的峰度w模型与两个参数有以下数学表达式形式:
在这里,问捐赠四分位数的值。
前面的表达式可以显式形式的函数w分位数函数。这些措施有很多优势(34]。
5.3。时刻
时刻在统计建模至关重要,尤其是在应用程序。图象分布定义为仅仅的时刻
事实上,我们有
5.4。剩余寿命和反向剩余寿命
这可以广泛应用于保险精算学、生存分析、和许多其他领域如风险管理;有关更多信息,请参见[35]。分析设备的生命周期后的年龄在可靠性和生存分析尤为重要。因此,是一生最初与生存函数 和随机变量 后相应的剩余寿命的年龄吗(36]。
的分布可以计算使用以下表达式中的条件概率的定义:
剩余寿命计算使用以下w方程随机变量(r.v。):
此外,我们可以获得图象的反向剩余寿命随机变数如下:
6。经典的估计方法
使用传统方法在估计过程中非常重要,所以我们本节致力于最大似然方法估计分布的参数x家族的未经审查的完整的样品。假设我们有一个随机样本表示 代表独立随机变量x的家庭有以下的观察: ,我们可以写在x家族的似然函数是定义如下:
我们可以表达对数似函数如下:
获得的偏导数对数似方程,我们得到的
将一阶导数 数值为零,并试图解决这个方程,我们得到了初速的估计量 现在很容易得到的值估计的参数方程(35)提出的任何子用例与pdf和cdf家族的 和 分别。
我们可以找到两种方法估计直接R程序(充足率模型包),牛程序(子例程MaxBFGS),或SAS (PROX NLMIXED)或间接通过求解非线性方程的可能性。
7所示。蒙特卡罗模拟研究
我们评估的有效性最大似然估计(标定)方法估计Arctan-Weibull分布参数的使用蒙特卡罗模拟。数值评估的性能标定w模型的执行使用nlminb()与论证方法= " bfg前庭功能。“仿真研究是进行调查的平均偏差(AB),均方根误差(RMSE)和均方误差(MSE),该模型的参数,
我们进行了仿真过程由不同样品和不同的参数值。我们生成的模拟过程中使用的样本分位数w分布的函数。为了生成准确的样品和完美的估计,我们做了750次迭代使用样本大小 和参数的场景 ,在我, 在第二组中, ,在第三组。
毫升是确定每一项的模拟数据,说 为 和AB、rms和家中小企业的参数计算 在哪里 。
7.1。仿真结果
我们探索初速w参数估计的方法的性能与750重复使用一个MC模拟研究。我们确定的均值估计参数,绝对偏差,均方误差(MSE)和均方根误差(RMSE),和下面的步骤是:(我)我们生成的样本通过反相cdf (20.](2)三个不同的组对不同参数的真实值(3)我们使用仿真表中不同的样本大小如上所述
表2- - - - - -4总结MC仿真研究的数值结果。估计参数的平均值,以及AB, MSE和rms评估。基于仿真的结果表,不言而喻,ml估计未知参数是有效的,得到的估计相对稳定和接近实际值。此外,随着样本量的增加,AB, MSE,和rms减少偏见,MSE和RMSE。对于可视化表示,MC仿真结果中描述数据4- - - - - -6。这些图表显示,增加样本量n结果在AB的估计价值减少,为了和rms,平均毫升接近真实值。
8。实际例子使用保险数据集
本节将研究一个高度相关的真实数据集的保险业务,以显示w分布的价值。我们比较建议分布的拟合优度检验结果和一些信息标准措施的其他一些著名的竞争分布,如威布尔,卡帕,Burr-XII, beta-Weibull分布。
w分布推导的主要吸引力是其数据分析问题的适用性,这使得它有用的在各种各样的领域,特别是涉及保险数据分析。最近,大量的电位分布家庭保险数据集提供了。有关这些主题的更多信息,参见[4,5,18,19,34,35,38- - - - - -40]。
提供的拟合模型如下:(1)威布尔分布 (2)Burr-XII分布 (3)Beta-Weibull分布 (4)Kappa分布
某些分析方法用于识别竞争的最佳拟合功能分布。在这方面,Akaike信息准则(AIC) Hannan-Quinn信息准则(HQIC),纠正Akaike信息准则(CAIC)和贝叶斯信息准则(BIC)值被用来选择最合适的人。除了识别测试,额外的拟合优度包括测试,如Anderson-Darling (A )统计,Cramer-von米塞斯(W )距离值测试,Kolmogorov-Smirnov(钴)与关联数据p值,以及对数似函数,也记录下来。
最好的模型的AIC值最低,BIC, CAIC、HQIC,以及 ,W ,和钴测试。此外,最大的模型对数似函数值是选择最好的模型p钴应用统计值比较有竞争力的分布。我们观察到,当与其他发行版相比,w模型提供了最大匹配和配件,因为它的最小值测量分析工具。
另类投资会议是
BIC是
中安集团经贸是
HQIC是
在这里,似然函数的值是在用它的日志初速的估计,是实验样本的大小,然后呢在分布参数数量。以下拟合优度测量。
我们可以计算Anderson-Darling(的值 )检验统计量通过以下方程:
我们可以计算Cramer-von米塞斯(W的值 )测试统计数据通过使用以下方程: 在这里,是输出数的矢量数据。当数据是按升序排序,这计算。
8.1。数据我:保险数据集
这个数据集包括58观察和代表每月失业保险标准从2008年7月到2013年4月。据报道,马里兰州美国劳工部,许可和监管。数据集包含21个变量,变量12号特别感兴趣,它是研究通过使用alpha power-exponentiated指数分布来分析(40]。这些数据可以发现:/ catalog.data.gov /数据/失业保险-数据- 4月- 2013年7月- 2008。数据帧包含following58观察:表5
8.2。探索性数据分析
研究的基本目的是让从大量的数据信息。在本文中,我们采用四种不同的策略来做探索性研究:(1)描述性统计的数据集,特别感兴趣的变量;(2)箱线图;(3)TTT图;和(4)直方图。
total-time-on-test (TTT)绘制的图形表示形式的故障率曲线。定性信息的形状故障率函数可以帮助选择一个特定的分布在各种现实世界的应用程序。数据集的TTT图用于本研究存在于图7,它有一种象征的失败率上升,建议使用威布尔分布或其修改。
表6向我们展示了保险的描述性统计数据集通过计算数据的特定方面(集中趋势和传播)。
8.3。我分析的数据集
表5包含描述性统计数据集的数据集。在底下的分布,特别是,是高度倾斜的数据(偏态估计为2.436)和重尾(峰度估计为7.622)。提出了w分布最低AIC, CAIC、BIC和HQIC值和最高对数似值如表所示7,因此,选择最适当的模型中选择评估。
表8显示了参数估计和p值Cramer-von米塞斯(W ),Anderson-Darling ( ),和Kolmogorov-Smirnov(钴)测试所有竞争使用上述数据集分布。根据表8,提出了图象分布值最低的一个 ,W ,和钴测试,以及最高p价值。结果,提出w分布是选为最佳的竞争中可接受的模型分布研究研究。块提供安装和pdf与观测数据的直方图数据所示8和9。此外,估计它的可视化表示,pdf和PP图在图10显示了w分布的kaplan meier策划fordata组我。
9。结论
分布理论考虑了不确定性和提供了一组规则讨论金融和经济决策困难。由于分布理论的重要性,我们在积极引入一个新的家庭基于反三角函数分布。我们引入一个新的优越的家庭更适合各种各样的数据。在x是非常有趣的,并提供更好的适合多种数据如精算数据财务数据和其他相关数据等领域。Arctan-Weibull (w)分布定义为家庭的一个子集。研究开发的基本概率函数以及一些统计特性的子模型。w模型的参数估计使用古典推理的最大似然估计技术。提出了分布应用于保险与高度的粒度数据集。w分布与一些著名的竞争者,包括威布尔,卡帕,Burr-XII, beta-Weibull分布。四个信息标准措施(AIC、BIC CAIC和HQIC)被用来进行比较,以及三个拟合优度指标( ,W ,和KS测试和相应的统计数据p值)和似然函数。使用这些指标,发现w模型可能是一个适合高维财务数据分析。
本研究有大量潜在的扩展。在实践中,特殊的子表1可能是调查在未来的研究中,例如。此外,各种频率论者和贝叶斯技术可以用来估计这些特定的参数的子。拟议的家庭也可以扩展到研究回归分析作为一个广义线性回归模型(41)(GLRM)。
数据可用性
使用的数据来支持本研究的结果包括在本文中。
的利益冲突
作者宣称没有利益冲突有关。