文摘

广义Gudermannian分布是对称的分布位置和尺度参数替代等著名的对称分布正常,拉普拉斯,柯西。这个分布有一个简单的封闭形式的概率密度函数(pdf)和累积分布函数(cdf)和基于峰度准则比正态分布更灵活。提出了该分布的某些特征。对于这个分布,由于非线性的似然方程形式,最大似然估计(ml)的位置和尺度参数没有封闭的形式和使用合适的开始值需要一个数值近似方法。一个简单的方法产生明确的估计通过近似方程提出了可能性。这些估计的偏差和方差是检查数字,表明这些估计极大似然估计的效率。一些关键量提出了寻找位置和尺度参数的置信区间基于渐近正态性。从覆盖概率,毫升不工作特别是对小样本大小;因此,改善覆盖概率,基于蒙特卡罗方法模拟的百分位数。最后,给出了一个真实的数据集来说明建议的方法和推理相关数据集。

1。介绍

著名的对称分布(正常,t——学生)的所有类型的造型,如回归,可靠性等。基于这些缺点来创建一个新的模型分布的累积分布函数没有一个封闭的形式。例如,多组分应力强度模型无法创建一个实值数据集根据这些分布,因为上面提到的原因。Rasekhi et al。1)工作在这个问题上基于另一个对称分布提供(广义物流),有一个封闭的形式。

标准通用Gudermannian分布是对称的分布对零,用下面的pdf 和相应的运作

阿尔金[2]介绍了基于Gudermannian函数分布 通过以下定义积分(3]。

他扩展这个分布通过添加一个斜参数分布。在未来,研究人员可以使用该统计分布在许多领域如回归分析、贝叶斯统计,等等。在这工作的一个版本(1),被认为是位置和尺度参数。为 的随机变量 被认为是在Ypdf的广义Gudermannian分布 在哪里 分别是位置和尺度参数。请注意,

本文的位置和尺度参数的估计广义Gudermannian (GG)分布。本文组织如下。节2,我们讨论毫升GG的位置和尺度参数的分布和获得明确的估计可能性的一个合适的近似方程。观察到的费雪的表情信息计算部分3。节4,覆盖概率的渐近正常关键量模拟和模拟索要这些关键的数量。仿真研究的结果说明近似毫升的性能特点,提出了ml5。部分6提供了一个真实数据的示例来说明所有的推理方法在这个数据集。该分布的某些特征提出了在上一节。

2。似然函数

在本节中,GG分布被认为是估计的位置和尺度参数进行了讨论。

2.1。毫升的参数

假设 是一个随机样本的大小n从(4), 是相应的次序统计量。基于次序统计量,似然函数如下:

鉴于(5),似然函数可以改写如下: 在哪里 所以,GG的对数似功能分布可以表示如下:

从对数似函数偏导数与尊重 ,我们得到以下方程同时必须解决:

系统方程(9)没有封闭形式的解决方案 因此必须解决数值获取最大似然估计。为此,可以使用牛顿迭代法获得的毫升 ,但这种方法需要合适的起始值参数。

2.2。近似毫升的参数

由于系统方程(9)是非线性的,这些方程的解决方案没有一个封闭的形式。接下来,我们组 系统的近似方程(9),近似毫升(aml) 被提供。AMLE方法不需要任何起始值。根据大卫[建议的方法4]和阿诺德·[5),这个函数 通过扩大泰勒级数近似在吗 一些作者已经利用这种方法等其他发行版:Balakrishnan和Asgharzadeh [6];Asgharzadeh [7];Balakrishnan和侯赛因(8];和Asgharzadeh et al。9]。

是在(2),然后我们有以下: 在哪里 顺序统计量的样本大小n从统一的 分布和 是平等分配。因此,我们得出这样的结论: 在哪里 所以,保持一分之二的泰勒级数的扩张 周围 和重命名的 ,我们有如下: 在哪里

首先,我们看到 所有的价值是负的

从(12),我们近似方程组(9)如下:

从第一个方程(15),我们有如下: 的估计量 如下:

第二个方程(15)可以改写如下:

通过插入(17)(18),得到以下方程:

经过计算,最后三个条款删除并获得二次方程如下: 在哪里

二次方程的两个根(20.)如下:

,的一个根源是-,因此省略了。的估计量 得到如下:

AMLE法在标定法的优点是估计的明确的数学表达式,这种方法不需要任何起始值参数。

3所示。观察费舍尔信息

在本节中,观察到的费舍尔信息矩阵是基于可能性和近似计算似然方程。然后,一些关键量提出了基于正态分布的限制,这些量的行为是基于蒙特卡罗模拟的研究。通过区分(9获得),观察到的费舍尔信息矩阵如下:

现在,近似方程(23)- (25基于方程(12)如下:

假设

中观察到的信息矩阵,一个倒置的近似估计的渐近方差协方差矩阵是必要的。因此,基于方程(23)- (25)和ML估计 在哪里

同时,观察到的费舍尔信息矩阵是获得AMLE被发现 通过方程(26)- (28AML)和估计。

如果建立了渐近正常,那么近似渐近方差协方差矩阵是有效的。对于这个验证,某些规律性条件([10),121页)必须建立。

4所示。覆盖概率和百分点

建筑的置信区间或执行假设测试,关键需要数量。自标定参数向量 有一个渐近正态分布,什么时候 ,我们有

第一个分布(32)是正确的因为 在分布收敛 和初速的一致性条件的基础上, 倾向于 在概率。当 是已知的,第二个分布(32通过收敛)是正确的 在分布。同时,第三个分布(32)是正确的因为 在分布收敛 和初速的一致性条件的基础上, 倾向于 在概率。因为所有的分布 在(32)不依赖 ,这些函数是关键的数量 的覆盖概率 置信区间的计算如下: 通过仿真研究。同样,关键的数量 基于aml,

参数的置信区间 可以通过渐近百分位数的 值得提及的是,关键量有非常复杂的形式的百分位数有限的样本大小,因此,使用蒙特卡罗模拟方法。例如,如果 百分位的 ,然后 我们有

95%置信区间

5。模拟研究

在本节中,毫升的性能和广义的aml Gudermannian参数进行了比较。生成随机抽样从GG分布通过逆的方法,例如,

在本节中, , ,和样本大小 被认为是。aml的计算(17)和(22)。计算毫升通过求解系统方程(9)通过optim R统计函数程序。optim函数需要的起始值参数和aml用于这一目的。基于1000年复制,估计的平均值,方差、协方差表1。方差和协方差是通过反相观察费舍尔信息矩阵。在表1的偏差和方差aml和毫升约等于所有样本大小;因此,aml毫升一样有效。估计量的偏差和方差减少当样本容量n增加。图1说明了ml的家中小企业和aml大约相等当样本容量增加和减少为零。在表2,覆盖概率的 基于1000年复制数据模拟计算从GG分布。这些值是决定基于正常的假设。当 是未知的,样本量小,覆盖概率非常不满意,但是知道吗 ,也就是说, .95附近的覆盖概率大约为所有样本大小。在实践中, 是未知的;因此,正常的假设是不适合大中型企业当样本容量小。为了纠正这个问题,使用百分位数的关键量。表3包括关键量的百分位数通过模拟研究有以下步骤:(1)模拟1000复制的关键量( )为每一个 和样本大小。(2)计算平均2.5和97.5百分点的模拟样本根据1000年复制 和样本大小。很明显,这个过程的正常的假设是不合理的。在表3,特别是对于小样本大小、百分位数非常不同于正态分布的百分位数(33)。这些值似乎正态分布百分位数的好方法。

6。真实数据的例子

在本节中,给出了一个真实的数据集来说明前几节中提到的方法的重要性。100纱的强度分析的数据集是由邓肯(11]。数据如下:66,117,132,111,107,85,89,79,91,97,138,103,111,86,78,96,93,101,102,110,95,96,88,122,115,92,137,91,84,96,97,100,105104,137,80,104,104,106,84,92,86,104,132,94,99,102,101,104,107,99,85,95,89,102,100,98,97,104,114,111,98,99,102,91,95,111,104,97,98,102,109,88,91,103,94,105,103,96,100,101,98,97,97,101,102,98,94,100,98,99,92,102,87,99,62,92,100,96,98。这些数据已经被Alizadeh Noughabi[以前12,13]。

现在,AMLE参数 计算如下:

毫升的参数是通过求解系统方程(17)使用牛顿迭代过程和“optim”功能在R程序: AMLE用于启动optim”函数的值。很明显,aml和毫升是大致相等。的百分位数 置信区间为 ,分别。的 置信区间为 基于ml ,分别。同时,的百分位数 置信区间是 ,分别。的 置信区间为 通过aml是 ,分别。

6.1。毫升的存在性和唯一性

2显示了AMLE对数似函数时的行为参数破坏应力使用真实的数据集。我们可以看到在图2,两个情节有单峰形状和模式都对应于AMLE参数的值。然后,我们可以得出结论,AMLE参数全局最大值的值。的图形化描述的存在性和唯一性AMLE参数在这种情况下通过破坏应力真实数据集呈现在图3。我们可以看到在图2根是全球最大,我们可以推断出从图3对数似函数是一个递减函数和相交X设在一度确保我们的根是独一无二的和最大满足毫升的存在性和唯一性。

7所示。表征结果

在本节中,我们现在GG的特征分布的一个简单的两个截断时刻之间的关系。第一个描述结果雇佣了一个定理由于Glanzel [14];看到定理1在下面。注意,结果认为当间隔 不是封闭的。此外,它还可以提供时应用 没有一个封闭的形式。所示(15),这个特性是稳定的弱收敛。

定理1。 是一个给定的概率空间,让 对一些人来说是一个区间 连续随机变量的分布函数 ,让 是两个真正的函数上定义 这样方程定义了一些真正的功能 假设 , , 是连续可微的两倍,严格单调函数设置 最后,我们假定方程 没有真正的解决方案在内部的吗 然后, 是唯一由功能 , ,尤其是 的函数 是一个微分方程的解决方案 是归一化常数,这样

命题1。 连续随机变量,让, 随机变量 pdf (4)当且仅当函数 中定义定理1的形式

证明。 是一个随机变量与pdf (4),然后 最后 相反,如果 如上所述,呢 因此, 现在,鉴于定理1, 密度(4)。

推论1。 连续随机变量,让 是在命题1。pdf的 是(4)当且仅当存在功能 中定义定理1满足的微分方程。

推论2。微分方程的通解的推论1如下: 在哪里 是一个常数。

注意,上面一组函数满足微分方程给出的命题1 然而,它应该还指出,还有其他的三胞胎 满足条件的定理1

8。结论

在本文中,我们提出一个近似的最大似然估计(AMLE)广义Gudermannian (GG)分布。这个分布是一种新的对称概率分布接近pdf和cdf但参数的最大似然估计(位置和规模)没有密切的形式和所需要的数值优化方法(如“optim”代码在R程序)。同时,采用这种类型的数值优化方法,我们需要一个好的选择对于起始值的参数。我们建议aml GG分布参数是不错的选择。

线性和非线性回归模型等相关研究(变化点,离群值,等。)基于GG分布可以通过使用我们建议aml GG分布参数的未来的工作。更多readind见下面的引用(16- - - - - -20.]。

数据可用性

所有数据是可用的。

的利益冲突

作者宣称没有利益冲突。