研究文章|开放获取
H. V. Kulkarni,S. K. Powar, "威布尔分布的一种简单正态逼近及其在预测上限估计中的应用",概率与统计杂志, 卷。2011, 文章的ID863274, 10 页面, 2011. https://doi.org/10.1155/2011/863274
威布尔分布的一种简单正态逼近及其在预测上限估计中的应用
摘要
我们提出了一个简单的接近正态逼近威布尔随机变量(r.v.),并考虑了至少包含的预测上限估计问题l的米的威布尔分布r位置,基于提出的近似和著名的Box-Cox正态近似。基于蒙特卡罗模拟的对比研究表明,基于正态逼近的威布尔分布UPLs优于基于现有广义变量(GV)方法的UPLs。基于正态近似的ups比GV方法有更大的覆盖概率,特别是对于分布高度倾斜的小未知形状参数,以及在工业应用中常见的小样本容量。结果说明了一个真实的数据集的从业者。
1.介绍
威布尔分布由于其灵活的形状和建立大范围失效率模型的能力而被广泛应用于可靠性和生存分析。从理论上讲,它可以作为一种极值分布形式导出,它控制了许多相互竞争的失效过程中“最薄弱环节”出现的时间。它的特殊情况与形状参数是常用的径向误差大小建模的瑞利分布吗x和y坐标误差是均值为零、标准差相同的独立正态变量对应于广泛使用的指数分布。
让遵循带有尺度参数的威布尔分布和形状参数.pdf的是由 如果随机样本的大小给出了一个重要的统计问题是构建一个推,这样的未来的样本值在每个的UPL之下地点(或时间段)。weibull分布数据的这一问题在文献中较少被关注。这种预测极限对于工业生产过程运行过程中的监测和控制问题非常有用,特别是当感兴趣的特性较小时。在危险废物管理设施(HWMF)附近的地下水质量监测方面,超高效液相法也很有用。例如,监测地下水水质,一系列的样本,也就是对污染物如氯乙烯的测量在HWMF附近的监测井经常与基于样本的UPL进行比较从设施的一个或多个上梯度取样点获得的测量结果。如果至少来自这些的样本从每个地点小于UPL,则认为设施符合规定。如果没有达到这一要求,那么监测像氯乙烯这样的污染物就更有必要了。博米克和长臂猿[1讨论了超高效液相色谱在分子遗传学和工业质量控制等领域的应用。戴维斯及麦克尼克斯[2]得到假设父分布正态性的UPL。博米克和长臂猿[1Krishnamoorthy等人[3.提出了用于构建用于伽马分布的近似方法。Krishnamoorthy等人[4]使用GV方法构造Weibull分布的UPL。
在本文中,我们提出了当形状参数为威布尔分布时的一种简单的近似正态变换是已知的。这种变换基于正态分布的两个关键特征,即对称性和尾部行为。该变换与已知的Box-Cox变换相结合,得到了形状参数时Weibull分布的近似ups是已知的。对于未知形状参数,用它的极大似然估计(mle)代替它,得到同样好的结果。通过对所提出的超强电偶与现有超强电偶的仿真比较,发现所提出的超强电偶即使在小样本情况下也优于其竞争对手,尤其是在实际应用中经常遇到的小形状参数情况下。
文章组织如下。部分2简要回顾了Krishnamoorthy等人开发的基于全球价值链方法的通用语言。[4].部分3.描述了所提出的正态逼近方法,并基于所提出的和Box-Cox变换发展了威布尔分布的UPL。部分4就模拟的预期覆盖范围和预期长度,报告了拟议的超宽带与基于全球价值链方法的超宽带的比较。部分5说明使用真实数据集的方法。部分6提供总体的结论和建议。
2.基于GV方法的威布尔函数的UPL求解分布
Krishnamoorthy等人[4)提出至少包括UPL的来自威布尔的未来观察每个点的分布地点 在哪里和.他们计算了使用下面的模拟研究。
的给定值,,,,,则重复以下步骤(100000)次。(我) 独立同分布(i.i.d)随机变量是由极值分布(0,1)和mles,计算。(ii)对于给定的,重复以下过程时代。(一世) I.I.D.随机变量由极值(0,1)分布生成。(2) 基于这些样本的排序统计量计算。(3)数量和计算。
然后生成的百分位数的值为.注意,基于UPL的关键量的分布不依赖于任何未知参数,因此它是一种精确的方法。
3.所提出的基于近常电力转换的UPL
3.1.建议的接近正常的电力改造
提出的变换是基于控制正态性的两个关键特征,即正态分布的对称性和尾部行为。
让遵循两个参数Weibull ()分布和形状参数是已知的。我们考虑一个变换r.v。权力的地方被选中使变换变量的分布具有非常小的偏离对称性,同时具有非常接近于具有相同均值和方差的正态分布的尾态。直接的计算表明,分布的偏态性是由 哪个是比值的函数,不依赖于尺度参数.治疗作为…的函数解决是,该变量的分布在哪里,正好对称。为了实现对尾部行为的控制,注意到了变形房车的中心时刻。是的均值和标准差给予 此外,正态分布的第一个分位数和标准偏差是由 类似地,如果是Weibull的第th分位数分布,,它很容易跟随th分位数的分布是由 制作分配的尾部行为非常接近正常分布的正常分布和标准偏差的正常分布,我们解决了方程式为常用的选择和求一个双边区间的解和.控制转化R.V分布的对称性和尾行为。同时接近正态分布,建议取在哪里威力堪比威布尔房车。.从(3.3)和(3.4)因此,对于这个选择,这两个分位数之间的区别和是由在哪里是常数吗.价值对于各种常用的选择载于附表1.
|
|||||||||||||||||||||||||||||||||||
我们注意到这个常数对于常用的重要性水平相当小,进一步的数值研究表明,所提出的变换对于较小的值是非常好的精度(说),为小至中值(说),其涵盖参数空间的合理子集和通常遇到的实际情况。我们记得选择所有人都是统一的自是免费的.当是未知的,我们取,更换由它的格尔.在后面的文章中,我们把这种转换称为接近正常功率转换(CNPT)。
3.2.基于CNPT的UPL
让随机抽样正态分布的均值和标准偏差.让和为样本均值和样本标准差。然后戴维斯和麦克尼科尔斯[2]建议UPL至少包括的从相同的正态分布的未来观察地点 其中的价值对于所选值和水平下面这个方程的解是什么 在哪里累积分布函数(Cdf)是非中心的吗随机变数Df和非中心性参数,是标准正态分布的反Cdf,是常用的函数和吗分布的Cdf有参数吗和.
让随机抽样从威布尔分布。让是使用的正常的UP(3.5),根据;在哪里.然后建议的UPL预计至少包括在内吗的威布尔的未来观测结果每个点的分布已知形状参数的位置,概率.当形状参数是未知的,我们建议用它的mle来代替它和拟议的上市是在哪里.注意到了是一致的估计吗.因此对于大样本预计将接近.小样本行为通过仿真研究。
3.3.基于Box-Cox变换和Kullback-Leibler信息(BCKL)的UPL
Hernández和约翰逊[5]提出了转型 威布尔r.v。近似的分布正常并使用解决方案对于已知的形状参数使得Kullback-Leibler分布之间的信息最小化的均值和方差相同的正态分布.Yang等人使用了这种转换[6],用于从威布尔获取单个未来观测的预测区间分布。将此转换用于所考虑的UPL问题,aWeibull分布的UPL为在哪里是使用(3.5).如前所述,未知值为会被它的mle取代吗.具有上述大样本特性,并对其小样本行为进行了仿真研究。
4.比较
在本节中,我们比较了上述两种建议的超宽带与基于GV方法的超宽带的性能——基于超宽带的预期长度和预期覆盖范围的模拟研究。
对于参数的固定值,、样本量,我们生成随机数来自威布尔分布,并设置,在哪里和.正常的占有为基础,和使用(3.5)和分别。然后和ups是基于提议的CNPT和Weibull的BCKL变换吗用已知形状参数分布.当形状参数是未知的,我们建议用它的mle来代替它.对于同一样品,使用的GV方法使用(2.1))部分中描述的程序2.接下来,我们生成组随机数字说从威布尔分布,并设置在哪里是下订单统计为.这个过程重复10万次。然后是事件的比例,和,在这些100000中,重复是基于正常近似,BCKL变换和GV方法的全部覆盖概率。基于上面讨论的三种方法中的每一个的平均100000次是相应的万能的模拟预期长度。模拟的预期长度和预期的覆盖范围,,在表格中报告2和3.分别。的组合,,是选择。价值这些组合是使用(3.6).
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| *假设不明标度和形状参数获得结果. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| *假设不明标度和形状参数获得结果 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4.1.模拟研究的结果
在表格中清楚地看到突出的事实之后2.(1)基于cnpt的ups即使在小样本量,如, 对所有人,对于所有检验过的组合,,.覆盖范围均匀地比基于GV方法的覆盖范围略大,预期长度略短。(2)如部分所述2, GV方法是准确的,这一点在模拟研究中得到了体现,因为它的覆盖范围非常接近名义覆盖概率。(3)基于BCKL变换的UPLs具有接近名义覆盖概率。
基于这些观察,我们推荐了建议的基于CNPT-和BCKL转换的UPLs,至少包括的来自威布尔的未来观察每个点的分布的位置。
5.说明性的例子
如今氯乙烯是世界上五十多个生产的化学品之一。它的生产在过去的20年里几乎翻了一番,目前估计全球约2700万吨/年。水中高浓度的氯乙烯可引起癌症和肝脏损伤。因此,对人类有毒和致癌,必须更加关注氯乙烯作为地下水污染物。在本节中,我们说明了在部分中讨论的方法2和3.用真实的数据集。
这里使用的数据是氯乙烯浓度从清洁的上升监测井收集。Krishnamoorthy等人[4]显示了这些数据与威布尔分布的极好拟合。我们计算了各种Weibull超能力,并将它们与Krishnamoorthy等人给出的超能力进行了比较[4].该数据集代表每升微克氯化乙烯氯浓度(),即清洁升级监测井的十亿分之数为5.1、2.4、0.4、0.5、2.5、0.1、6.8、1.2、0.5、0.6、5.3、2.3、1.8、1.2、1.3、1.1、0.9、3.2、1.0、0.9、0.4、0.6、0.6、8.0、0.4、2.7、0.2、2.0、0.2、0.5、0.8、2.0、2.9、0.1、4.0。
将Kolmogorov-Smirnov测试用于拟合Weibull分布的数据集导致相应的P值(2-tail) 0.94,说明Weibull模型对于上述数据集是一个很好的模型。在这里,样本均值为1.88,样本标准差为1.95。初速表示上述数据集是中度倾斜的。为了与Krishnamoorthy等人的95% ups进行比较[4]我们选择了各种组合,,载于附表4.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
从表4,似乎提出的UPLs比Krishnamoorthy等人的少一点[4].我们还注意到,所有的ups都远远高于美国环境保护局(USEPA)建议的氯乙烯浓度标称范围(2.0-2.4),这表明未来的氯乙烯浓度可能会超过标称水平,因此有必要对这些井进行监测。
6.总体结论
所提出的正常近似表现出显着良好的性能,即使对于几乎所有参数组合的小样本尺寸,用于估计包含至少至少包含的UP的的威布尔分布的位置。对于实际情况中常见的形状参数小、样本量小的情况,正态逼近的优越性更强。它还有一个额外的优点,就是计算简单,从实践者的角度来看,这是很重要的。
参考文献
- D. K.Bhaumik和R. D.Gibbons,“至少是一面近似预测间隔p的米在每一个r位置。”Technometrics.,第48卷,第48期1,页112-119,2006。视图:出版商的网站|谷歌学者|MathSciNet
- C. B. Davis和R. J. McNichols,“至少是单侧音程p的米从每个人的正常人口观察r未来的场合,”Technometrics.,第29卷,第2期3,第359 - 370,1987年。视图:谷歌学者
- K. Krishnamoorthy, T. Mathew,和S. Mukherjee,“基于正态分布的方法:预测、容忍区间和应力强度可靠性,”Technometrics.,卷。50,不。1,pp。69-78,2008。视图:出版商的网站|谷歌学者
- “基于广义变量方法的威布尔分布的置信极限和预测极限,”统计计划与推理杂志,第139卷,第139期8, pp. 2675 - 2684,2009。视图:出版商的网站|谷歌学者|Zentralblatt数学
- F. Hernández和R. A. Johnson,“向常态转变的大样本行为”,美国统计协会杂志,第75卷,第5期372页,855-861,1980。视图:出版商的网站|谷歌学者|Zentralblatt数学
- 杨振宇,“构造威布尔预测区间的变换方法”,计算统计和数据分析号,第43卷。3,页357-368,2003。视图:出版商的网站|谷歌学者|MathSciNet
版权
版权所有©2011 H. V. Kulkarni和S. K. Powar。这是一篇发布在知识共享署名许可协议,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。