概率与统计杂志

PDF
概率与统计杂志/2011/文章

研究文章|开放获取

体积 2011 |文章的ID 863274 | https://doi.org/10.1155/2011/863274

H. V. Kulkarni,S. K. Powar 威布尔分布的一种简单正态逼近及其在预测上限估计中的应用",概率与统计杂志 卷。2011 文章的ID863274 10 页面 2011 https://doi.org/10.1155/2011/863274

威布尔分布的一种简单正态逼近及其在预测上限估计中的应用

学术编辑:答:Thavaneswaran
收到了 2011年5月30日
接受 2011年9月24日
发表 2011年11月20日

摘要

我们提出了一个简单的接近正态逼近威布尔随机变量(r.v.),并考虑了至少包含的预测上限估计问题l的威布尔分布r位置,基于提出的近似和著名的Box-Cox正态近似。基于蒙特卡罗模拟的对比研究表明,基于正态逼近的威布尔分布UPLs优于基于现有广义变量(GV)方法的UPLs。基于正态近似的ups比GV方法有更大的覆盖概率,特别是对于分布高度倾斜的小未知形状参数,以及在工业应用中常见的小样本容量。结果说明了一个真实的数据集的从业者。

1.介绍

威布尔分布由于其灵活的形状和建立大范围失效率模型的能力而被广泛应用于可靠性和生存分析。从理论上讲,它可以作为一种极值分布形式导出,它控制了许多相互竞争的失效过程中“最薄弱环节”出现的时间。它的特殊情况与形状参数 是常用的径向误差大小建模的瑞利分布吗xy坐标误差是均值为零、标准差相同的独立正态变量 对应于广泛使用的指数分布。

遵循带有尺度参数的威布尔分布 和形状参数 .pdf的 是由 如果随机样本的大小 给出了一个重要的统计问题是构建一个 推,这样 未来的样本值在每个的UPL之下 地点(或时间段)。weibull分布数据的这一问题在文献中较少被关注。这种预测极限对于工业生产过程运行过程中的监测和控制问题非常有用,特别是当感兴趣的特性较小时。在危险废物管理设施(HWMF)附近的地下水质量监测方面,超高效液相法也很有用。例如,监测地下水水质,一系列的 样本,也就是对污染物如氯乙烯的测量 在HWMF附近的监测井经常与基于样本的UPL进行比较 从设施的一个或多个上梯度取样点获得的测量结果。如果至少 来自这些的样本 从每个 地点小于UPL,则认为设施符合规定。如果没有达到这一要求,那么监测像氯乙烯这样的污染物就更有必要了。博米克和长臂猿[1讨论了超高效液相色谱在分子遗传学和工业质量控制等领域的应用。戴维斯及麦克尼克斯[2]得到假设父分布正态性的UPL。博米克和长臂猿[1Krishnamoorthy等人[3.提出了用于构建用于伽马分布的近似方法。Krishnamoorthy等人[4]使用GV方法构造Weibull分布的UPL。

在本文中,我们提出了当形状参数为威布尔分布时的一种简单的近似正态变换 是已知的。这种变换基于正态分布的两个关键特征,即对称性和尾部行为。该变换与已知的Box-Cox变换相结合,得到了形状参数时Weibull分布的近似ups 是已知的。对于未知形状参数 ,用它的极大似然估计(mle)代替它,得到同样好的结果。通过对所提出的超强电偶与现有超强电偶的仿真比较,发现所提出的超强电偶即使在小样本情况下也优于其竞争对手,尤其是在实际应用中经常遇到的小形状参数情况下。

文章组织如下。部分2简要回顾了Krishnamoorthy等人开发的基于全球价值链方法的通用语言。[4].部分3.描述了所提出的正态逼近方法,并基于所提出的和Box-Cox变换发展了威布尔分布的UPL。部分4就模拟的预期覆盖范围和预期长度,报告了拟议的超宽带与基于全球价值链方法的超宽带的比较。部分5说明使用真实数据集的方法。部分6提供总体的结论和建议。

2.基于GV方法的威布尔函数的UPL求解 分布

Krishnamoorthy等人[4)提出 至少包括UPL 来自威布尔的未来观察 每个点的分布 地点 在哪里 .他们计算了 使用下面的模拟研究。

的给定值 , ,则重复以下步骤 (100000)次。(我) 独立同分布(i.i.d)随机变量 是由极值分布(0,1)和mles 计算。(ii)对于给定的 重复以下过程 时代。(一世) I.I.D.随机变量 由极值(0,1)分布生成。(2) 基于这些样本的排序统计量 计算。(3)数量 计算。

然后 生成的百分位数 的值 .注意,基于UPL的关键量的分布不依赖于任何未知参数,因此它是一种精确的方法。

3.所提出的基于近常电力转换的UPL

3.1.建议的接近正常的电力改造

提出的变换是基于控制正态性的两个关键特征,即正态分布的对称性和尾部行为。

遵循两个参数Weibull ( )分布和形状参数 是已知的。我们考虑一个变换 r.v。 权力的地方 被选中使变换变量的分布 具有非常小的偏离对称性,同时具有非常接近于具有相同均值和方差的正态分布的尾态。直接的计算表明,分布的偏态性 是由 哪个是比值的函数 ,不依赖于尺度参数 .治疗 作为…的函数 解决 ,该变量的分布 在哪里 ,正好对称。为了实现对尾部行为的控制,注意到了 变形房车的中心时刻。 的均值和标准差 给予 此外, 正态分布的第一个分位数 和标准偏差 是由 类似地,如果 Weibull的第th分位数 分布, ,它很容易跟随 th分位数 的分布 是由 制作分配的尾部行为 非常接近正常分布的正常分布和标准偏差的正常分布 ,我们解决了方程式 为常用的选择 求一个双边区间的解 .控制转化R.V分布的对称性和尾行为。 同时接近正态分布,建议取 在哪里 威力堪比威布尔房车。 .从(3.3)和(3.4)因此,对于这个选择 ,这两个分位数之间的区别 是由 在哪里 是常数吗 .价值 对于各种常用的选择 载于附表1


0.010 0.025 0.050 0.095 0.975 0.990

−0.0283 −0.0063 0.0044 0.0009 0.0072 0.0170.

我们注意到这个常数 对于常用的重要性水平相当小 ,进一步的数值研究表明,所提出的变换对于较小的值是非常好的精度 (说 ),为小至中值 (说 ),其涵盖参数空间的合理子集和通常遇到的实际情况。我们记得选择 所有人都是统一的 是免费的 .当 是未知的,我们取 ,更换 由它的格尔 .在后面的文章中,我们把这种转换称为接近正常功率转换(CNPT)。

3.2.基于CNPT的UPL

随机抽样 正态分布的均值 和标准偏差 .让 为样本均值和样本标准差。然后戴维斯和麦克尼科尔斯[2]建议UPL至少包括 从相同的正态分布的未来观察 地点 其中的价值 对于所选值 和水平 下面这个方程的解是什么 在哪里 累积分布函数(Cdf)是非中心的吗 随机变数 Df和非中心性参数 是标准正态分布的反Cdf 是常用的函数和吗 分布的Cdf有参数吗

随机抽样 从威布尔 分布。让 是使用的正常的UP(3.5),根据 ;在哪里 .然后 建议的UPL预计至少包括在内吗 威布尔的未来观测结果 每个点的分布 已知形状参数的位置 ,概率 .当形状参数 是未知的,我们建议用它的mle来代替它 和拟议的上市是 在哪里 .注意到了 是一致的估计吗 .因此对于大样本 预计将接近 .小样本行为 通过仿真研究。

3.3.基于Box-Cox变换和Kullback-Leibler信息(BCKL)的UPL

Hernández和约翰逊[5]提出了转型 威布尔r.v。 近似的分布 正常并使用解决方案 对于已知的形状参数 使得Kullback-Leibler分布之间的信息最小化 的均值和方差相同的正态分布 .Yang等人使用了这种转换[6],用于从威布尔获取单个未来观测的预测区间 分布。将此转换用于所考虑的UPL问题,a Weibull分布的UPL为 在哪里 是使用(3.5).如前所述,未知值为 会被它的mle取代吗 .具有上述大样本特性,并对其小样本行为进行了仿真研究。

4.比较

在本节中,我们比较了上述两种建议的超宽带与基于GV方法的超宽带的性能——基于超宽带的预期长度和预期覆盖范围的模拟研究。

对于参数的固定值 、样本量 ,我们生成 随机数 来自威布尔 分布,并设置 在哪里 .正常的占有为基础, 使用(3.5) 分别。然后 ups是基于提议的CNPT和Weibull的BCKL变换吗 用已知形状参数分布 .当形状参数 是未知的,我们建议用它的mle来代替它 .对于同一样品 ,使用的GV方法使用(2.1))部分中描述的程序2.接下来,我们生成 随机数字说 从威布尔 分布,并设置 在哪里 下订单统计 .这个过程重复10万次。然后是事件的比例 ,在这些100000中,重复是基于正常近似,BCKL变换和GV方法的全部覆盖概率。基于上面讨论的三种方法中的每一个的平均100000次是相应的万能的模拟预期长度。模拟的预期长度和预期的覆盖范围 , 在表格中报告23.分别。的组合 , 是选择。价值 这些组合是使用(3.6)


全球之声 CNPT. BCKL 全球之声 CNPT. BCKL 全球之声 CNPT. BCKL



0.1 0.5 0.38 0.37 0.37 0.25 0.25 0.25 0.19 0.18 0.18
1 0.18 0.18 0.18 0.15 0.15 0.15 0.13 0.13 0.13
3. 0.12 0.12 0.12 0.11 0.11 0.11 0.11 0.11 0.11
1 0.5 3.80 3.76 3.77 2.50 2.47 2.46 1.85 1.79 1.78
1 1.79 1.78 1.78 1.51 1.50 1.49 1.33 1.31 1.30
3. 1.19 1.19 1.19 1.13 1.13 1.13 1.09 1.09 1.09
5 0.5 19.10 18.63 18.71 12.53 12.31 12.28 9.25 9.00 8.93
1 9.00 8.90 8.91 7.55 7.48 7.46 6.64 6.54 6.51
3. 5.96 5.94 5.94 5.67 5.65 5.65 5.46 5.44 5.43
50 0.5 190.16 186.02 186.79 124.82 123.47 123.08 92.75 89.95. 89.25
1 90.03 88.84 89.00 75.45 74.85 74.73 66.36 65.44 65.18
3. 59.64 59.40 59.44 56.70 56.54 56.51 54.62 54.39 54.32
One hundred. 0.5 383.79 374.67 376.24 251.24 247.09 246.32 184.91 180.11 178.70
1 179.98 178.41 178.72 151.07 149.92 149.66 132.80 130.95 130.43
3. 119.27 118.77 118.83 113.40 113.11 113.04 109.24 108.74 108.59



0.1 0.5 0.27 0.27 0.26 0.18 0.18 0.18 0.14 0.13 0.13
1 0.15 0.15 0.15 0.13 0.13 0.13 0.11 0.11 0.11
3. 0.11 0.11 0.11 0.11 0.11 0.11 0.10 0.10 0.10
1 0.5 2.66 2.64 2.63 1.82 1.79 1.78 1.38 1.34 1.32
1 1.51 1.50 1.50 1.29 1.27 1.27 1.14 1.13 1.12
3. 1.13 1.12 1.12 1.08 1.07 1.07 1.04 1.03 1.03
5 0.5 13.34 13.20 13.16 9.11 8.96 8.88 6.91 6.68 6.60
1 7.55 7.50 7.49 6.43 6.39 6.36 5.74 5.63 5.60
3. 5.63 5.61 5.61 5.38 5.36 5.36 5.20 5.17 5.16
50 0.5 133.95 132.56 130.91 91.13 89.64 88.90 69.09 66.84 66.04
1 75.44 75.21 74.90 64.36 63.77 63.47 57.36 56.35 56.00
3. 56.31 56.16 56.11 53.78 53.59 53.56 51.98 51.72 51.63
One hundred. 0.5 266.35 263.65 264.21 182.16 178.70 177.11 138.26 133.44 132.09
1 151.03 149.96 149.92 128.62 127.63 127.06 114.74 112.72 112.11
3. 112.63 112.38 112.23 107.49 107.24 107.02 104.02 103.40 103.22



0.1 0.5 1.65 1.41 1.46 0.75 0.71 0.73 0.49 0.47 0.47
1 0.36 0.33 0.33 0.26 0.25 0.25 0.22 0.21 0.21
3. 0.15 0.14 0.15 0.14 0.13 0.13 0.13 0.13 0.13
1 0.5 16.54 14.00 14.60 7.55 7.13 7.26 4.87 4.64 4.67
1 3.56 3.28 3.34 2.59 2.51 2.54 2.15 2.10 2.11
3. 1.48 1.44 1.45 1.35 1.34 1.34 1.28 1.27 1.27
5 0.5 82.85 70.44 73.11 37.77 35.69 36.25 24.36 23.18 23.40
1 17.79 16.52 16.75 12.93 12.54 12.67 10.73 10.47 10.53
3. 7.40 7.22 7.26 6.77 6.70 6.73 6.41 6.36 6.37
50 0.5 830.35 710.92 733.32 376.12 355.27 362.96 242.46 232.30 234.39
1 177.94 164.84 166.79 129.32 125.54 127.11 107.39 104.72 105.50
3. 74.12 72.18 72.67 67.71 67.05 67.21 64.11 63.63 63.68
One hundred. 0.5 1650.20 1408.03 1456.67 754.87 713.90 725.43 485.52 464.88 467.82
1 356.26 328.69 334.60 258.73 251.05 252.98 214.54 209.88 210.49
3. 148.20 144.36 145.19 135.32 134.11 134.56 128.23 127.21 127.43

*假设不明标度和形状参数获得结果

全球之声 CNPT. BCKL 全球之声 CNPT. BCKL 全球之声 CNPT. BCKL



0.1 0.5 94.89 96.10 94.72 95.04 96.39 94.95 94.89 95.91 94.80.
1 95.01 96.23 94.87 94.95 96.03 94.53 94.90 95.79 95.14
3. 94.92 95.77 96.04 95.12 95.05 94.68 94.95 95.92 94.71
1 0.5 95.00 96.09 94.75 95.07 96.43 94.94 94.95 95.61 94.47
1 94.97 96.01 94.57 95.09 96.33 94.82 94.93. 95.55 94.94
3. 94.86 96.66 94.44 95.01 95.71 94.41 94.87 95.38 95.37
5 0.5 94.94 96.36 94.88 94.92 95.73 94.53 95.02 95.42 94.60
1 94.94 96.13 94.79 95.00 96.41 94.91. 94.86 95.63 94.61
3. 95.01 97.01 94.69 94.96 95.58 94.68 94.86 95.23 94.57
50 0.5 94.86 96.76 95.76 94.91. 95.61 95.02 95.07 95.84 94.88
1 95.01 96.09 95.24 94.94 95.64 94.49 94.86 95.44 95.43
3. 94.93. 96.46 95.71 95.08 95.76 94.83 94.77 96.17 96.05
One hundred. 0.5 95.04 95.96 95.30 94.95 94.75 94.81 95.06 96.69 95.06
1 94.96 96.32 95.97 95.03 95.06 94.44 95.03 96.45 95.54
3. 95.09 96.83 96.46 95.05 95.07 94.99 94.87 97.03 95.38



0.1 0.5 95.08 96.14 94.68 94.89 96.39 94.90 95.09 95.76 94.92
1 94.99 95.91 94.48 94.87 97.12 95.60 94.92 94.91. 94.58
3. 94.92 95.29 94.44 94.90 94.98 94.87 94.89 95.72 95.62
1 0.5 94.92 96.52 95.08 94.98 96.31 94.79 94.97 95.85 94.48
1 95.01 96.02 94.65 95.15 96.92 95.40 95.03 95.91 94.76
3. 95.03 95.24 94.47 95.09 94.63 94.52 94.93. 96.60 95.99
5 0.5 94.98 96.34 94.88 94.95 96.35. 94.88 94.99 95.84 94.57
1 95.14 96.40 95.00 94.96 96.37 94.83 95.10 95.55 94.42
3. 95.03 94.47 94.52 95.06 95.37 94.91. 94.95 95.58 94.61
50 0.5 95.02 96.13 94.52 94.96 95.19 95.10 94.96 95.97 94.78
1 94.99 95.22 94.61 94.94 95.52 94.70. 95.10 95.47 94.61
3. 95.10 95.31 94.50 94.95 95.27 94.68 95.16 95.13 94.58
One hundred. 0.5 95.09 95.23 94.72 94.86 95.56 94.55 95.13 95.55 94.45
1 94.98 95.17 94.68 94.92 94.90 94.64 95.15 95.84 94.60
3. 95.04 95.41 94.73 95.04 95.77 95.05 94.93. 95.99 94.46



0.1 0.5 94.95 95.73 94.51 95.18 96.34 94.97 95.07 95.99 94.73
1 94.92 95.41 94.19 95.01 96.31 95.05 95.18 95.76 94.72
3. 95.03 95.51 94.21 95.13 96.46 94.85 95.01 95.66 94.53
1 0.5 94.90 95.36 94.16 95.04 96.00 94.68 95.20 95.89 94.54
1 94.94 95.66 94.49 95.16 96.11 94.64 95.09 95.53 94.61
3. 94.93. 95.68 94.86 95.07 95.87 94.41 95.08 95.18 94.64
5 0.5 95.02 95.57 94.29 95.18 95.64 94.42 95.02 95.23 94.55
1 94.96 95.01 94.95 95.05 95.99 94.75 95.09 95.46 94.66
3. 94.84 94.71 94.06 95.01 95.21 94.14 95.18 95.49 94.59
50 0.5 95.00 95.11 94.30 94.94 95.68 94.82 95.13 95.52 94.68
1 94.97 95.91 94.50 94.85 95.86 94.55 95.13 95.07 94.54
3. 94.86 95.86 94.81 95.19 95.78 95.25 95.13 95.62 94.64
One hundred. 0.5 94.89 95.53 94.60 94.97 95.41 94.69 95.09 95.27 94.50
1 94.95 95.43 94.37 95.02 95.57 94.52 95.05 95.84 94.47
3. 95.06 95.93 94.41 95.09 95.62 94.85 95.12 95.93 94.60

*假设不明标度和形状参数获得结果
4.1.模拟研究的结果

在表格中清楚地看到突出的事实之后2(1)基于cnpt的ups即使在小样本量,如 , 对所有人 对于所有检验过的组合 , .覆盖范围均匀地比基于GV方法的覆盖范围略大,预期长度略短。(2)如部分所述2, GV方法是准确的,这一点在模拟研究中得到了体现,因为它的覆盖范围非常接近名义覆盖概率。(3)基于BCKL变换的UPLs具有接近名义覆盖概率。

基于这些观察,我们推荐了建议的基于CNPT-和BCKL转换的UPLs,至少包括 来自威布尔的未来观察 每个点的分布 的位置。

5.说明性的例子

如今氯乙烯是世界上五十多个生产的化学品之一。它的生产在过去的20年里几乎翻了一番,目前估计全球约2700万吨/年。水中高浓度的氯乙烯可引起癌症和肝脏损伤。因此,对人类有毒和致癌,必须更加关注氯乙烯作为地下水污染物。在本节中,我们说明了在部分中讨论的方法23.用真实的数据集。

这里使用的数据是氯乙烯浓度从清洁的上升监测井收集。Krishnamoorthy等人[4]显示了这些数据与威布尔分布的极好拟合。我们计算了各种Weibull超能力,并将它们与Krishnamoorthy等人给出的超能力进行了比较[4].该数据集代表每升微克氯化乙烯氯浓度( ),即清洁升级监测井的十亿分之数为5.1、2.4、0.4、0.5、2.5、0.1、6.8、1.2、0.5、0.6、5.3、2.3、1.8、1.2、1.3、1.1、0.9、3.2、1.0、0.9、0.4、0.6、0.6、8.0、0.4、2.7、0.2、2.0、0.2、0.5、0.8、2.0、2.9、0.1、4.0。

将Kolmogorov-Smirnov测试用于拟合Weibull分布的数据集导致相应的P值(2-tail) 0.94,说明Weibull模型对于上述数据集是一个很好的模型。在这里 ,样本均值为1.88,样本标准差为1.95。初速 表示上述数据集是中度倾斜的。为了与Krishnamoorthy等人的95% ups进行比较[4]我们选择了各种组合 , ,载于附表4


全球之声 CNPT. BCKL

1 2 10 1.577 5.483 5.298 5.336
2 2 10 3.022 14.066 13.371 13.801
1 3. 10 1.033 3.618 3.469 3.466
2 3. 10 1.879 6.797 6.566 6.646
3. 3. 10 3.177 15.149 14.574 15.084

从表4,似乎提出的UPLs比Krishnamoorthy等人的少一点[4].我们还注意到,所有的ups都远远高于美国环境保护局(USEPA)建议的氯乙烯浓度标称范围(2.0-2.4),这表明未来的氯乙烯浓度可能会超过标称水平,因此有必要对这些井进行监测。

6.总体结论

所提出的正常近似表现出显着良好的性能,即使对于几乎所有参数组合的小样本尺寸,用于估计包含至少至少包含的UP 的威布尔分布 的位置。对于实际情况中常见的形状参数小、样本量小的情况,正态逼近的优越性更强。它还有一个额外的优点,就是计算简单,从实践者的角度来看,这是很重要的。

参考文献

  1. D. K.Bhaumik和R. D.Gibbons,“至少是一面近似预测间隔p在每一个r位置。”Technometrics.,第48卷,第48期1,页112-119,2006。视图:出版商的网站|谷歌学者|MathSciNet
  2. C. B. Davis和R. J. McNichols,“至少是单侧音程p从每个人的正常人口观察r未来的场合,”Technometrics.,第29卷,第2期3,第359 - 370,1987年。视图:谷歌学者
  3. K. Krishnamoorthy, T. Mathew,和S. Mukherjee,“基于正态分布的方法:预测、容忍区间和应力强度可靠性,”Technometrics.,卷。50,不。1,pp。69-78,2008。视图:出版商的网站|谷歌学者
  4. “基于广义变量方法的威布尔分布的置信极限和预测极限,”统计计划与推理杂志,第139卷,第139期8, pp. 2675 - 2684,2009。视图:出版商的网站|谷歌学者|Zentralblatt数学
  5. F. Hernández和R. A. Johnson,“向常态转变的大样本行为”,美国统计协会杂志,第75卷,第5期372页,855-861,1980。视图:出版商的网站|谷歌学者|Zentralblatt数学
  6. 杨振宇,“构造威布尔预测区间的变换方法”,计算统计和数据分析号,第43卷。3,页357-368,2003。视图:出版商的网站|谷歌学者|MathSciNet

版权所有©2011 H. V. Kulkarni和S. K. Powar。这是一篇发布在知识共享署名许可协议,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。


更多相关文章

PDF 下载引用 引文
下载其他格式更多的
订单打印副本命令
的观点8634
下载1301.
引用

相关文章

年度文章奖:由主编评选的2020年杰出研究贡献。阅读获奖物品