概率与统计学报

概率与统计学报/2019年/文章
特殊的问题

生物统计学的新进展

查看此特殊问题

研究文章|开放获取

体积 2019年 |文章ID. 7173416 | https://doi.org/10.1155/2019/7173416

黄a,蒋丽君 关于两个独立对数正态分布的两个变异系数比值的改进小样本推断“,概率与统计学报 卷。2019年 文章ID.7173416 7. 页面 2019年 https://doi.org/10.1155/2019/7173416

关于两个独立对数正态分布的两个变异系数比值的改进小样本推断

客座编辑:徐张
收到了 05年7月2018年
修改后的 2018年10月29日
公认 2019年1月27日
发表 2019年3月3日

摘要

如果没有使用产生一致测量的研究工具和程序的能力,研究人员将无法得出结论,制定理论或使索赔对其结果的普遍性。在统计数据中,变异系数通常用作测量的可靠性指标。因此,比较变异系数是特别兴趣的。此外,Lognormal分布经常用于从诸如健康和医学研究的许多领域建模数据。在本文中,我们提出了一种模拟的Bartlett校正的似然比方法,以获得有关Lognormal分布的两个变化系数的比率的推断。仿真研究表明,即使样品尺寸小,所提出的方法也非常准确。

1.介绍

在健康和医学研究中,很常见的是感兴趣的变量, 如生存时间,只需要正值,并且该变量的底层分布非常偏向右侧。在这种情况下,通常假设的正态分布 不合适。第一次变换的标准方法 这样变化的变量 通常是分布式的。然后可以应用为正态分布开发的现有统计理论。为了 和分布的 对右侧有高度偏向,最常见的转化是对数转换。换句话说, 通常是分布式的。因此, 是逻辑分发的。详细审查算法分布的理论可以在Aitchison和Brown中找到[1,克罗和西米祖[2].实际上,恐惧等人[3.]研究了实验室使用的激素测定的可变性和再现性,具有执行大量测试的能力。他们假设实验室中使用的激素样本是独立的逻辑分布。在这种情况下,知道每个样本是否产生一致的测量,它特别感兴趣。

变异系数( 被定义为标准偏差与平均值的比率,其中假设平均值为非零。这是评估测量程序可靠性的重要指标。因此,在恐惧等中考虑的问题。[3.如果在每个实验室中使用的变化系数是相同的,则可以被视为测试。

在数学上,如果是一个随机变量 是对数正态分布吗 然后 是正态分布吗 和方差 众所周知 因此,变异系数,

南权[4.[比较了独立逻辑分布的两个系数的各种近似间隔估计。它们的仿真结果表明,这些方法的经验覆盖率令人满意地靠近中等样本大小的标称覆盖率。本文的目的是开发一种更准确的方法,以获得独立逻辑分布的两个变化系数的推断。此外,可以推广所提出的方法,以测试是否有变异系数 独立对数正态分布是异质的。

本文的其余部分组织如下。部分2综述了获取有关来自独立日志正规分布的两个变化系数的推断的现有方法。在章节中提出了模拟的Bartlett校正似然方法3..介绍了一个真实的数据示例4.为了说明本文讨论的方法的应用。进行仿真研究以比较本文中讨论的方法的准确性5..对变异系数同质性检验的推广 独立对数正态分布在第一部分讨论6..一些结论备注记录在一节中7.

2.两个独立对数正态分布的两个变异系数比值的现有推断方法

来自Lognormal的样本 分布,在哪里 然后 样本来自均值正态分布 和方差 从 (2), 变异系数为 南权[4.]比较了四种方法的置信区间 以下是在南和权所讨论的方法的摘要[4.]:(1)瓦尔德式方法设观测检验统计量为 在哪里 然后 渐近地分布为标准正态分布。重要功能 在哪里 是标准正态分布的累积分布函数。(2)事业中类型的方法设观测检验统计量为 在哪里 然后 也渐近分布为标准正态分布。重要功能 (3)日志的方法设观测检验统计量为 在哪里 然后 也渐近分布为标准正态分布。重要功能 (4)方差估计方法估算恢复(移动器)这是一种将直接获得近似的方法 置信区间 只要。让 然后是一个近似的 置信区间 在哪里 因此,近似 置信区间 如果 为了 与Log方法相同,MOVER方法与Log方法相同。请注意Hasan和Krishamoorthy [5.]提出了一种改进的MOVER方法版本。

3.提出的方法

在本节中,我们将首先审查基于可能性的方法和Bartlett校正似然比方法。由于对于Bartlett校正的似然比方法所需的Bartlett调整非常难以获得,因此提出了一种数值算法以近似Bartlett调整。然后应用该方法以获得两个独立的逻辑分布的两个变形系数的推断。

3.1。基于可能性的方法和Bartlett校正似然比方法

是已知分布的样本,具有概率密度函数 在哪里 是一个 -参数的维向量。让 这尺寸 成为兴趣的参数。对数似然函数是 在Barndorff-Nielsen和Cox所述的规律性条件下[6.],我们拥有标准化的最大可能性估计(MLE)统计 和可能性比率统计 渐近卡方分布 度afreedom, 在哪里 是整体MLE,值是多少 最大化 大约是Fisher的预期信息的反比力。当感兴趣的参数是 Barndorff-nielsen和Cox [6.表明可以得到类似的统计数据。标准化的MLE统计量成为 在哪里 可以用delta法来近似,它的形式是 似然比统计量为 在哪里 是由最大化获得的约束的MLE 对于给定的 价值。这两个 是渐近的 按照Fraser的定义[7.],重要功能 被定义为 可用于获得推论 在哪里 观察到的值是 分别。特别是 信心地区 分别在哪里 百分位的

众所周知,这两种渐近方法具有收敛速度 它们被称为一阶方法。在统计文献中,为了提高上述方法的准确性,存在各种各样的调整。特别是Barndorff-Nielsen [8.9.]引入了修正的符号对数似然比统计量的三阶方法。但是,该方法仅适用于感兴趣的标量参数。另一方面,Bartlett [10]提出了似然比统计的改造,使得转化的统计学的平均值匹配渐近分布的平均值。进一步来说, 在哪里 巴特利特调整是这样的吗 被称为巴特利特修正似然比统计量。一个明显的选择 巴特利特[10]表明,Bartlett校正的似然比统计也是渐近的 分布,具有收敛速度 因此,它是一种极其准确的方法。尽管如此,除了一些明确的问题, 很难得到,这阻碍了这种方法在应用统计学中的应用。Barndorff-Nielsen和Cox等文献综述了Bartlett校正似然比方法[6.].

虽然在数学上,明确的封闭形式 甚至是渐近扩张 难以获得,我们提出以下算法的方式获取 从数字上讲,这是一种估计

鉴于 是尺寸的样品吗 从具有已知概率密度函数的分布

感兴趣:推理有关

:总体最大可能性估计 约束极大似然估计 和观察到的似然比统计

步骤1:模拟 数据大小的样本

第2步:对于每组模拟数据,获得模拟观察的似然比统计。结果,我们有

第3步: 计算 这是一种估计差异统计的平均值。因此,我们有

第四步:观察到的模拟巴特莱特校正似然比统计 是渐近分布的 具有第四阶收敛速度。因此,意义函数是 信心地区

作为最后的说明,提出的算法,理论上的选择 应该尽可能的大。然而,更大的 是否需要更多的计算才能得到 此外,模型中存在的参数越多,模型的参数越大 必须。我们建议使用试用版错误 直到 是记忆。

3.2.应用似然法对两个独立对数正态分布的两个变异系数的比值进行推理

然后 通常以平均分布 和方差 而且, 是独立的。因此,推理有关 将基于 自从 是一个函数 ,推理有关 将基于 然后的似然函数 可以写成 很容易证明整体MLE 因为我们关心的参数是 在哪里 我们有 对于一个给定的 的对数似然函数(20.)表示为的函数 只有,而且 因此,求解约束MLE 我们必须找到 最大化(23), 然后 一旦我们有了整体和约束的MLEs,我们可以得到观察似然比统计量 13)。因此,重要功能是 此外,通过应用上一节中给出的算法,我们还可以获得观察到的模拟修改似然比统计 并且相应的重要功能是

4.真实数据的例子

为了说明本文讨论的方法的应用,我们重新审视了NAM和KWON中讨论的示例[4.].Faupel-Badger等人。[11[RIA与使用新颖的和高效液相色谱 - 串联质谱(LC-MS / MS)获得的浓度进行RIA对雌激素代谢物的浓度进行比较。10%盲静的质量控制样品用于评估实验室测定的质量控制。Nam和kwon中介绍了数据的部分摘要[4.我们有 从RIA取出第一个样品的情况下,第二样品取自LC-MS / MS。桌子1假设数据是由本文讨论的方法获得的独立逻辑分布获得的数据,记录了两个变化系数的置信区间的95%置信区间。请注意,MOVER方法与日志方法和Hasan和KrishNamoorthy相同[5.[MOVER方法的改进版本的结果仍然与LOG方法获得的结果类似。因此,MOVER方法和其改进版本都不包含在计算中。除了WALD类型,在NAM和KWON中获得的间隔[4.似乎彼此很近。请注意,Fieller类型的结果与Nam和Kwon报告的结果不同[4.].此外,我们观察到似然比方法和提出的巴特利特校正方法似乎不同于其他方法,有更大的置信上限。


方法 的95%置信区间

沃尔德型 (2.1798, 3.8620)
事业中类型 (2.2705, 3.9992)
日志的方法 (2.2867, 3.9907)
可能性比率 (2.2776, 4.0126)
巴特利特校正 (2.2770, 4.0138)

通过上述观察,可以比较本文讨论的方法的准确性,特别是当样品大小小时。

5.模拟研究

为了比较本文讨论的方法的准确性,进行了模拟研究。参数设置在表中给出2.其他设置也已计算,但没有报告,因为结果非常类似于那些显示。不过,它们是可以根据要求提供的。由于我们感兴趣的是开发一种方法,即使是在小样本容量,因此在模拟研究中选择的样本容量相对较小。


学习

1 0.6 0.1 3.0 0.5 5. 5.
2 10 20.
3. 15 25
4. 20. 10

5. 1.1 0.2 0.8 0.4 5. 5.
6. 10 20.
7. 15 25
8. 20. 10

9. 2.5 1.2 3.0 0.7 5. 5.
10 10 20.
11 15 25
12 20. 10

13 5.0 0.7 6.0 1.4 5. 5.
14 10 20.
15 15 25
16 20. 10

对于每项研究,我们获得了10,000个模拟样本。从理论上讲, 应该尽可能的大,因为我们想要使用 被估计 然而,从数字上看,我们做到了 模拟样本,以及每个模拟样本,我们必须这样做 模拟获得 对于这些模拟研究,我们使用 对于每个模拟样本,我们计算通过本文讨论的方法获得的95%置信区间。桌子3.报告了真实的样本百分比 小于95%置信限度(LE),在95%置信区间(CC)内,大于95%置信度限制(UE)。标称值分别为2.5%,95%和2.5%。

(一)模拟研究的实证覆盖率为1 ~ 8

学习 方法 CC. 问题

1 沃尔德型 0.08 87.78 12.14
事业中类型 3.48 95.50 1.02
日志的方法 6.28 88.51 5.21
可能性比率 3.12 93.39 3.49
巴特利特校正 2.40 94.90 2.70

2 沃尔德型 0.20 89.31 10.49
事业中类型 0.82 94.01 5.17
日志的方法 1.94 92.71 5.35
可能性比率 2.22 94.78 3.00
巴特利特校正 1.92 95.29 2.79

3. 沃尔德型 0.68 92.92 6.40
事业中类型 3.48 95.50 1.02
日志的方法 3.93 93.25 2.82
可能性比率 2.77 94.57 2.66
巴特利特校正 2.53 94.85 2.27

4. 沃尔德型 1.44 94.14 4.42
事业中类型 7.81 91.99 0.20
日志的方法 7.04 91.46 1.50
可能性比率 3.15 94.23 2.62
巴特利特校正 2.88 94.85 2.27

5. 沃尔德型 0.05 87.47 12.48
事业中类型 2.99 95.28 1.73
日志的方法 5.88 88.45 5.67
可能性比率 3.13 93.39 3.48
巴特利特校正 2.42 94.90 2.68

6. 沃尔德型 0.13 89.18 10.69
事业中类型 0.67 93.59 5.74
日志的方法 1.84 92.58 5.58
可能性比率 2.25 94.75 3.01
巴特利特校正 2.00 95.23 2.77

7. 沃尔德型 0.57 92.73 6.70
事业中类型 2.87 95.26 1.87
日志的方法 3.68 93.20 3.12
可能性比率 2.70 94.66 2.64
巴特利特校正 2.52 94.90 2.58

8. 沃尔德型 1.34 94.14 4.52
事业中类型 7.36 92.28 0.36
日志的方法 6.68 91.63 1.69
可能性比率 3.15 94.34 2.49
巴特利特校正 2.88 94.83 2.29

(b)模拟研究的经验覆盖率9到16

学习 方法 CC. 问题

9. 沃尔德型 0.00 82.10 17.90
事业中类型 0.01 98.88 1.11
日志的方法 1.27 90.26 8.47
可能性比率 2.99 93.61 3.40
巴特利特校正 2.40 94.94 2.66

10 沃尔德型 0.00 83.91 16.09
事业中类型 0.00 90.18 9.82
日志的方法 0.07 90.86 9.07
可能性比率 2.04 94.82 3.14
巴特利特校正 1.92 95.24 2.84

11 沃尔德型 0.00 89.36 10.64
事业中类型 0.00 96.70 3.30
日志的方法 0.96 93.93 5.11
可能性比率 2.75 94.59 2.66
巴特利特校正 2.48 94.97 2.55

12 沃尔德型 0.02 92.69 7.29
事业中类型 0.47 99.16 0.37
日志的方法 3.62 93.86. 2.52
可能性比率 3.17 94.34 2.49
巴特利特校正 2.96 94.71 2.33

13 沃尔德型 0.00 79.33 20.67
事业中类型 2.01 97.99. 0.00
日志的方法 10.56 88.87 0.57
可能性比率 3.52 94.54 2.94
巴特利特校正 2.68 95.03 2.29

14 沃尔德型 0.01 91.26 8.73
事业中类型 0.64 99.32 0.04
日志的方法 3.15 94.73 2.12
可能性比率 2.44 94.69 2.87
巴特利特校正 2.10 95.19 2.71

15 沃尔德型 0.59 93.88 5.53
事业中类型 5.44 94.56. 0.00
日志的方法 6.29 93.43 0.28
可能性比率 3.01 94.48 2.51
巴特利特校正 2.84 94.83 2.33

16 沃尔德型 1.60 94.18 4.22
事业中类型 12.16 87.84 0.00
日志的方法 10.64 89.36 0.00
可能性比率 3.01 94.48 2.51
巴特利特校正 2.95 94.71 2.34

从表格3.,南部和夸隆讨论的三种方法[4.,尤其是在样本规模较小的情况下。随着样本量的增加,似然比方法的覆盖率不断提高,且通常存在不对称误差。然而,所提出的模拟巴特利特修正似然比方法即使在样本量小至5的情况下也是非常准确的。

6.检验变异系数的同质性 独立的Lognormal分布

为了 来自独立逻辑的样本 分布,所需的日志似然函数可以写为 在哪里 是无偏样本方差的估计 Section中给出的样本3..众所周知,总体MLE是 目的是测试 在这种情况下,哪种情况与测试相同 因此,当 是真的,可以以符合的方式重写日志似然函数 并且是 约束的mle是 这是通常的合并方差估计。观测似然比统计量为 这是渐近分布的 因此,观察到的模拟巴特列特校正似然比统计 在哪里 由Section2

进行仿真研究以比较似然比方法的准确性和模拟的巴特拉特校正似然比法。特别是,来自Lognormal的三个数据样本 分布生成。 计算和 也是计算的计算 我们重复这个过程 样本的比例 -值小于 在表中报道4.对于各种样本尺寸。选择 不重要,因为它不涉及任何计算,因此,我们认为它是 不同的选择 结果类似的结果,并没有报告,但他们可以要求。桌子4.报告了案件 当样本容量较小时,似然比方法的结果并不令人满意,但随着样本容量的增加,似然比方法的效果有所改善。即使样本量很小,模拟巴特利特修正似然比方法也能得到非常准确的结果。


样品的比例被拒绝
可能性比率 巴特利特校正

0.0658 0.0512
0.0646 0.0524
0.0565 0.0495
0.0529 0.0487
0.0544 0.0523

7.结论

Lognormal分布经常用于建模正值右偏置数据,通常在健康和医学研究中出现。在本文中,我们提出了一种模拟的Bartlett校正的似然比方法,以获得有关Lognormal分布的两个变化系数的比率的推断。仿真研究表明,即使样品大小很小,所提出的Bartlett校正方法也非常准确。此外,提出的提出的Bartlett校正方法延长以测试均匀性 独立对数正态分布的变异系数。

数据可用性

RIA与使用新型和高效液相色谱 - 串联质谱(LC-MS / MS)获得的浓度的用于比较雌激素代谢物的数据集比先前在Faupel-Badger等。[11],已被引用。在NAM和Kwon进一步分析了该数据集[4.],也被引用在稿件中。提交文件中的其他数值示例基于仿真研究,可根据要求可从相应的作者获得。

利益冲突

作者声明他们没有利益冲突。

参考

  1. j·艾奇森和j·a·c·布朗,Lognormal分布《科学》,北京:人民出版社,1997年。查看在:MathSciNet
  2. E. L. Crow和K. Simizu,Lognormal分布。理论与应用, Marcel Dekker,纽约,纽约,美国,1988。
  3. T. R. Fears, R. G. Ziegler, J. L. Donaldson等,“男性血浆激素水平的重复性研究和实验室间一致性,”癌症流行病学,生物标记和预防,卷。11,不。8,pp。785-789,2002。查看在:谷歌学术搜索
  4. J.NAM和D. Kwon,“推断了两个逻辑分布的两个变化系数的比例”,统计学中的通信理论与方法第46卷,第2期。17, pp. 8575-8587, 2017。查看在:出版商的网站|谷歌学术搜索|MathSciNet
  5. M. S. Hasan和K. Krishnamoorthy,“两个对数正态分布变异系数之比的改进置信区间,”统计理论与应用杂志,第16卷,第2期。3, 345-353页,2017。查看在:出版商的网站|谷歌学术搜索|MathSciNet
  6. O. E. Barndorff-Nielsen和D. R.Cox,推论和渐近学,查普曼和大厅,纽约,纽约,美国,1994年。查看在:出版商的网站|MathSciNet
  7. d·a·s·弗雷泽,《p值:对现代统计推断的洞察》统计年度审查及其应用,第4卷,第1-14页,2017。查看在:出版商的网站|谷歌学术搜索
  8. O. E.Barndorff-nielsen,“基于标准化签名的日志似然比”推断完整或部分参数“,Biometrika,卷。73,没有。2,pp。307-322,1986。查看在:出版商的网站|谷歌学术搜索|MathSciNet
  9. O. E. Barndorff-Nielsen,“修正的对数似然比”Biometrika,卷。78,没有。3,pp。557-563,1991。查看在:出版商的网站|谷歌学术搜索|MathSciNet
  10. M. S. Bartlett,《充分性和统计检验的性质》英国皇家学会学报A数学,物理和工程科学,卷。160,否。901,pp。268-282,1937。查看在:出版商的网站|谷歌学术搜索
  11. J. M. Faupel-Badger, B. J. Fuhrman, X. Xu等,“液相色谱-串联质谱、RIA和ELISA方法测定尿雌激素的比较”,癌症流行病学,生物标记和预防,卷。19,没有。1,pp。292-300,2010。查看在:出版商的网站|谷歌学术搜索

版权所有©2019 A. WONG和L. Jiang。这是分布下的开放式访问文章创意公共归因许可证如果正确引用了原始工作,则允许在任何媒体中的不受限制使用,分发和再现。


更多相关文章

PDF. 下载引用 引用
下载其他格式更多的
订单印刷副本命令
的观点690
下载480
引用

相关文章