研究文章|开放获取
黄a,蒋丽君那 “关于两个独立对数正态分布的两个变异系数比值的改进小样本推断“,概率与统计学报那 卷。2019年那 文章ID.7173416那 7. 页面那 2019年. https://doi.org/10.1155/2019/7173416
关于两个独立对数正态分布的两个变异系数比值的改进小样本推断
摘要
如果没有使用产生一致测量的研究工具和程序的能力,研究人员将无法得出结论,制定理论或使索赔对其结果的普遍性。在统计数据中,变异系数通常用作测量的可靠性指标。因此,比较变异系数是特别兴趣的。此外,Lognormal分布经常用于从诸如健康和医学研究的许多领域建模数据。在本文中,我们提出了一种模拟的Bartlett校正的似然比方法,以获得有关Lognormal分布的两个变化系数的比率的推断。仿真研究表明,即使样品尺寸小,所提出的方法也非常准确。
1.介绍
在健康和医学研究中,很常见的是感兴趣的变量, 那如生存时间,只需要正值,并且该变量的底层分布非常偏向右侧。在这种情况下,通常假设的正态分布不合适。第一次变换的标准方法这样变化的变量 通常是分布式的。然后可以应用为正态分布开发的现有统计理论。为了 和分布的对右侧有高度偏向,最常见的转化是对数转换。换句话说, 通常是分布式的。因此,是逻辑分发的。详细审查算法分布的理论可以在Aitchison和Brown中找到[1,克罗和西米祖[2].实际上,恐惧等人[3.]研究了实验室使用的激素测定的可变性和再现性,具有执行大量测试的能力。他们假设实验室中使用的激素样本是独立的逻辑分布。在这种情况下,知道每个样本是否产生一致的测量,它特别感兴趣。
变异系数( )被定义为标准偏差与平均值的比率,其中假设平均值为非零。这是评估测量程序可靠性的重要指标。因此,在恐惧等中考虑的问题。[3.如果在每个实验室中使用的变化系数是相同的,则可以被视为测试。
在数学上,如果是一个随机变量是对数正态分布吗 那然后 是正态分布吗和方差 .众所周知 因此,变异系数, 那是
南权[4.[比较了独立逻辑分布的两个系数的各种近似间隔估计。它们的仿真结果表明,这些方法的经验覆盖率令人满意地靠近中等样本大小的标称覆盖率。本文的目的是开发一种更准确的方法,以获得独立逻辑分布的两个变化系数的推断。此外,可以推广所提出的方法,以测试是否有变异系数独立对数正态分布是异质的。
本文的其余部分组织如下。部分2综述了获取有关来自独立日志正规分布的两个变化系数的推断的现有方法。在章节中提出了模拟的Bartlett校正似然方法3..介绍了一个真实的数据示例4.为了说明本文讨论的方法的应用。进行仿真研究以比较本文中讨论的方法的准确性5..对变异系数同质性检验的推广独立对数正态分布在第一部分讨论6..一些结论备注记录在一节中7..
2.两个独立对数正态分布的两个变异系数比值的现有推断方法
让 是来自Lognormal的样本 分布,在哪里 .然后 是样本来自均值正态分布和方差 .从 (2),变异系数为 .南权[4.]比较了四种方法的置信区间 .以下是在南和权所讨论的方法的摘要[4.]:(1)瓦尔德式方法设观测检验统计量为 在哪里 那 那 那和 .然后渐近地分布为标准正态分布。重要功能是 那在哪里是标准正态分布的累积分布函数。(2)事业中类型的方法设观测检验统计量为 在哪里 然后也渐近分布为标准正态分布。重要功能是 .(3)日志的方法设观测检验统计量为 在哪里 然后也渐近分布为标准正态分布。重要功能是 .(4)方差估计方法估算恢复(移动器)这是一种将直接获得近似的方法 置信区间只要。让 然后是一个近似的 置信区间是 在哪里 因此,近似 置信区间是 .如果 那为了 那与Log方法相同,MOVER方法与Log方法相同。请注意Hasan和Krishamoorthy [5.]提出了一种改进的MOVER方法版本。
3.提出的方法
在本节中,我们将首先审查基于可能性的方法和Bartlett校正似然比方法。由于对于Bartlett校正的似然比方法所需的Bartlett调整非常难以获得,因此提出了一种数值算法以近似Bartlett调整。然后应用该方法以获得两个独立的逻辑分布的两个变形系数的推断。
3.1。基于可能性的方法和Bartlett校正似然比方法
让 是已知分布的样本,具有概率密度函数 那在哪里是一个 -参数的维向量。让 那这尺寸 成为兴趣的参数。对数似然函数是 在Barndorff-Nielsen和Cox所述的规律性条件下[6.],我们拥有标准化的最大可能性估计(MLE)统计 和可能性比率统计 渐近卡方分布度afreedom, 那在哪里是整体MLE,值是多少最大化 那和大约是Fisher的预期信息的反比力。当感兴趣的参数是 那Barndorff-nielsen和Cox [6.表明可以得到类似的统计数据。标准化的MLE统计量成为 在哪里 那和可以用delta法来近似,它的形式是 似然比统计量为 在哪里是由最大化获得的约束的MLE对于给定的价值。这两个和是渐近的 .按照Fraser的定义[7.],重要功能被定义为 或 可用于获得推论在哪里和观察到的值是和 那分别。特别是 信心地区是 分别在哪里是 百分位的 .
众所周知,这两种渐近方法具有收敛速度 那它们被称为一阶方法。在统计文献中,为了提高上述方法的准确性,存在各种各样的调整。特别是Barndorff-Nielsen [8.那9.]引入了修正的符号对数似然比统计量的三阶方法。但是,该方法仅适用于感兴趣的标量参数。另一方面,Bartlett [10]提出了似然比统计的改造,使得转化的统计学的平均值匹配渐近分布的平均值。进一步来说, 在哪里巴特利特调整是这样的吗 .和被称为巴特利特修正似然比统计量。一个明显的选择是 巴特利特[10]表明,Bartlett校正的似然比统计也是渐近的分布,具有收敛速度 .因此,它是一种极其准确的方法。尽管如此,除了一些明确的问题,很难得到,这阻碍了这种方法在应用统计学中的应用。Barndorff-Nielsen和Cox等文献综述了Bartlett校正似然比方法[6.].
虽然在数学上,明确的封闭形式 那甚至是渐近扩张 那难以获得,我们提出以下算法的方式获取从数字上讲,这是一种估计 .
鉴于: 是尺寸的样品吗从具有已知概率密度函数的分布 .
感兴趣:推理有关 .
有:总体最大可能性估计 那约束极大似然估计 那和观察到的似然比统计 .
步骤1:模拟数据大小的样本从 .
第2步:对于每组模拟数据,获得模拟观察的似然比统计。结果,我们有 .
第3步: 计算 这是一种估计差异统计的平均值。因此,我们有 .
第四步:观察到的模拟巴特莱特校正似然比统计 是渐近分布的具有第四阶收敛速度。因此,意义函数是 那和 信心地区是
作为最后的说明,提出的算法,理论上的选择应该尽可能的大。然而,更大的是否需要更多的计算才能得到 .此外,模型中存在的参数越多,模型的参数越大必须。我们建议使用试用版错误直到是记忆。
3.2.应用似然法对两个独立对数正态分布的两个变异系数的比值进行推理
让 和 .然后通常以平均分布和方差 那和 是 .而且,和 是独立的。因此,推理有关将基于 .自从是一个函数,推理有关将基于 .让 .然后的似然函数可以写成 很容易证明整体MLE 因为我们关心的参数是 那在哪里 那我们有 对于一个给定的的对数似然函数(20.)表示为的函数只有,而且 因此,求解约束MLE 那我们必须找到最大化(23), 然后 .一旦我们有了整体和约束的MLEs,我们可以得到观察似然比统计量(13)。因此,重要功能是 .此外,通过应用上一节中给出的算法,我们还可以获得观察到的模拟修改似然比统计并且相应的重要功能是 .
4.真实数据的例子
为了说明本文讨论的方法的应用,我们重新审视了NAM和KWON中讨论的示例[4.].Faupel-Badger等人。[11[RIA与使用新颖的和高效液相色谱 - 串联质谱(LC-MS / MS)获得的浓度进行RIA对雌激素代谢物的浓度进行比较。10%盲静的质量控制样品用于评估实验室测定的质量控制。Nam和kwon中介绍了数据的部分摘要[4.我们有 从RIA取出第一个样品的情况下,第二样品取自LC-MS / MS。桌子1假设数据是由本文讨论的方法获得的独立逻辑分布获得的数据,记录了两个变化系数的置信区间的95%置信区间。请注意,MOVER方法与日志方法和Hasan和KrishNamoorthy相同[5.[MOVER方法的改进版本的结果仍然与LOG方法获得的结果类似。因此,MOVER方法和其改进版本都不包含在计算中。除了WALD类型,在NAM和KWON中获得的间隔[4.似乎彼此很近。请注意,Fieller类型的结果与Nam和Kwon报告的结果不同[4.].此外,我们观察到似然比方法和提出的巴特利特校正方法似乎不同于其他方法,有更大的置信上限。
|
||||||||||||||||||
通过上述观察,可以比较本文讨论的方法的准确性,特别是当样品大小小时。
5.模拟研究
为了比较本文讨论的方法的准确性,进行了模拟研究。参数设置在表中给出2.其他设置也已计算,但没有报告,因为结果非常类似于那些显示。不过,它们是可以根据要求提供的。由于我们感兴趣的是开发一种方法,即使是在小样本容量,因此在模拟研究中选择的样本容量相对较小。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
对于每项研究,我们获得了10,000个模拟样本。从理论上讲,应该尽可能的大,因为我们想要使用被估计 .然而,从数字上看,我们做到了模拟样本,以及每个模拟样本,我们必须这样做模拟获得 .对于这些模拟研究,我们使用 .对于每个模拟样本,我们计算通过本文讨论的方法获得的95%置信区间。桌子3.报告了真实的样本百分比小于95%置信限度(LE),在95%置信区间(CC)内,大于95%置信度限制(UE)。标称值分别为2.5%,95%和2.5%。
|
(一)模拟研究的实证覆盖率为1 ~ 8 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
(b)模拟研究的经验覆盖率9到16 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
从表格3.,南部和夸隆讨论的三种方法[4.,尤其是在样本规模较小的情况下。随着样本量的增加,似然比方法的覆盖率不断提高,且通常存在不对称误差。然而,所提出的模拟巴特利特修正似然比方法即使在样本量小至5的情况下也是非常准确的。
6.检验变异系数的同质性独立的Lognormal分布
为了来自独立逻辑的样本 分布,所需的日志似然函数可以写为 在哪里是无偏样本方差的估计Section中给出的样本3..众所周知,总体MLE是 目的是测试 在这种情况下,哪种情况与测试相同 因此,当是真的,可以以符合的方式重写日志似然函数并且是 约束的mle是 这是通常的合并方差估计。观测似然比统计量为 这是渐近分布的 .因此,观察到的模拟巴特列特校正似然比统计 在哪里由Section2.
进行仿真研究以比较似然比方法的准确性和模拟的巴特拉特校正似然比法。特别是,来自Lognormal的三个数据样本 分布生成。计算和也是计算的计算 .我们重复这个过程 .样本的比例 -值小于在表中报道4.对于各种样本尺寸。选择不重要,因为它不涉及任何计算,因此,我们认为它是 .不同的选择结果类似的结果,并没有报告,但他们可以要求。桌子4.报告了案件 和 .当样本容量较小时,似然比方法的结果并不令人满意,但随着样本容量的增加,似然比方法的效果有所改善。即使样本量很小,模拟巴特利特修正似然比方法也能得到非常准确的结果。
|
||||||||||||||||||||||||||||||
7.结论
Lognormal分布经常用于建模正值右偏置数据,通常在健康和医学研究中出现。在本文中,我们提出了一种模拟的Bartlett校正的似然比方法,以获得有关Lognormal分布的两个变化系数的比率的推断。仿真研究表明,即使样品大小很小,所提出的Bartlett校正方法也非常准确。此外,提出的提出的Bartlett校正方法延长以测试均匀性独立对数正态分布的变异系数。
数据可用性
RIA与使用新型和高效液相色谱 - 串联质谱(LC-MS / MS)获得的浓度的用于比较雌激素代谢物的数据集比先前在Faupel-Badger等。[11],已被引用。在NAM和Kwon进一步分析了该数据集[4.],也被引用在稿件中。提交文件中的其他数值示例基于仿真研究,可根据要求可从相应的作者获得。
利益冲突
作者声明他们没有利益冲突。
参考
- j·艾奇森和j·a·c·布朗,Lognormal分布《科学》,北京:人民出版社,1997年。查看在:MathSciNet
- E. L. Crow和K. Simizu,Lognormal分布。理论与应用, Marcel Dekker,纽约,纽约,美国,1988。
- T. R. Fears, R. G. Ziegler, J. L. Donaldson等,“男性血浆激素水平的重复性研究和实验室间一致性,”癌症流行病学,生物标记和预防,卷。11,不。8,pp。785-789,2002。查看在:谷歌学术搜索
- J.NAM和D. Kwon,“推断了两个逻辑分布的两个变化系数的比例”,统计学中的通信理论与方法第46卷,第2期。17, pp. 8575-8587, 2017。查看在:出版商的网站|谷歌学术搜索|MathSciNet
- M. S. Hasan和K. Krishnamoorthy,“两个对数正态分布变异系数之比的改进置信区间,”统计理论与应用杂志,第16卷,第2期。3, 345-353页,2017。查看在:出版商的网站|谷歌学术搜索|MathSciNet
- O. E. Barndorff-Nielsen和D. R.Cox,推论和渐近学,查普曼和大厅,纽约,纽约,美国,1994年。查看在:出版商的网站|MathSciNet
- d·a·s·弗雷泽,《p值:对现代统计推断的洞察》统计年度审查及其应用,第4卷,第1-14页,2017。查看在:出版商的网站|谷歌学术搜索
- O. E.Barndorff-nielsen,“基于标准化签名的日志似然比”推断完整或部分参数“,Biometrika,卷。73,没有。2,pp。307-322,1986。查看在:出版商的网站|谷歌学术搜索|MathSciNet
- O. E. Barndorff-Nielsen,“修正的对数似然比”Biometrika,卷。78,没有。3,pp。557-563,1991。查看在:出版商的网站|谷歌学术搜索|MathSciNet
- M. S. Bartlett,《充分性和统计检验的性质》英国皇家学会学报A数学,物理和工程科学,卷。160,否。901,pp。268-282,1937。查看在:出版商的网站|谷歌学术搜索
- J. M. Faupel-Badger, B. J. Fuhrman, X. Xu等,“液相色谱-串联质谱、RIA和ELISA方法测定尿雌激素的比较”,癌症流行病学,生物标记和预防,卷。19,没有。1,pp。292-300,2010。查看在:出版商的网站|谷歌学术搜索
版权
版权所有©2019 A. WONG和L. Jiang。这是分布下的开放式访问文章创意公共归因许可证如果正确引用了原始工作,则允许在任何媒体中的不受限制使用,分发和再现。