研究文章|开放获取
Kobkun Raweesawat, Yupaporn Areepong, Katechan Jampachaisri, Saowanit Sukparungsee, ”优势比估计在二项分布极其罕见的事件”,概率论与数理统计》杂志上, 卷。2016年, 文章的ID3642941, 8 页面, 2016年。 https://doi.org/10.1155/2016/3642941
优势比估计在二项分布极其罕见的事件
文摘
我们引入新的估计量的优势比稀有事件使用经验贝叶斯方法在两个独立的二项分布。我们比较优势比的建议预算有两个估计,修正极大似然估计量(MMLE)和修改值无偏估计量(MMUE),使用估计的相对误差(之前)作为比较的标准。发现新的估计量与其他方法相比更有效率。
1。介绍
的比率衡量的是两个独立的组分类响应之间的联系有两个可能的结果,成功和失败。两个独立的团体可以两个治疗组或治疗和控制。的优势比广泛用于医学和社会科学研究的许多领域。在流行病学最常用来表达一些临床试验的结果,如在病例对照研究。
每组的受试者人数下跌在每个类别可以概括在一个双向列联表。总数1组和2组的受试者和,认为是固定的。数字1组和2组的成功和,被认为是独立的二项随机变量。让和成功的概率在组1、组2,分别。组1定义的成功的可能性,类似于第二组。常用的极大似然估计量的比值比的定义是 优势比负的实际价值。当成功在两组相似,比值比等于1,这意味着组织是独立的响应。当积极回应的几率更高比组2组1,比值比大于1的值小于1,反之亦然。优势比的父亲从1在一个给定的方向代表了强大的协会。此外,它的抽样分布是高度倾斜。样品自然对数的比值比,更少的倾斜,常用于推理。然而,比值比可以零(如果零细胞计数出现在分子(1))或无穷(如果零细胞计数的分母(1))或未定义的(如果有0细胞计数的分子和分母(1))。霍尔丹(1)和加里Zweifel (2)建议添加一个修正项0.5到每一个细胞,当有0细胞计数,提供修改后的最大似然估计(MMLE) 尽管仍然把0到无穷大之间,有些研究人员劝阻0.5添加到每一个细胞,因为外表添加“假数据”;看到主教et al。3和Agresti和阳4]。在争议中,几个类似的替代这个修改提出了极大似然估计量。Hirji et al。5]提出了无偏估计量中值(MUE)的优势比,从有条件获得非中心超几何分布。然而,中值无偏估计量的比值比仍然引起了问题和或,然后MUE是未定义的。Parzen et al。6)提出了一个估计量的比值比基于MUE称为修改值无偏估计量(MMUE)的估计成功概率总是间隔,即使有0或每组成功。因此,估计优势比总是0到无穷大之间。此外,该方法表现良好在小样本对偏见,另一个添加“假数据。”
在本文中,我们专注于“小概率事件”,偶尔观察到零个或小项有趣的事件发生在一个给定的时期或一个给定的样本,如自然灾害或一些疾病。正如上面提到的,罕见的事件造成难以估计的优势比0的发生或小分子或分母观察数量或在两者中,导致大的标准误差,因此较少的精确置信区间。因此只有粗略估计的优势比。研究涉及关联分类变量列联表一直研究,使用经典和贝叶斯方法。好(7]研究协会的因素,在早期阶段,在大列联表小条目,假设对数正态分布和皮尔逊III型分布。作者还提到,这些假设可能不准确,但容易搬运。费雪(8]估计基于超几何分布的优势比使用精确的方法表。托马斯和加里(9)构建一个表的95%置信区间的差异和比例两个比例,包括优势比和单侧在各种类型的值Fisher-Irwin准确测试表。Altham [10]研究协会和精确价值列联表的基础上累积后验概率不容易提取。Nurminen和Mutanen11)提出了贝叶斯估计的方法区别两个比例,风险率和优势比,使用积分表达式提供独立的测试之前和累积的后验分布。他们也该方法应用于实际数据对恶性淋巴瘤和结肠癌病例暴露于苯氧基酸和氯酚在农业。努里·et al。12]介绍了评估的优势比表是不是接触时。他们比较矩阵和逆矩阵的方法来标定方法使用模拟研究,发现逆矩阵方法在一个封闭的形式比矩阵法更有效。
正如前面提到的,估计协会双向列联表的测量可以进行基于古典和贝叶斯方法。确切的分布使用经典的方法,然而,相当困难的数学温顺。在贝叶斯方法,之前的信念是纳入推导的后验密度,hyperparameters,描述前密度,研究人员往往是未知的,需要评估无论当前数据。然而,争议仍然存在。另外,hyperparameters的估算是进行合理的使用当前数据与经验贝叶斯方法的概念来估计未知的hyperparameters,与贝叶斯方法。因此,我们专注于利用经验贝叶斯估计方法的优势比双向列联表,关注小成功的比例。我们计划的评估往往比传统的估计量,MMLE, MMUE没有干涉原始数据。
本文的其余部分被组织在以下序列。在下一节中,我们将讨论中值的无偏估计量。第三部分描述了使用EB的优势比估计的方法。第四部分说明了模拟结果和EB的效率相比MMLE和MUE。第五部分显示我们的方法应用到真实的数据。我们在最后一部分得出结论。
2。修改后的值无偏估计量的比值比
Parzen et al。6)建议修改后的中值无偏估计量(MMUE)两个独立的二项分布。让成功概率的估计量满足 获得他们使用二项分布,,在那里表示随机变量代表的成功集团。让的观测值 可以计算MMUE充分统计二项分布的数据。
计算的值和这些价值的 在哪里和最小的和最大的价值是什么,分别。然后,MMUE被定义为 当,我们可以找到的值和它满足 然后,解决从 和解决从 的值和可以是通过使用累积贝塔分布之间的关系和累积二项分布函数如下(Daly [13和约翰逊等。14])。
让: 我们需要找到和这样 特别是, 在哪里是分位数的贝塔分布参数和
现在假设,然后 任何价值在这一期间满足 在哪里是最小的可能值的
同样的,当,满足 因此,;= 同样的,当最大的可能值吗,然后满足 当和
然后,MMUE优势比估计的定义是 在哪里和在组1和2表示成功概率估计,分别。
3所示。提出优势比估计
在本节中,我们提出了一种新的方法优势比使用经验贝叶斯方法估计在两个独立的二项分布。让和是随机变量,分布与二项平等和不平等的样本大小和未知的概率,和,在那里和表示两个样本大小和两个未知的成功概率。采用先验信息,,,在那里和表示未知hyperparameters。hyperparameters的评估可以从后获得的边际分布函数如下: 因此,后的边际分布函数是beta-binomial分布(bdd)。
然后,hyperparameters每组可以使用最大似然估计方法。后边际似然函数的分布函数然后写成 应用牛顿迭代法解非线性方程,hyperparameters的极大似然估计量可以获得 在哪里 的矩估计hyperparameters beta-binomial分布作为初始值;看到星(15]。
的后验分布函数因此计算,收益 用的估计和,我们获得 让和是估计的和分别在哪里 因此,EB估计量的比值比可以获得如下: 在哪里和在组1和2表示成功概率估计,分别。
4所示。仿真研究MMLE、MMUE和EB的方法
模拟研究进行了使用R程序(3.2.0版)(16]EB的效率评估方法相比,两个现有的方法。二项数据生成与平等和不平等的样本大小:与成功的概率在组1:和0.15。为每个值不同的是0.01,0.03,0.05,0.1,和每种情况下重复5000次后删除第一个1000次迭代(1000老化)。提出了估计量的效率是评价使用估计的相对误差(之前),定义为 在哪里表示一般的优势比极大似然估计量表示使用EB估计的优势比,MMLE, MMUE,分别。
仿真结果与优势比样本大小的估计和表中给出1- - - - - -3。表中给出的性能估计使用之前4- - - - - -6并比较结果与图在图1;其他情况提供了类似的结果。发现使用EB的优势比估计方法大多收益率最小之前有78.67%,而使用MMLE和MMUE方法导致最小之前只有6.67%和14.66%,分别。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5。说明性的例子使用真实的数据
我们的第一个例子是来自良好的研究(7和哈17]。如表所示7、主题与恶性淋巴瘤和结肠癌病例和控制那些暴露于苯氧基酸在农业和林业不久观察,包括真正的优势比及其使用EB估计,MMLE, MMUE。对结果的的病例和控制,分别使用EB方法优势比收益率的估计至少在0.5523,而使用MMLE和MMUE方法导致之前为1.2805和4.1483,分别。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||
第二个例子是取自Perondi等的研究。18),如表所示7儿童相比,大剂量肾上腺素和标准剂量肾上腺素与心脏骤停和34岁的孩子在每个治疗,包括真正的优势比及其使用EB估计,MMLE, MMUE。测量结果是生存在24小时的分别对高剂量和标准剂量。使用EB方法优势比收益率的估计至少在5.2097,而使用MMUE和MMLE方法导致之前为15.5305和40.4643,分别。
6。结论
基于模拟的优势比估计的研究罕见的事件有两个独立的二项数据,结果表明,该方法很好地执行。EB估计量的比值比也比其他两个更有效的估计,MMLE MMUE。另外,我们计划的估计量的另一种方法是优势比估计MMLE方法没有令人不安的原始数据。
相互竞争的利益
作者宣称没有利益冲突。
确认
作者感谢研究生学院,蒙国王科技大学北曼谷的金融支持。
引用
- j·b·霍尔丹,“估计和频率之比的对数的意义,“《人类遗传学,20卷,不。4、309 - 311年,1956页。视图:出版商的网站|谷歌学术搜索
- j·j·加里和j . r . Zweifel”分对数的各种估计量的偏差和方差与量子生物测定的应用,”生物统计学,54卷,不。1 - 2、181 - 187年,1967页。视图:出版商的网站|谷歌学术搜索|MathSciNet
- y . m .主教s e . Fienberg, p . w .荷兰,离散多变量分析:理论和实践施普林格,纽约,纽约,美国,2007年。视图:MathSciNet
- 答:Agresti M.-C。杨,“实证调查一些应急表中稀疏的影响,“计算统计和数据分析,5卷,不。1、9、1987页。视图:出版商的网站|谷歌学术搜索
- k . f . Hirji a . a . Tsiatis和c·r·梅塔”为二进制数据值无偏估计,“美国统计学家,43卷,不。1、7 - 11,1989页。视图:出版商的网站|谷歌学术搜索|MathSciNet
- m . Parzen s Lipsitz j·易卜拉欣,n . Klar)”估计的优势比总是存在,”计算和图形统计杂志》上,11卷,不。2、420 - 436年,2002页。视图:出版商的网站|谷歌学术搜索|MathSciNet
- i . j .好”,在应急表小频率的估计,”英国皇家统计学会杂志》上。系列b方法18卷,第124 - 113页,1956年。视图:谷歌学术搜索|MathSciNet
- r·a·费舍尔“归纳推理的逻辑,英国皇家统计学会杂志》上,卷98,不。1,页39 - 82,1935。视图:出版商的网站|谷歌学术搜索
- d·g·托马斯和j·j·加里,”一个表的精确置信区间差异和比率两个比例和他们的优势比,”美国统计协会杂志》上,卷72,不。357年,第76 - 73页,1977年。视图:出版商的网站|谷歌学术搜索
- p . m . e . Altham”确切的贝叶斯分析列联表,费舍尔的确切的显著性检验,”英国皇家统计学会杂志》上。系列B(方法论)31卷,第269 - 261页,1969年。视图:谷歌学术搜索
- m . Nurminen和p . Mutanen“精确的贝叶斯分析两个比例,”斯堪的纳维亚杂志统计,14卷,不。1,第77 - 67页,1987。视图:谷歌学术搜索|MathSciNet
- b .努里·n·Zare, s m t . Ayatollahi“验证的研究方法评估优势比表暴露分类错误时,“计算和数学方法在医学ID 170120条,卷。2013年,8页,2013。视图:出版商的网站|谷歌学术搜索
- l·戴利,”简单的SAS宏确切二项式分布和泊松分布置信区间的计算,”计算机在生物学和医学,22卷,不。5,351 - 361年,1992页。视图:出版商的网站|谷歌学术搜索
- n·l·约翰逊,a·w·坎普,s .科孜单变量离散分布约翰•威利& Sons新泽西,新泽西,美国,2005年。
- t p星途,“估计狄利克雷分布,”科技。代表,麻省理工学院出版社,伦敦,英国,2000年。视图:谷歌学术搜索
- R发展核心团队介绍R,维也纳,2010年,http://R-project.org
- l·哈”关系的软组织肉瘤,恶性淋巴瘤和结肠癌苯氧基酸、氯酚和其他代理商,“斯堪的纳维亚杂志工作,环境和健康,7卷,不。2、119 - 130年,1981页。视图:出版商的网站|谷歌学术搜索
- m . b . m . Perondi A·g·里斯e . f . Paiva v . m . Nadkarni和r·A·伯格”比较高剂量和标准剂量的肾上腺素与心脏骤停,孩子”《新英格兰医学杂志》上,卷350,不。17日,第1730 - 1722页,2004年。视图:出版商的网站|谷歌学术搜索
版权
版权©2016 Kobkun Raweesawat等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。