文摘
多个荟萃分析可以使用类似的搜索标准,专注于相同话题的兴趣,但他们有时可能会产生不同的或不和谐的结果。缺乏统计方法合成的这些研究结果使它具有挑战性的正确解释多个荟萃分析的结果,特别是当他们的结果是矛盾的。在本文中,我们首先介绍一个方法合成整合结果当多个荟萃分析使用相同类型的总结影响估计。当荟萃分析使用不同类型的尺度效应,荟萃分析结果不能直接的总和。我们首先提出一个两步频率论的过程效应值估计转换为相同的度量,然后用加权平均数估计总结。我们的方法比现有的方法提供了几个优势,卷边et al . (2012)。首先,总结不同类型的尺度效应。第二,我们的方法提供了相同的整体效果大小对所有个体进行荟萃分析研究从多个荟萃分析。我们在两个例子验证了该方法的应用,并讨论它们的意义领域的荟萃分析。
1。介绍
过去二十年的指数增长的荟萃分析在科学学科包括医学研究[1)和诊断医学(2]。荟萃分析的目的是评估结果的一致性和健壮性穿过人群,设置,和语境因素,以帮助确保实践是实现时可能产生类似的结果。确定一个研究不能确定,一个干预工作或不工作。相反,研究结合在一起,在不同的设置,并随着时间的推移可以建立一个模式进行一致的发现可能是有用的为新的或改进的实践。几项研究相结合可以建立意义和可重复性的结果(3]。常见的统计方法结合研究的荟萃分析是基于一个固定后果模型,假定一个齐次治疗效果研究或更一般的随机模型,允许之间的异质性研究[4]。
有时进行多个荟萃分析研究同一主题或干预的效果。的合成这些荟萃分析可以用来强调什么是已知的在一个特定的主题或干预或能导致更完整的理解现存的经验证据(5]。然而,荟萃分析的总结可以非常具有挑战性的,因为现有的荟萃分析可能是相互矛盾的,可能是不同的或不完全的研究报道,或可能或多或少有效的基于质量的研究采用的合成方法进行了评价。这就提出了挑战解释和结论对这些研究的结果是什么意思和如何被用来告知未来的研究,理论发展和实践。系统评价时更加复杂多样化health-relevant结果评估。这就是研究者和实践者面临的相同问题时试图总结主要研究相同的问题,使得分析吸引。
几个nonstatistical总结荟萃分析方法相同的主题或干预目前可用。Cochrane协作开发了一套推荐的程序进行概述的评论当多个荟萃分析存在关于不同的治疗相同的临床状况(6- - - - - -8]。Nonstatistical方法总结多个评论,这可能是用于荟萃分析,包括计票和使用决策算法来识别审查(s)最突出的7]。然而,叙事评论可以太主观反映的知识通过研究[9]。理想的统计方法总结荟萃分析是进行一个新的荟萃分析的主要研究包括在多个荟萃分析。即个体识别所有相关的荟萃分析的研究,及其尺度效应组合计算汇总统计使用整合技术如DerSimonian中的随机模型和Laird [4]。然而,虽然这种方法是理想的和有吸引力的只有两个或三个荟萃分析结合,这样做效率不如直接总结影响大小在现有荟萃分析报道了类似的主题。最近,卷边等。10)提供了一个贝叶斯方法总结多个评论。他们的方法假设估计总结尺度效应遵循随机影响模型基于可交换性的假设。不同类型的效应大小并不认为他们的方法。此外,作者并没有研究固定后果模型可能导致不错的属性合并后的整体效果。
在本文中,我们首先描述方法meta-analyze效应值估计从个体研究提取几个现有的荟萃分析。然而,这些方法需要大量的时间和资源。因此,我们还将介绍一个更有效的统计方法直接从现有的荟萃分析总结信息没有回到个别研究。本文组织如下。节2我们介绍了符号和合成荟萃分析方法与相同类型的汇总统计。我们还描述两步方法结合不同类型的汇总统计中常用的荟萃分析。我们开始与固定后果模型和表明,总结评论收益率相同的整体效果进行荟萃分析所有可能的个别研究。然后,我们描述了随机模型的方法。部分3该方法适用于两个例子。部分4讨论了该方法的应用前景。
2。方法
使用定量研究的荟萃分析等综合技术克服了许多传统叙事文学评论的局限性。荟萃分析提供客观、定量研究方法综合考虑样本容量等因素,大小和方向关系和各种研究的方法学质量分析11- - - - - -13]。荟萃分析不仅仅是依赖传统指标的统计学意义,而是依赖效应大小为我们描绘出一幅画面的影响干预的规模和范围(14]。然而,就某一主题进行荟萃分析,越困难的可以来分析和确定的累积结果从文献。
计算尺度效应在总结现有的荟萃分析是一个潜在的有价值的合成方法知识库在给定的话题。这个过程应该遵循相同的规则,引导传统荟萃分析需要,研究结合应该是评估一个常见的临床研究的问题。假设几个荟萃分析考虑常见的临床问题,使用类似的搜索条件包括和排除个别研究。总结这些荟萃分析可以提供更好的理解比任何一个荟萃分析的临床问题。
当多个荟萃分析解决同样的话题,我们建议,研究人员探索合成方法从现有的荟萃分析总结影响大小。这个建议的方法只需要总结尺度效应及其方差的报道在现有的荟萃分析。计算组合的整体效果大小荟萃分析本质上是一个加权平均总结影响大小与重量方差的倒数;使用这种方法类似于技术主要研究进行荟萃分析。
受欢迎的效应值估计用于荟萃分析包括标准化意味着差异,优势比,和相关系数14]。在本节中,我们首先考虑最简单的情况下结合多个荟萃分析当所有分析使用相同类型的效应值估计固定后果模型。然后我们扩展更常用的随机模型的方法。最后,我们提出一个荟萃分析结合不同类型的汇总统计方法在固定后果或随机模型。
2.1。结合影响大小相同的措施
2.1.1。综合所有单个研究
假设荟萃分析使用类似的搜索标准在一个共同的话题识别和需要获得一个整体汇总统计。我们使用和来表示一个真正影响参数及其估计,分别进行研究,在荟萃分析。估计通常假定遵循正态分布作为吗在哪里的方差。方差估计量,获得的研究往往是更大的样本量较小。如果所有的年代,的,研究人员可以使用现有的统计方法进行分析基于随机模型(REM)或固定后果模型(FEM)。作为一个受欢迎的模型分析,REM假设之间的异质性并给出如下: 在哪里和。在这里使用这个样本方差估计从研究在荟萃分析。一般来说,真正的方差被认为是已知的和等于什么我们将使用,简化符号而不是在整个论文。随机效应,,是异构的在所有的研究,它可以使用一会儿估计估计量的方差DerSimonian和Laird [4]: 在哪里 和重量是由表明一个更大的重量,更大的样本量。目前估计,,应该是负的。如果一个负面的价值获得,根据DerSimonian设置为0,Laird [4]。使用作为研究的重量在荟萃分析,估计总结的效果给出了加权平均效应的估计: 在有限元法中,随机效应组件(1)= 0假设同质在真实效应参数的研究,和快速眼动(1)成为 的估计可以使用(4)通过设置。
2.1.2。合成荟萃分析
获得与所有单个研究结果(4)是一种理想的方式来合成多个荟萃分析。在传统的分析中,数以百计的研究常常可以在类似的话题,当一些个人研究的作者并不畅通,这些研究可以设置相应的排除标准。然而,提取个人研究的数据需要巨大的时间和资源。另外,我们建议直接总结荟萃分析。我们开始显示合成等价的荟萃分析和综合所有单个研究下简单的有限元参数假设相同的效果,在研究。参数的影响在荟萃分析预计使用 在哪里。方差的估计是由。使用作为分析的重量,我们可以获得一个加权平均荟萃分析结果如下: 经过一些数学,我们看到上面的表达式是一样的(4),。结果意味着由池进行荟萃分析总结影响大小的感兴趣的荟萃分析相当于一个荟萃分析相结合的所有单个研究从这些荟萃分析。的方差加权平均得到。
同样的效果参数的假设在研究可能是不现实的考虑研究的异构特性。这种假设是放松所示的快速眼动(1)。使用数据从荟萃分析,参数会计的随机组件是估计的矩估计量: 在哪里 目前估计量有相同的表达式给出的(8),除了从荟萃分析现在只使用获得的数据。荟萃分析然后使用作为研究的重量获得总结的估计效果通过 合成荟萃分析,一个可能的方法是使用作为分析的重量和计算的加权平均的如下: 对比上面的估计和一个(4)显示了一些差异。我们可以写(4)的加权平均荟萃分析总结统计以下表达式: 在哪里 和。近距离观察和揭示了一个微小的区别。这是由于不同的重量估计,和,前者使用研究的荟萃分析估计而后者池研究的荟萃分析来估计。在实践中,一个精心策划的荟萃分析包括大量的研究的年代,都应该接近真正的参数。随后,之间的区别和可能可以忽略。因此,尽管使用的重量(11)可能不是精确的池获得的所有个人研究,仍然是一个统计上的声音估计。
2.2。从不同类型的数据结合效应的大小
摘要在荟萃分析可能是不同类型的数据。当个体在一个荟萃分析的研究持续的结果,统计数据可能出现在形式的样本均值的差异。有时,其他研究解决同样的话题,但结果是一分为二,比值比通常被用来总结两组之间的差异。皮尔森相关系数经常被用来评估两个连续变量之间的相关性。当一个变量是一个持续的结果,另一个变量是一分为二,以指示组状态,可以用来比较两组之间的结果。当荟萃分析处理同一主题使用不同类型的统计,一个人应该将这些数据转换为相同类型的汇总统计数据在合成之前。
2.2.1。综合所有单个研究
我们现在讨论如何把荟萃分析与这些类型的汇总统计数据使用一个两步过程。第一步是各种类型的数据转换为相同的类型。在本文中,我们讨论如何把对数转换优势比(或)和相关系数相同规模的样本均值的差异。可以转换为对数转换或样本均值差异将讨论使用他们的线性关系。然而,泰勒展开式需要转换的相关系数样本均值的差异通过线性关系。我们关注的是线性关系,因为一个荟萃分析的加权平均估计的线性组合效果,和保护的线性转换将有利于未来计算合成荟萃分析。
假设分析,,进行使用标准化样本均值的差异的方差和荟萃分析,估计的对数转换优势比摘要效应及其样本方差。
Chinn给出了详细讨论如何将标准化平均差和估计之间的优势比个人研究[15]。由于对数转换优势比在研究的荟萃分析大约一个物流分布,不同于标准正态分布,主要在尾部区域,分裂通过,或1.81转换一个近似标准化样本均值的差异。
在荟萃分析,与相关系数,系数从研究转化为费雪的分数前进一步计算(14]。转换是由 自相关系数可以转化成一种标准化的差异意味着什么使用我们可以将费雪的分数来使用。上面的关系之间的和是非线性的。二阶泰勒展开的 给出了近似线性关系和。
后的效果估计转换为相同的规模,它们可以用于估计总体参数的影响在接下来的眼动模式: 在哪里,,,。
在第二步中,,,估计相结合获得整体总结的效果呢。让,,。再次,参数可以估计的矩估计类似于(8使用所有效应估计及其方差): 在哪里 的预估结果,总结的效果使用眼动是由 在哪里,,。的方差是由。
2.2.2。合成荟萃分析
荟萃分析结合不同类型的统计信息类似于合成荟萃分析使用相同类型的统计数据汇总统计的除了适当的转换。我们让是一个估计在荟萃分析使用标准化的样本均值的差异,在荟萃分析使用对数转换优势比在荟萃分析使用相关系数。这些估计以类似的形式为(17使用数据从相应的荟萃分析)。总结影响的估计在每一个荟萃分析推导出通过使用这些估计和方差估计的影响权重,给出的 在哪里,,。直接合成这些荟萃分析结果,我们使用加权平均转换效应估计如下: 在哪里,,。的方差是由。权重,,通常从方差计算,值,或者在原来的荟萃分析发现的置信区间的总和。文章只报告效应估计没有足够的信息合成真正的效果,应该被排除在外。前面类似的之后,我们可以表明,估计总体效果大约是一样的一个个体研究相结合。
使用的效果估计表达式(21)已经转化为相同的类型。据估计在原始荟萃分析可能不是相同的形式。例如,使用相关系数的分析可能会报告代替费舍尔的相关系数分数。假设荟萃分析估计的优势比和荟萃分析估计的相关系数。的这些指标及其方差最初报告的荟萃分析,整体效果估计可以写成以下表达式: 在哪里,,。及其方差 提出的估计(22)是一个总结标准化样本均值的差异。它的表达代表两个步骤。第一步是把优势比和相关系数相同规模的标准化样本均值的差异,第二步是计算总体平均差的荟萃分析。
3所示。例子
我们在两个例子说明提出的方法。第一个示例演示了使用我们的方法,结合两个荟萃分析产生相同的整体效果进行荟萃分析可包括在内的所有主要研究基于固定后果模型或随机模型。第二个例子说明了组合多个荟萃分析的过程相同的临床问题整合结果。计算使用R包进行“metafor。”
第一个例子是基于一个荟萃分析的迅速和卡拉汉(16相比),治疗结果之间的适当和不当使用26个人匹配组研究[16]。这些研究的治疗包括药物治疗、认知行为治疗、团体治疗。治疗结果范围从物质使用天减肥。所有的研究使用皮尔逊相关系数作为效应估计,估计和置信区间展示在表1。摘要使用所有26个研究相关系数估计95%的置信区间基于一个固定后果模型。我们两个单独的荟萃分析基于研究1 - 12和13 26研究中引用的参考部分审查在斯威夫特和卡拉汉(16]。摘要尺度效应这两个荟萃分析计算与样本方差和与样本方差。这是感兴趣的调查结合这两个尺度效应是否给出了类似的结果使用所有26个人研究进行荟萃分析。我们使用样本方差的倒数作为权重,计算加权平均总结效应的大小。由此产生的整体效应大小 它的方差是。95%置信区间也。结果是相同的那些发现使用所有单个尺度效应表明这个过程的潜在效用。
进一步说明我们重复的技术分析与随机模型(REM)。我们再次使用26个研究从斯威夫特和卡拉汉16),说明该总结获得的效果在REM可能略有不同的实现所有个体研究相结合。在快速眼动下,总结使用所有26个研究相关系数95%置信区间(0.0941,0.2253)。我们重复上述过程基于研究1 - 12和13 26的研究,分别。使用随机模型,总结相关系数这两个荟萃分析它的方差是和它的方差是。结合这两个尺度效应产生整体加权平均相关系数,其方差。这个方差小于单独的荟萃分析,表明更多的精度估算包括更多的个人研究的总体相关系数。95%置信区间。虽然研究之间的方差的估计略有不同在两个荟萃分析,结合两个pseudoanalyses产生类似的发现相结合的所有可包括在内的个别研究。
说明的方法合成不同类型的效应估计,我们创建一个合成数据集使用的研究迅速和卡拉汉(16]。我们将相关系数转换为标准化样本均值差异为研究1 - 9和对数转换机研究的优势比。估计是研究18-26保持不变。转换后的估计和表列出相应的置信区间2。的方差估计得到使用。我们使用固定后果模型对这些三组研究进行荟萃分析。摘要影响估计与,与,与。整体效果估计的平均差计算使用(22)与方差。我们看到,这个结果很接近总结效果计算从个体研究相结合的部分的开始均值与方差0.0016后转换成影响的大小。这表明该程序直接从荟萃分析结果相结合会产生类似的结果是理想的但更乏味的过程,而不是将个人研究减去从荟萃分析。
前交叉韧带(ACL)是一种常见的重建膝关节的韧带。进行了一项荟萃分析Biau et al。17)和m . c·福斯特和i w·福斯特(18]表明使用自体肌腱移植物移植失败并非与自体骨-髌腱-骨移植物相比明显不同。我们试图用我们的方法合成这两个荟萃分析在ACL重建移植物的选择。摘要贪污骨折的优势比Biau et al。17)95%置信区间和95%置信区间m·c·福斯特和i w·福斯特(18]。我们首先把优势比及其置信区间以来的自然对数尺度荟萃分析使用进行的优势比通常使用对数转换概率的加权平均比率。转换后,我们得到了对数转换优势比与方差和与方差。由此产生的日志比值比的总体评估 0.0695与方差。这个方差小于的荟萃分析由于包含更多的研究。的95%置信区间是()。转换回原来的规模,总体估计基于两个荟萃分析的优势比1.2613,95%置信区间(0.7523,1.2613)。尽管这个置信区间不显示显著差异在两个贪污的选择,它是窄比Biau et al。17)和m . c·福斯特和i w·福斯特(18]。这预计因为整体估计优势比在荟萃分析计算提供了一个更准确的指标比计算出单独的荟萃分析。
4所示。讨论
尽管荟萃分析的优势在传统的复习方法,这些技术并不是没有限制的。主要研究一样,多个荟萃分析经常产生矛盾的发现即使他们检查同一文献[7)考虑到大量的审查过程中所作的决定方法。这些决策影响搜索策略,编码的研究,版主检查,包含/排除标准和尺度效应的报告,每个有可能影响评审结果。尽管方法的透明度,总有一定程度的主观性研究合成(14]。我们提出的方法可以合成荟萃分析结果用最小的主体性。
试图表述的总体结果的系统回顾文献提出了许多挑战。部分挑战是缺乏一致性的作者报告荟萃分析的结果(19,20.]。从没有采用标准化的报告程序,有一个很大的变化如何整合报告发现在学科内和。此外,许多现存的荟萃分析不完全报告尺度效应;置信区间、方差度量和精确值往往省略。缺乏一致性和质量保证是一个主要的限制这个身体的研究和可能限制了荟萃分析结果的可移植性21]。主要研究一样,荟萃分析类似的结构可能在许多方面不同于另一个。为了解决这个问题,使荟萃分析更多的兼容,因此更适合于合成和更好地通知实践中,很明显,研究社会需要继续努力采用一套标准化的最佳实践进行行为健康和报告荟萃分析(见,例如,(22])。
在这里提供的示例说明,可以计算跨多个荟萃分析总结影响大小相同的干预,我们的测试的这些技术仍在进行中。这种方法一个潜在的障碍是缺乏独立,结果当多个荟萃分析包括许多相同的主要研究。治疗这些不同的结果作为独立可以产生不正确的估计方差的总结的效果,但这并不能否定的计算效果本身。这可以从(4结合个人研究)。例如,假设荟萃分析使用完全相同的一组研究。方程(4)成为 赋予相同的估计估计的荟萃分析总结影响。理想情况下,结果的方差应该一样的荟萃分析。但是相反,我们有 这往往是适当的值相比小得多的。这种限制使得该方法更适合于荟萃分析没有或有限的重叠的研究。一个可能的通货膨胀因素可以用方差增加在这种情况下纠正偏见方差的估计量。更一般的,重叠研究的荟萃分析,总结估计量的无偏方差可以写成 在通货膨胀因素低估了方差和纠正。如果可以从重叠研究检索,可以精确计算的因素。否则,调查员可能不得不猜通货膨胀因素的一个适当的值。
虽然需要进一步的研究提出了改进技术,这些初步验证的结果表明这种方法的实用程序结合意味着尺度效应从多个荟萃分析相同的干预或治疗。本文中详细的方法有几个可能的应用。这项技术最实用当几个荟萃分析进行了同样的待遇,产生了不同的结果。即使多个荟萃分析报告类似的发现对效应值的大小和方向,该技术可以用来总结整个现存整合证据基础。这项技术还提供了一个解决方案当荟萃分析进行更新之前研究合成;而不是忽视发现比入选标准的更新研究中,这种技术可以用来总结各种可用的证据。这些和其他潜在的应用使这个特别有吸引力的技术的研究者和实践者都面临的挑战,总结了快速扩张的整合研究在医学和其他学科。
确认
作者要感谢副主编和两个裁判的建设性意见。