文摘
广为引用生态分析自闭症的报道对汞排放,与降水和种族的县或学区。然而,国家教育机构经常抑制任何低数值自闭症数量发布前一致的现象被称为“行政审查。“以前的分析没有描述适当的审查数据分析方法;常见的替换或排除方法被引入偏差和人为产生狭窄的置信区间。我们应用贝叶斯审查泊松随机效应模型来重新分析2001有毒释放库存报告汞排放之间的关联和2000 - 2001自闭症在德克萨斯州。自闭症的相对风险估计减少了从4.44(95%置信区间CI: 4.16、4.74)每千磅。大气汞排放使用天真zero-substitution方法1.42(95%置信区间CI: 1.09, 1.78)使用贝叶斯方法。注意审查不足构成严重威胁的生态分析的有效性自闭症和其他健康状况。
1。介绍
自闭症的发病率一直在增加在美国在过去的几十年里,但是它的原因不清楚1]。一些生态分析自闭症的出现在过去的五年里,报道报道汞排放的相关性(2,3与降水(),4与种族[],5]。这些研究结果被广泛引用其他同行评议的出版物6和大众媒体广为流传的7,8]。尽管众所周知,生态学研究使用时可能会影响到聚合偏差估计个体层面的影响(9),生态研究自闭症等疾病通常容易受到额外的风险很少承认:低疾病方面的审查。
孤独症不是一个可报告的疾病,但州做跟踪和报告的总数自闭症学生接受特殊教育服务等条件下美国教育部1990年残疾人教育法案(P.L. 101 - 476, 618)。全州总额通常由美国教育部(10),但学校流行区、县必须来自每个国家的教育部门。全县环境释放的汞也可以通过美国环境保护署公开有毒释放库存,通过强制性的报告系统,包括任何设施发射10磅。每年的汞。
教育者有法律和道德义务来保护学生的隐私,他们的教育记录。一些国家限制在枚举少量的学生接受特定的特殊教育服务,以确保为这些学生的隐私。例如,德州教育机构为我们提供了确切自闭症计数区为5或更多的自闭症学生和地区没有自闭症学生,但是它使用了一个特殊的代码(999−)与1 - 4自闭症学生区。35%的地区落入后者需要特殊的代码(表1)。同样,Waldman et al。4)报道,俄勒冈州审查孤独症计数(即。,substituted a special code for the actual counts) for counties with fewer than 10 students with autism at any one year of age.
这些自闭症方面采取“行政审查”的形式的结果。基于可能性统计方法对行政审查结果一直用于经典参数固定效应模型(11),主要统计的是著名的分布广泛实现包。然而,先前的生态研究自闭症的引用统计方法如混合泊松效应模型和普通最小二乘回归,并非旨在处理审查观察(2- - - - - -5]。没有任何显式描述的方法来处理这些以前的出版物的审查的观察表明,审查值删除或替换等固定值为零。的确,人们可能会替代零错误地假设失踪后孤独症计数表明一个学区没有自闭症儿童的报告。
帕默et al。2,3)符合泊松随机效应模型关联2000 - 2001学区自闭症计数和2001年全县总汞释放,调整百分比白色,地区财富,经济弱势,百分比和城市化程度,但他们没有讨论审查。1029年我们能够编译这些变量的学区,和以前各年重新分析这些地区的数据使用模型所描述的帕尔默et al。2]。我们之前报道的类似的结果为2000 - 2001年帕默的使用零替换方法,RRs的总汞释放的1.29到2.03每1000磅(12),根据估计算法,与帕默的最初报道RR 1.61。然而,当我们代替较大的固定值(3)审查,我们的RR估计下降值附近的统一12]。汞排放和自闭症之间统计上显著的关联没有坚持。
实质性的结果之间的差异特别的固定值替换方法表明,处理审查计数的方法是至关重要的在此设置,激励以下分析。
2。方法
一般来说,每个区间观测的贡献可能是公关(),是一个随机变量描述计数区和的间隔是审查的价值所在。下面的语句组成一个审查泊松随机效应模型生态协会汞释放和自闭症之间使用德州数据: 在哪里学区观察自闭症计数吗,是泊松率参数建模为一个取幂七协变量和一个偏移量的线性组合的学生数量的日志,然后呢县是一个随机效应(许多县有多个校区)。,,s是未知参数感兴趣的参数:日志RR自闭症与每1000磅汞排放总量的增加。()代表一个正态分布的均值为0,方差。
尽管审查泊松固定效应回归被广泛实现的主要统计软件包,结局泊松随机效应回归统计研究的是一个较新的领域。此外,频率论的泊松随机效应回归算法依赖于不同的近似已知产生不同的可能性估计这些特定数据12)和罕见的结果(13]。我们使用贝叶斯参数估计方法相反,要求规范未知参数的先验分布。我们选择相对不提供信息的先验
使用3 WinBUGS我们实现了该模型,广义的环境进行贝叶斯分析使用马尔可夫链蒙特卡罗方法,以及r . WinBUGS R2WinBUGS图书馆提供代码(参见算法1)。至少100000次迭代被用于每个分析为每个3链;50%的迭代是丢弃的老化。抽样链的收敛性是评估使用阴谋和R-hat统计,这是小于1.01为每个后RR为汞和所有其他参数小于1.05。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
作为比较,天真的方法依赖于排除审查的观察或固定值替换为审查观察使用混合效果进行了泊松回归在R如前所述12]但lme的最近版本库(-31)0.999375版本。
我们也反复分析空气汞排放的汞排放总量。空气排放可以说是代表并发暴露比汞排放总量中描述的原因我们之前分析(12),后来。
3所示。结果
由此产生的贝叶斯后验的意思是RR估计每1000磅的报道总汞释放使用2000 - 2001年的数据是1.18(95%可信区间(CI): 1.07, 1.32)。相比之下,天真zero-substitution方法产生一个RR估计为2.02(95%置信区间CI: 1.96, 2.09)每1000磅。总汞的释放。表2显示了完整的参数估计的贝叶斯审查的可能性分析和天真的替代方法使用各种固定值和排除的方法。虽然有些幼稚的方法产生合理的中央估计,它们产生人为的狭窄的置信区间。
空气汞排放,后平均RR估计是1.42(95%置信区间CI: 1.09, 1.78)每1000磅。的汞。相比之下,zero-substitution方法产生一个RR估计为4.44(95%置信区间CI: 4.16, 4.74)每1000磅。的汞。完成空气汞排放的结果如表所示3。
我们检查敏感性的选择之前重复的空气汞分析之前的集中在日志(4.44)。这一分析取得了几乎相同的结果(RR = 1.42;95%置信区间:1.10,1.80)主要分析,表明我们的选择的先验分布的影响汞并不过分影响。
4所示。讨论
我们的结果充分利用生态协会审查的可能性表明汞排放总量和2000 - 2001年自闭症之间在德克萨斯州学区可能比以前小得多的报道。降水和自闭症之间出版协会也依赖于审查数据,可能会受到类似的偏见的影响。RR生态协会的估计,使用经过审查的可能性相当类似于使用的结果特别的替代方法当值附近的中间审查间隔被选出。然而,置信区间(适当地)更广泛的贝叶斯方法基于可能性比替换方法。排除所有审查值产生中央RR估计贝叶斯方法相似,但是人为的狭窄的置信区间。
然而,所有结果也应该被视为生态效应估计,可能不是代表个人层面的影响由于聚合的偏见。组级别分析的另一个后果是,不确定性关于个体层面的汞暴露和自闭症之间关联在德克萨斯州远远大于组级别建议的置信区间,在以前的出版物报道(3,5,12]。
这些结果令人惊讶我们考虑到截止的审查非常低(5的学生),但是他们也可能被解释成一个明显的汞排放和审查的存在之间的联系,通过这些地区小自闭症方面倾向于较低汞排放。这种效应可能是通过检查图更好的理解1,这显示了数据和模型适合使用各种固定值替换方法。因为许多审查值发生在较低的县汞排放,整个拦截从混合泊松回归效果是高度敏感的选择定值代替经过审查的观察。相比之下,有相对较少的审查观察县高汞释放,导致一个更稳定的预测曲线的右侧的位置。结果似乎是强迫的斜率(日志相对风险)拦截时更高的价值更低。
虽然总汞排放和空气汞排放都是贫穷的代理人个人汞暴露,空气汞排放可能是一个更好的代表并发曝光比总汞释放。总汞释放包括填埋处置和其他版本可能不是导致普遍的或直接的公开曝光,尤其是符合1976年资源保护经济复苏法案(P.L. 94 - 580年)和1984年的修正案。相比之下,空气汞排放更广泛和迅速与风力和降雨和分散,因此,两个,更合理的人类暴露在短期内的来源。地表水汞排放也可能迅速分散,但这些排放量相对较小的2001年在德州:只有25%的德州县报告任何地表水汞排放,和最大的年度版16磅。空气汞释放发生在更大的数量,报告发布在大多数德州县,平均每年288磅的释放。,最多每年发布的1579磅。虽然这些分析受限于数据的自然生态和原油的曝光,我们相信汞排放的空气更相关的测量在这些限制。研究人员考虑类似的分析也应考虑时滞比较孤独症的计数与排放/暴露估计前几年,允许足够的时间环境交通、自闭症开发和诊断发生(12]。
三个替换和排除方法恰好提供了一个粗略的近似中央RR估计这些特定的数据,但基于可能性方法处理审查数据产生更现实的置信区间和有较强的理论基础。所有以前的和当前的方法,然而,取决于公共模型假设,如泊松分布统计,日志的线性预测和足够的控制混杂。第三个假设是目前最关心的分析,考虑到有限的理解自闭症风险因素和缺乏任何个体层面的汞暴露或混杂因素的数据。
生态学研究自闭症并不是唯一研究有效性审查疾病数量是一个威胁。所有特殊教育德州管理审查报告的分类计数,和同样的行为似乎是其他一些州紧随其后。其他州报告的统计数据可能会影响到类似的问题。此外,保护隐私的努力在1996年健康保险携带和责任法案(p.l.104 - 191)可能导致行政审查医疗监测数据当数极低。大型数据集的广泛的计算机化、生态分析变得更容易进行,可能会更频繁地出现在科学文献中,尽管它们的局限性。
审查也出现在化学浓度测量,环境健康的另一个常见的问题,通过报告的低浓度低于检测极限”(LOD)。如果排除审查值,计算方法通常会在此设置向上的偏见。环境健康研究人员用0的悠久传统,LOD / 2, LOD /,或对这些审查LOD值,治疗好像他们实际上观察到的替换值。替换的方法很容易实现,但不如正式基于可能性审查数据分析,它也可能产生偏见的估计,总是无法捕捉LOD以下与测量相关的不确定性,如在计算置信区间(14]。然而,替换或排除可能的负面影响可以忽略不计当满足以下两个条件:(1)一些样本低于截止审查和审查(2)截止很小,相对于大多数的测量。
5。结论
我们的分析表明,水星和自闭症之间之前报道生态协会在德克萨斯州可能被高估了由于审查自闭症计数统计分析不足。行政审查人员应该意识到这个问题的疾病数量以及临时替换方法如何引入偏差和低估效应估计的不确定性。贝叶斯方法提供了一个潜在的解决问题的办法,不依赖可能近似,并且实现起来并不困难。
缩写
| 置信区间: | 置信区间 |
| LOD: | 检测极限 |
| RR: | 相对风险。 |
承认
虽然这项研究并不是由任何研究基金或合同,作者要感谢电力研究所资助之前发表的原始数据编译和分析。