盆腔炎的检测:利用管理数据开发自动病例发现算法

抽象的

ICD-9代码通常用于鉴定免受监测目的的管理数据的盆腔炎（PID）。这种方法可以包括非PID案例。在具有PID的ICD-9代码的女性中改进女性的PID案例识别，使用额外的变量开发了一种案例发现算法。潜在的PID案件在Group Health（GH）和Kaiser Permanente Colorado（KPCO）和Kaiser Permanente（KPCO）的妇女之间确定了潜在的PID案件，并通过医疗记录审查核实。分类和回归树分析用于在GH下开发算法;验证发生在KPCO。单独使用ICD-9代码识别临床PID病例的阳性预测值（PPV）为79％。该算法确定了PID适当的治疗和15-25岁作为预测因素。算法灵敏度（%；%)及PPV (%；％）很高，但特异性差（%；％）。在GH中，该算法提供了医疗记录审查的实用替代方案，以进一步改善PID案例识别。

1.介绍

估计的770,000例骨盆性炎症疾病（PID）在美国每年诊断核查[1］．PID包括子宫，输卵管，卵巢和其他相邻组织的感染和炎症，并且具有多种传染性病因，其中许多已经证明是性传播的，包括Chlamydia Thachomatis.[2］．C. Thachomatis.已经在大约四分之一的患者中分离出症状PID诊断[3.］．

任何病因的PID可能导致进一步的不良结果，包括输卵管不孕，异位妊娠和慢性骨盆疼痛[2];大约10％-20％的PID病例与不孕症和异位妊娠有关[3.］．衣原体和与PID相关的其他感染的具体贡献（例如，淋病奈瑟氏菌和尿道支原体)对这些不良结果的影响是未知的[4.那5.］．然而，在使用辅助生殖治疗的不孕夫妇中，10-20%被诊断为输卵管性不孕[6.那7.］．为了预防PID和随后的不孕症，建议为<25岁的所有性活跃女性进行衣原体筛查[8.那9.］．之前的研究表明，筛查可以将PID开发的风险降低到50％[10.那11.］．

虽然监测PID的趋势是量化PID公共卫生负担以及评估衣原体预防努力的影响的关键组成部分，但PID监视是具有挑战性的。在没有基于实验室的案例定义的情况下，PID在临床症状和症状的基础上被诊断出来[12.］．美国疾病控制和预防中心(CDC)建议，当年轻女性无其他明确原因的下腹痛，并伴有子宫或附件或颈椎运动压痛时，采用经验疗法治疗PID [8.］．因此，临床诊断缺乏特异性。用于诊断输卵管感染的“黄金标准”是腹腔镜检查，一种在临床实践中很少进行的侵入性程序[13.］．为了识别PID病例进行研究和监测，病历审查提供了验证PID临床诊断的最佳方法。ICD-9代码用于从管理数据中识别PID病例，而不是审查医疗记录。PID的临床诊断可以由几个ICD-9编码来代表。最常被引用的ICD-9代码，614.9(女性盆腔炎未特别说明)对PID监测病例定义的阳性预测值(PPV)仅为18.1%，远远高于用于经验治疗的临床定义[14.］．当加上阳性衣原体试验时，PPV增加到56％;但是，实验室测试结果通常在用于检查PID速率和趋势的行政数据集中不可用。目前用于监控急性PID的多种ICD-9代码的PPV缺乏信息。

使用ICD-9代码从管理数据中识别的潜在PID案件包括某些没有PID的女性。为了进一步改进妇女子集中临床诊断的PID的鉴定，暗示PID的ICD-9代码，医疗记录审查是优选的，但成本高。将基于附加管理数据应用于从ICD-9代码识别的潜在PID案件的PID案例查找算法可能更加实用，并允许PID监视活动的更准确的负担和趋势确定。该分析的目的是双重组合：（1）以确定使用ICD-9代码的PPV来识别PID和（2），使用管理数据元素开发PID案例查找算法，以便在PID中轻松识别女性的PID案例- 相关的ICD-9诊断代码。

2.材料和方法

两个混合模型医疗组织，团体健康合作社（GH，Seattle，Wash，USA）和Kaiser Permanente Colorado（KPCO，DENVER，CO）的数据都被用于该分析。2006年，在GH中招收了大约125,000岁的女性，在GH中注册了约116,000岁的同一年龄段的妇女。两个组织都维持广泛的自动化行政和临床数据，包括每个登记者的注册信息，人口统计学，医疗利用，诊断，程序，实验室测试和药房记录。

2.1。数据采集

用于PID的其他流行病学评估中使用的一组14个ICD-9代码用于识别GH管理数据库中具有潜在PID案例的妇女（表1）[1那15.］．仅考虑了未被鉴定为慢性的PID的代码，因为这些病例可能更有可能代表与传染性原因相关的PID病例，例如通过筛查努力来防止可能预防的衣原体。在彼此60天内发生的PID诊断被认为是相同的PID集。利用2003年至2007年的GH数据，15至44岁的女性共有2,764例潜在的PID案件。在此时间段内，PID利率从568件案例/ 10万人略有下降至473 / 100,000;这些数据已在另一个出版物中描述[16.］．从2,764个总潜在病例中，393个潜在病例的样品被随机选择用于医疗记录审查，以确定临床诊断是否pID。如果一个女人从2003年到2007年有多个PID诊断，则仅在样本中包含第一个PID集。表中显示了与393个潜在案例相关的ICD-9代码的分布1;可以选择多个ICD-9代码来访问与每个潜在的PID外壳相关联的访问。


ICD-9代码和描述	有代码的潜在病例数* (%)

098.10-急性GC上顾道，网站未指明
098.16-急性GC子宫内膜炎
098.17-急性GC蝾螈炎	5 (1.3)
098.19急性GC上消化道，其他部位
098.86急性GC腹膜炎

099.56急性CT腹膜炎	0 (0.0)

614.0-急性Salpingo-oophoritis
614.5-急性或未指明的骨盆性腹膜炎	8（2.0）
614.8其他特定炎症性疾病，女性盆腔器官

614.2-蝾螈/卵巢炎，不是急性或慢性	22日(5.6)

614.3-急性主节静脉炎/ PID	53（13.5）

614.9-未指明的炎症疾病，女性骨盆器官	252（64.1）

子宫炎症，宫颈除外	15 (3.8)

615.9子宫未明确炎症性疾病	80（20.4）

GC：GONORRHEA，GU：泌尿生殖，CT：衣原体。
*单个潜在PID病例可能包含多个ICD-9编码。共鉴定出393例潜在PID病例，使用ICD-9编码435例。

通过使用结构化图表复查仪查看电子病历，确定实际PID病例状态(即临床诊断)。潜在的PID病例被确诊为临床诊断的病例，或者在就诊时根据明确的PID临床记录(如“PID”、“盆腔炎”、“盆腔感染”、“输卵管炎”等)确诊。不考虑用于患者评估的PID文档(例如，“排除PID”)。无论临床症状或体征是否支持此类诊断，都要确定临床PID状态。临床状态不确定的病例由研究小组成员(DS)进一步审查。

除了表中所示的PID的ICD-9诊断码1，从GH管理数据中提取可能与PID相关联的其他变量被评估为PID案例查找算法的开发中的潜在预测器。这些包括在诊断时的年龄，治疗PID，住院入学，是否进行了衣原体测试，并在第一次PID诊断前7天发生在第一次PID诊断后7天发生在第一次PID诊断。这些其他可能的诊断由ICD-9代码定义，包括阑尾炎，卵巢囊肿，异位妊娠，肾盂肾炎，胰腺炎，平滑肌瘤和子宫内膜异位症。基于2006年推荐的PID处理将适于PID的适于PID的处理定义为左氧氟沙星（每天一次每天14天）或每天25毫克，每天两次口服25毫克）[14天）[12.];还包括其他可能的PID处理方案。

来自KPCO的管理和医疗记录数据被用作外部验证数据集，以评估另一个设置中PID案例查找算法的性能。在2003年至2008年的KPCO行政数据中，使用相同的ICD-9代码确定了2,685名妇女的PID案件，均为15至44岁的妇女（表格）1）.其中，随机选取500例进行病历复查，以确定临床PID病例状态。在GH开发数据集中使用的结构化图表审查工具也用于KPCO的医疗记录审查。所有研究程序均在每个机构(GH和KPCO)接受人体受试者审查和批准。

２.２.统计分析

利用GH数据集进行分类回归树(CART)分析，开发PID病例查找算法。CART此前已被用于改善异位妊娠病例的发现和糖尿病病例的识别[17.那18.］．该分析中的算法目标是从管理数据识别其他可广泛可用的变量，以帮助预测医疗记录审查所定义的临床PID病例。购物车是一种非参数，二进制递归分区方法，通过将数据分成两个分支（或“节点”）来构建决策树或分类算法。19.］．分层识别的重要预测器是分层识别的，并且潜在的情况被分类为每个节点的PID案例。在该分析中，考虑了潜在的预测因子包括ICD-9代码（表1），诊断年龄，是否给予适当对PID的治疗，住院入学，是否进行了衣原体测试，以及其他并发诊断（上文所述）。此过程多次重复，直到建立最佳树。在每个分支，数据最佳地分割以最大化基于因变量的观测的分化;在这种情况下，依赖变量是医学记录审查的确认临床PID诊断（是/否）。

然后将使用GH数据开发的PID案例查找算法应用于KPCO数据。通过将算法预测的PID案例状态与每个示例数据集（GH和KPCO）中的医疗记录审查所确定的PID案例状态进行比较来评估算法性能。概述评估算法性能的统计数据在与PID相关的ICD-9代码的妇女样本群中计算出来的;医疗记录审查结果被认为是真理。灵敏度被定义为ICD-9代码正确分类的PID病例的比例，并通过医疗记录审查确认为通过算法确定为PID的PID案例。特异性是ICD-9代码标识的PID病例的比例，但决定不被算法正确归类为不正确的PID。否定预测值（NPV）计算为由算法分类的潜在案例的比例，而不是通过ICD-9代码标识的PID，并发现不通过医学记录审查进行PID。阳性预测值（PPV）被定义为算法分类的PID案件的比例，被医疗记录审查所确认的PID。还计算了使用ICD-9代码选择PID案例的PPV。与医疗记录审查结果相比，整体错误分类比例计算为算法不正确地归类的潜在PID病例的比例。 The 95% confidence intervals (CIs) based on the binomial distribution were calculated for all performance measures.

使用SAS版本9.1.2（SAS Institute Inc.，Cary，NC），R（统计计算，维也纳，奥地利）和Openepi进行分析[20.那21.］．使用R包中的“RPART”进行推车分析。

3.结果

在使用ICD-9代码在GH中鉴定的393个潜在的PID病例中，确认了基于医学记录审查的临床PID的275（70.0％）;74（18.8％）没有PID;6（1.5％）是不确定的案件状况;38（9.7％）没有关于记录PID ICD-9代码的访问的信息（表2）.500个潜在的KPCO PID病例的样品，确认349（69.8％）被PID，92（18.4％）未PID，5（1.0％）不确定，54（10.8％）没有信息访问。


	基于医疗记录评论的PID诊断（％）				全部的
	PID	没有PID	不确定的	任何信息	全部的

GH发展数据集	275（70.0）	74（18.8）	6（1.5）	38（9.7）	393
KPCO验证数据集	349（69.8）	92（18.4）	5（1.0）	54 (10.8)	500

盆腔炎。

在用于识别GH潜在PID病例的14个ICD-9编码中，614.9是最常见的，与393个潜在病例的64.1%相关(表)1）.鉴定了潜在的PID案例的大部分访问只有一个ICD-9选择（92.4％），5.9％有两种代码，1.8％有三个或更多。在GH中，275个确认的PID案件的68.0％有ICD-9守则为614.9。在KPCO的500例潜在的PID病例中，50.4％编码了614.9 ICD-9码;441个确认的PID案件中的48.4％有614.9码录制。

单独使用ICD-9编码鉴定GH区PID病例时，PPV为78.8% (95% CI: 74.1-83.0%)。KPCO的结果类似，使用ICD-9编码的PPV为79.1% (95% CI: 75.0-82.8)。

PID寻例算法如图所示1．在GH的393个潜在的PID案件中，44个具有不确定的案件状态或没有可用信息。因此，349个潜在的PID病例用于开发算法。通过算法识别出临床PID的两种预测因素。确定的最强预测值是存在适于PID的治疗。该算法在行政数据中分类了278例，作为PID患者的有记录数据的潜在病例，其中249（89.6％）被证实为临床诊断的PID。在没有记录PID治疗的那些女性中，发现较年轻的年龄是最重要的预测因素。具体而言，在未接受PID治疗的15-25岁之间的少女被算法归类为PID案例。在27项这些女性中，治疗PID病例，16例（59.3％）。在44名没有PID治疗的女性中，年龄26-44岁，34（77.3％）通过算法正确归类为没有PID。 No specific ICD-9 code was a stronger predictor than PID treatment and age.

使用GH和KPCO样本数据的算法性能的摘要统计显示在表中3.．在GH，算法灵敏度为96.4％（95％CI：93.4-98.2％），特异性为45.9％（95％CI：34.3-57.9％），NPV为77.3％（95％CI：62.2-88.5％），和PPV为86.9％（95％CI：82.9-90.5％）。使用该算法，14.3％的潜在的PID病例在与PID相关的ICD-9守则的妇女样本群体中被错误分类。当从KPCO施加到验证数据集时，算法敏感性为90.3％（95％CI：86.7％-93.2％），特异性为37.0％（95％CI：27.1％-47.7％），NPV为50.0％（95％CI）：37.6％-62.4％，PPV为84.5％（95％CI：80.4-88.0）;20.9％的潜在病例被错误分类。

（一种）PID病例查找算法的准确性:GH开发数据集。


		新算法分类		全部的
		没有PID	PID

图表确认诊断	没有PID	34.	40	74

PID	10.	265.	275

	全部的	44.	305.	349.

（b）PID案例查找算法的准确性：KPCO验证数据集。


		新算法分类		全部的
		没有PID	PID

图表确认诊断	没有PID	34.	58	92
	PID	34.	315.	349.

	全部的	68	373.	441.

（C）


性能统计（95％CI）	GH发展数据集	KPCO验证数据集

PID案例识别单独使用ICD-9代码*
PPV	78.8% (74.1 - -83.0%)	79.1％（75.0-82.8％）
PID案例识别使用算法
Sensitivity	96.4% (93.4 - -98.2%)	90.3％（86.7-93.2％）
Specificity	45.9% (34.3 - -57.9%)	37.0％（27.1-47.7％）
PPV	86.9％（82.6-90.5％）	84.5% (80.4 - -88.0%)
NPV	77.3% (62.2 - -88.5%)	50.0％（37.6-62.4％）
分类错误的潜在病例比例	14.3％（10.8-18.5％）	20.9% (17.2 - -25.0%)

*ICD-9代码见表1．仅包含具有完整图表审查信息的潜在案例。
GH：Group Health，KPCO：Kaiser Permanente Colorado，PID：盆腔炎，CI：置信区间，PPV：阳性预测值，NPV：消极预测值。

算法中包含的两个预测器的分布类似于GH和KPCO潜在PID病例之间的PID处理，但在PID诊断时的年龄不同。在GH中，90.6％（249/275）确诊的PID病例已经记录了适合PID的治疗，而发现不得PID的39.2％（29/74）。同样，在KPCO中，84.0％（293/349）确诊的PID病例已经记录了适当的抗微生物处理，而非PID病例的38.0％（35/92）。当在GH的诊断中检查年龄时，49.1％（135/275）所确诊的PID病例为<26岁，而医疗记录审查确认的28.4％（21/74），不得PID。然而，在KPCO妇女年龄<26岁的女性占确诊的PID病例的38.1％（133/349），41.3％（38/92）未PID的病例。

4。讨论

性病预防的主要目标之一是减少与性病有关的不孕症的负担。监测PID(性病感染和不孕症发展之间的中间不良结局)的趋势可能有助于确定性病预防的进展。然而，对PID的监测通常依赖于行政数据源的病例识别，历史上一直很困难。

为了识别来自医疗记录的PID的临床诊断，监测和研究目的的数据，管理员和研究人员传统上仅仅依赖ICD-9诊断代码。在本研究中，使用标准集ICD-9代码来识别潜在的PID案例，一种简单的方法，PPV相对于医疗记录评论，在两个站点都有相当高的，约79％。但是，使用ICD-9代码具有局限性，包括缺乏特异性[14.]、非标准应用程序(特别是可能使用多个代码来指定一种情况时)，以及在选择使用哪个ICD-9代码时，在个人和医疗保健站点之间的使用情况不同。

该分析中开发的算法将额外的自动化数据元素作为医疗记录审查的实际替代品，以改善PID相关ICD-9代码的女性子集中的PID案例。算法灵敏度（GH = 96.4％; KPCO = 90.3％）和PPV（GH = 86.9％; KPCO = 84.5％）在两个位点高，但在开发算法（GH）的网站上较高。然而，在两个站点的特异性和NPV都很低，虽然再次，在算法开发站点上表现更好。在GH中，算法错误分类的潜在PID病例的比例为14.3％;在KPCO，使用算法错误分类的病例的比例为20.9％。因此，使用GHA数据开发的算法在该第二站点中也没有表现。但是，当使用单独使用ICD-9代码来识别潜在的PID情况时，PPV为79％;施用算法时，PPV在KPCO中增加到85％，87％在算法时。鉴于识别和PID监视的挑战，诸如案例查找算法的可用性等小的改进提供了超出仅基于ICD-9代码的PID案例的实践的机会。如本研究表明，此类价值的程度可能对评估的群体特异。

目前，由于广泛的数据限制，公共卫生专业人员必须主要依靠对性病发病率趋势、PID诊断趋势和并发性传播疾病(STD)预防活动的生态比较来评估方案的影响。随着数据系统的改进，通过实验室数据、临床数据和附加管理数据之间更好的自动化联系，std特异性PID诊断的确定可能成为可能。电子病历的扩大使用可能为进一步加强性病相关PID的监测提供机会。找出改进PID病例查找的可能方法将是一个重要因素。

该分析有几个限制。由于预算和时间约束，只有有限数量的医疗记录抽象，因此，开发的算法可能不具有稳健性。更大的样本可能导致不同的算法。在两个站点中选择了基于ICD-9诊断代码的潜在PID案例的随机样本，并且用于开发和验证算法的数据通常代表具有相关ICD-9代码的潜在PID案例的整个群体在研究期间GH和KPCO。在该分析中，使用ICD-9代码识别潜在的PID案例;ICD-9代码可能无法跨医疗保健设置一致地应用。没有通过ICD-9代码（假否定）未标识的PID的人口（假否定）的信息;因此，不能单独使用ICD-9代码来识别临床诊断的PID病例的敏感性，特异性和负预测值。最后，算法性能统计数据不包括临床PID状态丢失或无法确定的妇女; fortunately, this finding occurred in a fairly low proportion of potential cases. While the algorithm would classify these cases as PID or not, the performance of the algorithm could not be assessed without medical record review information.

该分析的优势包括评估目前用于识别管理数据中的PID的ICD-9代码组。这项研究是第一个研究这些代码是如何执行相对于临床PID病例检查定义的医疗记录审查。CART方法的使用代表了另一个优点。该策略允许对临床诊断的PID病例的其他可用自动化预测器进行全面评估，以及这些预测器的所有可能的值分割，而无需对潜在的变量分布(非参数方法)进行假设。CART结果的解释很简单，并且在初始算法开发后很容易应用于另一个外部设置(KPCO)，以评估算法的稳健性。

5。结论

监测PID在评估STD预防和控制努力方面很重要，特别是预防衣原体和淋病。该分析中使用的方法可能有助于提高PID监视努力。虽然诊断PID的挑战仍然存在，但结果在两项研究设置中表明，单独使用ICD-9代码的PPV预测临床PID诊断非常高。在GH中，PID案例查找算法还提供了一种实用的替代方案，可以在具有ICD-9代码的妇女中进一步改进PID案例识别，提示PID。对较大样本中的案例结果预测器的进一步探索可能导致更稳健和更广泛的算法。应持续研究识别行政数据临床PID病例的额外新方法。

披露

该报告中的调查结果和结论尚未由疾病控制和预防中心正式传播，不应解释为代表任何机构的决定或政策。

承认

作者希望感谢疾病控制和预防中心(CDC)的James Buehler博士，感谢他为本文的框架提供了有价值的指导。

参考

M. Y.Sutton，M.Sternberg，A. Zaidi，M. E. S.LOUIS和L.E. Markowitz，“盆景炎症病院排放和外国人访问的趋势”，美国，1985-2001，“性传播疾病，卷。32，不。12，pp。778-784,2005。查看在：出版商网站|谷歌学术搜索
J.Paavonen，L. Westrom和D. Eschenbach，“盆腔炎，”性传播疾病P. F.斯帕林，W. E. Stamm等。，第1529-1561页，McGraw-Hill，第四版，2008。查看在：谷歌学术搜索
C. L. Haggerty, S. L. Gottlieb, B. D. Taylor, N. Low, F. Xu, and R. B. Ness，“术后后遗症的风险Chlamydia Thachomatis.妇女的生殖器感染，“中国传染病杂志第201卷第2期2, pp. S134-S155, 2010。查看在：出版商网站|谷歌学术搜索
P. Oakeshott, S. Kerry, A. Aghaizu等，“筛查的随机对照试验Chlamydia Thachomatis.为防止盆腔炎：POPI（预防盆腔感染）试验，“BMJ.， vol. 34, p. c1642, 2010。查看在：出版商网站|谷歌学术搜索
L. A. Wallace, A. Scoular, G. Hart, M. Reid, P. Wilson, D. J. Goldberg，“女性感染生殖道衣原体后不孕的额外风险是什么?对证据的系统回顾，”性传播感染，卷。84，否。3，pp。171-175,2008。查看在：出版商网站|谷歌学术搜索
M. Macaluso，T. J. Wright-Schnapp，A. Chandra等，“公共卫生专注于不孕症预防，检测和管理，”生育和无菌性，卷。93，没有。1，pp。16.E1-16.E10，2010。查看在：出版商网站|谷歌学术搜索
疾病控制和预防和美国生殖医学协会的中心，辅助生殖治疗成功率：国家综述和生育诊所报告，卫生和人类服务部，亚特兰大，乔治，2009年。
疾病控制和预防中心，“性传播疾病治疗指南，2010年”MMWR.，第59卷，第1-110页，2010。查看在：谷歌学术搜索
N. Calonge，D. B.Petitti，T.G.Dewitt等，“衣原体感染的筛选：美国预防性服务工作队推荐陈述”内科第147卷2，页128-134,2007。查看在：谷歌学术搜索
L. Østergaard, B. Andersen, J. K. Møller，和F. Olesen，“用于筛查的家庭取样与传统棉签取样Chlamydia Thachomatis.在女性中:一项1年的群集随机随访研究，”临床传染病第31卷第1期4，页951-957,2000。查看在：出版商网站|谷歌学术搜索
D. Scholes, A. stergachhis, F. E. Heidrich, H. Andrilla, K. K. Holmes，和W. E. Stamm，“通过筛查宫颈衣原体感染预防盆腔炎”，新英格兰医学杂志，卷。334，不。21，pp。1362-1366,1996。查看在：出版商网站|谷歌学术搜索
疾病控制和预防中心，“性传播疾病治疗指南，2006年”MMWR.，卷。55，不。7，pp。38-40,2006。查看在：谷歌学术搜索
I. Simms, F. Warburton，和L. Weström，“盆腔炎的诊断:重新思考的时间”，性传播感染，卷。79，没有。6，pp。491-494,2003。查看在：出版商网站|谷歌学术搜索
S. Ratelle, D. Yokoe, C. Blejan等，“CDC盆腔炎症(PID)病例定义的临床诊断代码的预测价值:监测的意义”，性传播疾病，卷。30，不。11，pp。866-870,2003。查看在：出版商网站|谷歌学术搜索
M. K. Bohm, L. Newman, C. L. Satterwhite, G. Tao，和H. S. Weinstock，“私人保险妇女的盆腔炎，美国，2001-2005，”性传播疾病，第37卷，第2期3，页131-136,2010。查看在：出版商网站|谷歌学术搜索
D. Scholes, C. L. Satterwhite, O. Yu等人，“长期趋势Chlamydia Thachomatis.美国管理护理人群的感染和相关结果，”性传播疾病．在出版社。查看在：谷歌学术搜索
D. Scholes, O. Yu, M. a . Raebel, B. Trabert, V. L. Holt，“使用分类算法改进宫外孕的自动病例发现”，人类繁殖第26卷第2期11, pp. 3163-3168, 2011。查看在：出版商网站|谷歌学术搜索
W. Lo-Ciganic, J. C. Zgibor, K. Ruppert, V. C. Arena，和R. a . Stone，“使用管理数据识别1型和2型糖尿病病例:树形结构模型，”糖尿病科技杂志CHINESE，第5卷，第5期。3, pp. 486-493, 2011。查看在：谷歌学术搜索
L. Breiman, J. Friedman, C. J. Stone等，分类与回归树，泰勒和弗朗西斯，贝尔蒙特，加利福尼亚州，1984年。
A. Dean, K. Sullivan，和M. Soe， " OpenEpi:公共卫生的开源流行病学统计，版本2.3.1，" 2010，http://www.openepi.com/oe2.3/menu/openimenu.htm.．查看在：谷歌学术搜索
RDC团队，“R：统计计算的语言和环境，”维也纳，奥地利：统计计算基金会，2008年，http://www.r-project.org．查看在：谷歌学术搜索

妇产科的传染病

盆腔炎性疾病

抽象的