IPID 跨学科视角传染病 1687 - 7098 1687 - 708 x Hindawi出版公司 314762年 10.1155 / 2008/314762 314762年 研究文章 结合微阵列技术和分子流行病学识别与侵袭性相关的基因B组 链球菌 立信 1 Reddi Usha 2 Srinivasan Usha 1 1 博查特 斯蒂芬妮·M。 1、3 皮拉伊 Parvathy 1 梅塔 1 Styka 安妮N。 1 DeBusscher 1 马斯 卡尔·F。 1 Foxman 贝琪 1 Metlay 约书亚P。 1 部门的流行病学 密歇根大学公共卫生学院的 密歇根州安阿伯市48109 美国 2 在生物信息学 东密歇根大学 Ypsilanti, MI 48197 美国 3 法戈VA医学中心 法戈,ND 58102 美国 2008年 06 12 2007年 2008年 29日 08年 2007年 29日 11 2007年 2008年 版权©2008 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

许多细菌物种功能作为共生体和病原体;我们使用这个双重性质开发高通量分子流行病学方法识别细菌毒力基因。我们应用B组的方法 链球菌(GBS)。三个代表共餐者和一个入侵GBS分离被选为测试菌株从集合以人群为基础的。我们使用的芯片比较基因组杂交确定开放阅读框(orf)出现在两个测序侵入性压力,但在测试菌株缺失或发散。我们筛选23个变量并对949 GBS分离使用GBS幻灯片(LOS)微阵列平台库。四个orf更频繁地发生在侵入性比同桌的隔离,和一个更频繁地出现在同桌的隔离。比较用一个寡核苷酸微阵列杂交,结合流行病学筛查使用《微阵列平台,使快速识别细菌基因可能与致病性有关。

1。介绍

B组 链球菌(GBS),或 链球菌agalactiae,一种常见的肠道居住,也经常在阴道、尿道、咽无症状地。然而,GBS可引起各种侵入性疾病,主要发生在新生儿,婴幼儿,老年人,孕妇 1- - - - - - 3]。宿主因素显然是重要的GBS疾病主要发生在弱势群体。尽管如此,细菌毒力因素也必须扮演一个角色:致病倾向不同的血清型( 4),交叉血清型和基因序列类型,这可能造成高侵袭性疾病,已确定( 5]。

九个已知GBS荚膜血清型,血清型,III和V引起GBS的大多数疾病在美国( 1, 6- - - - - - 8]。的分子流行病学研究的人口结构和GBS分离表明GBS种群克隆,但一些菌株可能比其他人更致命的( 9- - - - - - 13]。由pulsed-field凝胶电泳(但是脉冲场凝胶电泳的出现),致病血清型内隔离异质性有限(1998年Schuchat,回顾 2]),而殖民隔离非常异构( 14)在一个特定的血清型,表明入侵隔离有特色,加强发病机理。毒性的差异可能与毒力基因的存在与否 15]。虽然取得了进步在理解经典的GBS特征,如荚膜多糖, β 溶血素、ca5的肽酶和免疫原性表面蛋白( 16- - - - - - 19),我们对GBS感染的发病机制的理解是有限的:对细菌遗传因素导致毒性或致病菌株的传播。

完成和草案基因组序列的可用性的几个GBS菌株提供了一个机会来洞察GBS毒性的分子基础。这些基因组序列分析证实了高水平的GBS菌株之间遗传异质性,甚至同一血清型的( 20.]。GBS基因组包含大量的基因岛经常菌株之间的不同,可能是毒性基因的地区居住( 21- - - - - - 23]。成千上万的基因识别GBS基因组,当前的挑战是要确定哪些是重要的在GBS发病机理和传播。在先前的研究 大肠杆菌,我们提出了一个细菌基因识别和评价的方法,依靠流行病学信息定义为基因组选择隔离减法和临床流行病学筛查的集合进行评估基因通过基因确定减法的意义( 24]。在这个报告中,我们运用同样的原则在GBS的三步走的战略研究。进一步,我们采用新颖的微阵列平台,使我们能够系统地识别候选基因和评估他们的大规模的重要性。

基因组比较致病性和非病原的菌株在一个物种是一个强大的战略确定候选基因重要毒性( 25, 26]。因为目前没有从共生体隔离GBS基因组测序,我们首先选择几个有代表性的殖民GBS菌株在以人群为基础的样本进行比较排序第三致病性血清型菌株(NEM316)和血清型V应变(2306 vr),代表最常见致病隔离两种血清型。然后我们确定序列差异及其相关变量之间的基因选择殖民入侵GBS和测序菌株用比较基因组杂交fine-tiling寡核苷酸微阵列。最后,一组选定的变量筛选基因是反对大面板的殖民和侵入性菌株幻灯片使用图书馆微阵列与疾病评估他们的协会。我们这个报告的主要目的是使用GBS这项研究作为一个例子来演示和评估方法。

2。材料和方法 2.1。菌株和文化条件

致病和同桌的GBS分离不同集合的选择从以前的流行病学研究。集合包括隔离从妊娠健康男性和女大学生进入密歇根大学( 27- - - - - - 30.),隔离从有症状和无症状的孕妇在密歇根大学医学中心诊所( 31日),隔离来自病人通过威斯康辛入侵细菌实验室监测系统在1998年和2002年之间( 32]。额外的隔离与早期和晚期新生儿在德州发生疾病( 8)以及隔离于孕妇有无GBS疾病得到从卡罗尔·j·贝克博士(美国德克萨斯州休斯顿贝勒医学院)。这些菌株被大致分为两类:入侵隔离从患者侵袭性疾病( n = 386年 )和殖民分离对象没有任何症状的疾病( n = 563年 )。GBS应变NEM316 [ 21),2603 vr ( 23],A909 [ 33)被用作参考菌株。GBS分离培养过夜在Todd-Hewitt肉汤(Oxoid) DNA隔离。

2.2。但是脉冲场凝胶电泳的出现和荚膜打字

但是脉冲场凝胶电泳的出现了如前所述[ 30.]。简单地说,GBS DNA消化了 Sma18个小时我和电泳(初始开关时间4秒;最后的切换时间16秒)厨师三世装置(Bio-Rad大力神,CA)。凝胶是紧张4 h Vistra绿色(美国新泽西州Amersham生物科学,皮斯卡塔韦)在4摄氏度,暴风雨和可视化PhosphorImager(美国新泽西州Amersham生物科学,皮斯卡塔韦)。但是脉冲场凝胶电泳的出现模式分析了使用BioNumeric软件(应用数学、yves gijarth,创立比利时)。构建系统树图使用未加权的两组与算术方法手段,骰子系数,优化设置为1.0%,和1.0%的位置公差。GBS分离分为荚膜类型Ia, Ib,并使用DNA II-VIII点污点杂交,如前所述[ 34]。

2.3。GBS寡核苷酸微阵列结构

两个fine-tiling寡核苷酸微阵列设计使用发表第三血清型菌株的DNA序列(NEM 316年加入基因库。AL732656 V)和血清型菌株(2603 vr,加入基因库。AE009948)。NEM 316阵列由368576 32-mer探测器(184288对)瓷砖2.21 Mb基因组每12股的基地。360040年总共2603 vr阵列由32-mer探测器(180020对)瓷砖2.16 Mb基因组每12股的基地。数组通过定制全息阵列设计和建造服务从罗氏(美国威斯康星州麦迪逊)使用它的无掩模的阵列合成(MAS)技术。一系列密集的瓷砖用较短的寡核苷酸是通常用于罗氏两步比较基因组测序(CGS) ( 35]。

2.4。比较基因组杂交和数据采集

比较基因组杂交和信号处理是由罗氏定制服务(美国威斯康星州麦迪逊罗氏系统公司)。短暂,GBS四个测试菌株和两个参考菌株的DNA被分解成单独的低分子量片段,池标签独立与青蓝荧光染料和每个杂化是一个NEM316 2603 vr全基因组花砖数组。类似于Affymetrix芯片,短期低聚糖GBS阵列是由在幻灯片的从头合成。像Affymetrix芯片杂交,幻灯片是用于杂交/标签样本。总共12微阵列杂交过程的进行。基因组杂交NEM316或2603 vr的数组作为参考信号与测试菌株杂交过程使用相同的数组。基因组杂交测序的基因组与其它测序基因组数组用于验证目的。DNA测试的信号强度比率每个引用DNA比较识别探针序列缺失或不同于基因组测试人员。比率是由规范生成的信号强度(设置值比为1,标准差0.45),参考除以测试人员对于每一个链,然后平均两股。信号的比例绘制基因组的位置的函数,使用从罗氏SignalMap软件可视化。 A custom algorithm was used to mark the potential variable probe sequence (absent or different in tester genome) based on comparison to a local threshold (a 1800 bp window). This analysis was also performed by NimbleGen (see Supplementary Material available at doi:10.1155/2007/14762 for the analytical algorithm).

2.5。额外的生物信息学和数据分析方法

公司的基因组序列对比NEM316和2603 vr使用GenomeComp[执行 36]。所有毒株特异性基因岛大于10 bp被确定使用运行参数设置为0.01, 3 1,期望值(e),处罚不匹配,分别为匹配和奖励。探针序列的识别匹配从一个fine-tiling oligoarray其他测序基因组,一个自定义Bioperl程序被用于本地批爆炸分析。独立的爆炸计划( 37)为Unix操作系统和身份的最佳百分比用于查询基因组中的每个调查确定。所有其他数据分析使用SAS v9.0(美国SAS研究所、公司卡里、数控)和S + v6.1(美国深刻的公司、西雅图、洗)。

2.6。GBS图书馆幻灯片微阵列构造和杂交

我们最近开发了一种微阵列技术的新的应用程序,名为图书馆幻灯片(洛杉矶),细菌的比较基因组学研究[ 38]。洛杉矶技术结合了点状杂交和微阵列技术导致玻片成千上万的细菌基因组排列。因此整个基因组的库,而不是一个基因组序列或一组基因是印在幻灯片。幻灯片是筛选大量的菌株用于特定基因的存在感兴趣的元素。创建一个GBS洛微阵列与基因组DNA从949年GBS分离采样来自各种GBS的集合和各种控制压力。使用高通量基因组DNA分离sonication-based前面描述的方法( 39]。GBS菌株的DNA以及控制排列在生动的基因阵列复制幻灯片(美国密歇根州笼罩在生命科学)使用VersArray ChipWriter紧凑的数组(美国加州Bio-Rad)。选择GBS子和四个房子保持基因,(乙醇脱氢酶( adhP),phenylalanyl tRNA合成酶( ph值)、谷氨酰胺合成酶( glnA)和葡萄糖激酶( glcK)),扩增从应变NEM316或2603 vr菌进行基因。纯化PCR产品fluorescein-labeled使用BioPrime DNA标签工具包(美国加州表达载体)。每个探针杂交一夜之间用不同的幻灯片 68年 ° C在PerfectHyb +杂交缓冲(σ,密苏里州,美国)。洗后,fluorescein-labeled探针检测使用antiflourescein碱性磷酸酶(瑞士罗氏公司)和碱性磷酸酶工具包(美国加州TeleChem)。每个点的强度归一化强度的量化调查(四个看家基因)的混合DNA浓度的差异在不同的地方,和比强度的积极控制(序列已知应变包含基因探针)来确定存在/缺失的基因片段在不同菌株使用先前建立的方法( 38, 40]。

3所示。结果与讨论 3.1。选择测试菌株比较基因组减法。

比较致病性和非病原的菌株在一个物种可以提供关键的见解细菌的发病机理。然而,所有测序GBS菌株来自侵入性疾病。我们采用分子流行病学比较选择代表共餐的殖民GBS分离获得最高的比较基因组杂交可能识别潜在pathogenesis-related入侵基因组的基因测序(NEM316菌株和2603 vr)。我们的多样性特征882殖民隔离以人群为基础的纵向研究妊娠的健康男性和女大学生( 28)使用但是脉冲场凝胶电泳的出现和血清型。聚类分析的系统树图上执行这些隔离的样本35入侵隔离和测序NEM316致病性菌株和2603 vr。在此基础上分析,我们选择了三个基因共餐的隔离距离隔离的两个基因组测序但代表相对较大的应变集群共生的主要的来源。隔离657 - 461 V是一个血清型菌株代表最大的克隆群体在我们同桌的集合。隔离g617 - 061 (III)血清型和g293 - 061(血清型II)来自另外两个集群由殖民菌株。除了这三个同桌的隔离,一个入侵隔离,H-19,被选为比较基因组减法,因为它代表了最常见的克隆类型的血清组Ia应变分析。由于血清型分类并不一定反映菌株之间的遗传距离( 20.),我们没有选择测试菌株完全基于血清型的差异。殖民的少量污迹选择在这里不能和不是为了捕获的多样性共生的隔离。这是我们第一次尝试执行全基因组比较殖民菌株和测序的基因组,所以我们可以从列表中选择候选基因数千协会研究使用洛微阵列,收集大量的以人群为基础的GBS分离筛选。

3.2。寡核苷酸阵列验证

我们使用共享探针序列中的两个基因组数组的再现性的比较基因组杂交,杂交测序基因组与其它基因组测序的数组来评估的准确性评估序列变化的数组。

184288个探针对之间NEM316数组和180020调查对2603 vr数组,总共有16364相同的探针对比赛(32/32)被确定。这个探针杂交结果从两个数组子集为每个测试人员基因组被视为副本用于访问全息的再现性。为每个探针杂交分为相同或变量在试验机的基因组相比,参考基因组。试验机的一致性百分比基因组g293 - 061, H1-19, g617 - 061和g654 - 461分别为98.75%,99.50%,99.88%,和98.62%,分别。再现性是非常高的,即使原始信号率检查。重复的相关系数都大于90%。

评估的准确性数组在评估序列变异,我们比较的结果与实际的分类结果数组silicoanalysis杂交NEM316之间交换和2603 vr基因组。几乎所有的完美匹配被正确标识为相同的杂交探针序列。133520年只有4和5的133570探针序列被错误地认定为不同NEM316和2603 vr数组,分别。然而,28673年的50768(56%)和25435年的46450(55%)不匹配的探针序列是相同的错误,NEM316和2603 vr数组,分别。在调查层面,杂交特异性检测灵敏度高,但低守恒的探针序列。尽管如此,瓷砖数组的高密度性质仍然提供全面的信息在基因组序列变异和开放水平。我们直观地显示全息结果通过绘制杂交信号探测的比率在基因组的位置和比较他们的在网上比较NEM316和2603 vr。大多数的变量探测器(即。,probes with high reference versus tester signal ratios) are clustered primarily around strain-specific genetic islands identified by the in silico analysis. To convert probe-level variation to ORF sequence variation, we calculated the percentage of variable probes for each ORF (number of variable probes identified within an ORF divided by the total number of probes tiling the ORF). Using different percentage cutoff values in classifying variable ORFs (divergent or absent), the CGH-based data was compared with in silico analysis (Table 1)。316年NEM数组,15%截断值2.9%的假阴性率(即。,羊痘疮s known to be present but classified by hybridization as absent or very divergent) and the best overall sensitivity and specificity (97% and 94%, resp.). For the 2603VR array, the 20% cutoff point gave the best overall sensitivity and specificity (97% and 91%, resp.). Thus, these two cutoff points were chosen to classify variable ORFs for the remaining CGH analyses.

灵敏度(概率检测到开放阅读框,因为它是真正存在)和特异性评估(概率开放阅读框未被检测到,它不存在)分类变量不同的截止值的开放阅读框架使用fine-tiling基因组寡核苷酸阵列由B组的基因组序列 链球菌菌株NEM316和2603 vr。

参考基因组 百分比分界点 灵敏度 特异性
NEM316 20% 0.98 0.91
15% 0.97 0.94
10% 0.96 0.96

2603虚拟现实 20% 0.97 0.91
15% 0.95 0.92
10% 0.89 0.96

比较基因组杂交与fine-tiling 32-mer寡核苷酸微阵列没有识别所有调查两个参考基因组序列变化但可靠地确定变量并使用结合的探针杂交结果在每个子。

3.3。探针序列分布和映射的变量

CGH使用NEM316和2603 vr基因组数组显示3.4 -15.4%的探针序列缺席或发散的四个测试菌株(表 2)。这个范围的多样性是类似于序列差异的范围(5%对15%)最近在成对的比较观察到所有可用八个完整或草案GBS基因组序列( 20.]。瓷砖数组允许一个高分辨率的基因组变异菌株之间的比较。图 1比较杂交结果显示测试菌株2603 vr策划参考测试信号的比率在基因组的位置。虽然四个测试菌株代表四个不同的血清型(Ia, II, III和V),大多数的缺失或发散探针序列在这些菌株被映射到同一组NEM316基因组区域,第三个血清型菌株。在较小程度上,相同的地区在2603 vr基因组涵盖了大多数的缺失或发散的探针在四个测试中的三个基因组。应变g617 - 061,第三个血清型菌株,非常类似于V血清型参考菌株2603 vr基因组中,只有3.4%的调查确认为不同的相比 > 其他测试人员基因组的13%。比较所有可用八个完整或GBS基因组序列草案也表明,血清型分类并不能反映GBS的遗传多样性( 20.]。一个可能的解释为密切相关的菌株表现出不同的胶囊是遗传基因决定的荚膜型交换水平基因转移。

号(百分比)四个测试B组中变量探针序列 链球菌基因组测序菌株作为参考使用了比较基因组杂交

参考/测序的基因组入侵隔离 H1-19 (Ia)(入侵) g293 - 061 (II)(共生体) g617 - 061 (III)(共生体) g654 - 461 (V)(共生体)
2603虚拟现实 327例(15.4%) 320例(15.1%) 72例(3.4%) 278例(13.1%)
NEM316 277例(13.0%) 305例(14.3%) 305例(14.3%) 271例(12.7%)

变量的位置探测器在B组的基因组序列识别 链球菌在比较基因组杂交菌株2603 vr使用的四个测试菌株B组 链球菌

3.4。NEM316和2603 vr orf缺席/发散测试基因组

从所有的探针杂交结果在每个开放框架被用来确定是否存在/散度测试仪使用标准建立了通过分析基因组控制实验(如上所述)。在2134 orf NEM316基因组内,484名(22.7%)认定为变量orf因为他们列为缺席/发散在至少一个测试人员基因组。269(56%)人缺席/四tester基因组不同,到96年,84年,和35分为缺席/发散在1、2和3基因组分别。2124子在2603 vr的基因组中,530(25%)被确定为变量羊痘疮。其中,81年、121年、162年和166年被列为缺席/发散在4、3、2和1 tester基因组分别。成对的基因组比对两个参考基因组毒株特异性识别区域的总长度288 kb和239 kb NEM316和2603 vr,分别。大于95%的orf驻留在这些毒株特异性区域被确定为变量并在我们的全息四个测试人员基因组,代表NEM316变量orf的64%(309/484)和52%(275/530)的2603 vr变量羊痘疮。大约80%的变量并确定由全息位于14假定的致病性岛之前确定NEM316 [ 22]。

调查这些官能团变量orf属于,我们分类并成簇的直系同源基因(齿轮) 41]。图 2显示变量在每个齿轮orf类别的数量。大约一半的变量并没有被分为齿轮和未知函数。最常见的可分类的变量orf属于齿轮一类DNA复制,重组和修复。这可能是由于集成噬菌体的存在或在参考基因组质粒。大量的变量并预计参与运输、监管、中间代谢,和细胞壁代谢。这些基因可能在维护重要致病入侵GBS的生活方式和传输压力。基因在这些类别也被确定通过一个体内研究,signature-tagged诱变和新生儿鼠模型被用来识别中涉及小说GBS基因毒性( 42]。相对较少的变量并被发现参与辅酶运输和代谢和脂质运输和代谢。

开放阅读框架在B组的变量 链球菌NEM316菌株和2603 vr分类在每个集群的直系同源基因(齿轮)类别+齿轮数据库中未分类。

3.5。orf缺席/发散在至少两个测试仪的基因组共生的起源

orf一直缺席/发散在共生体tester菌株相比,侵入性菌株可能毒性基因的候选人。六个orf缺席/发散在所有三个同桌的测试人员紧张,两个入侵和守恒的参考基因组和侵入性测试压力。我们确定了一个额外的29个orf参考基因组的缺席/发散至少三分之二的共生体(表压力 3)。15这些35 orf预计假设未知蛋白质的功能。几个子预测蛋白质参与运输、代谢和其他代谢功能。还包括有两个假定的脂蛋白和两个表面蛋白。基因gbs0850预测编码是纤维蛋白原结合蛋白和以前是一样的 fbsB基因( 43, 44]。2603年gbs0850 vr的最佳匹配是ORF sag0832,纤维蛋白原结合蛋白的编码不同变体。orf gbs2015和gbs2016两个相邻基因高度相似的DNA序列预测编码糖基转移酶。这两个基因一起还发现在2603 vr基因组sag2060和sag2061。

开放阅读框(ORF)出现在侵入性压力,但缺席至少三分之二的共生体tester B组 链球菌比较基因组杂交菌株,他们的存在在949 GBS分离及其比率之间的入侵(n = 386)和殖民(n = 563)隔离。

羊痘疮 Probe-positive菌株(%) 比率(95%置信区间) (一) 预测蛋白质
sag0004 524例(55%) 1.1 (0.96 - -1.22) 假设蛋白质
sag0005 706例(74%) 1.0 (0.93 - -1.09) 假设蛋白质
sag0027 941例(99%) 1.0 (0.98 - -1.00) phosphoribosylaminoimidazole合成酶
sag0175 692例(73%) 1.0 (0.93 - -1.09) 假设蛋白质
sag0206 590例(62%) 0.9 (0.82 - -1.01) 脂蛋白,公认的
sag0253 (b) (b) 乙酰转移酶,蚊家庭
sag0414 927例(98%) 1.0 (0.97 - -1.01) 磷酸化酶、Pnp / Udp家庭,假定的
sag0426 - - - - - - - - - - - - 因预测家族蛋白质
sag0427 517例(54%) 1.0 (0.93 - -1.17) 转录监管机构,稳定的家庭
sag0700 925例(97%) 1.0 (0.97 - -1.02) 2-dehydro-3-deoxyphosphogluconate醛缩酶/ 4-hydroxy-2-oxoglutarate醛缩酶
sag0814 117例(12%) 0.6 (0.39 - -0.83) 假设蛋白质
sag0815 364例(38%) 0.9 (0.76 - -1.06) 转录监管机构,Cro / CI论蛋白质
sag0832 371例(39%) 1.5 (1.29 - -1.77) 纤维蛋白原结合蛋白
sag1130 367例(39%) 1.1 (0.90 - -1.25) 假设蛋白质
sag1140 (b) (b) 假设蛋白质
sag1207 (b) (b) 假设蛋白质
sag1781 (b) (b) primase-related蛋白质
sag1968 87例(9%) 1.1 (0.71 - -1.61) 假设蛋白质
sag1969 907例(96%) 1.0 (0.97 - -1.03) 核糖体蛋白不断化解甲基转移酶
sag1974 (b) (b) 笨蛋/ nudix家族蛋白
sag1975 (b) (b) 假设蛋白质
sag1976 290例(31%) 0.9 (0.73 - -1.08) 假设蛋白质
sag1994 289例(30%) 1.0 (0.82 - -1.22) 假设蛋白质
sag1999 (b) (b) 假设蛋白质
sag2021 395例(42%) 1.2 (1.00 - -1.36) 细胞壁表面锚家族蛋白
sag2026 224例(24%) 1.1 (0.88 - -1.40) 膜蛋白,公认的
sag2027 (b) (b) ABC转运蛋白、磷酸腺苷蛋白
sag2028 (b) (b) 假设蛋白质
sag2045 364例(38%) 1.1 (0.90 - -1.25) DNA拓扑调制蛋白质FlaR,假定的
sag2057 (b) (b) leucyl-tRNA合成酶
sag2060 427例(45%) 1.3 (1.13 - -1.50) 糖基转移酶、家庭8
sag2061 437例(46%) 1.2 (1.07 - -1.41) 糖基转移酶、家庭8
sag2088 (b) (b) 假设蛋白质
sag2147 687例(72%) 1.0 (0.9 - -1.06) 脂蛋白,公认的
gbs0474 (c) 270例(28%) 1.5 (1.21 - -1.80) 假设蛋白质

(一)患病率与置信区间不重叠1被认为是统计显著。

(b)使用洛主要是因为这些并不是筛选的小尺寸。

(c)的相应基因在爆炸应变2603 VR未找到搜索虽然在2603年被列为目前由全息虚拟现实。

当我们发现大量的变量羊痘疮,几人失踪在所有三个,甚至两个同桌的测试压力。因为涉及多个遗传因素在GBS毒性和多个发病途径涉及不同的毒力基因可能存在,我们可以预计不同的毒力基因被识别不同对入侵和殖民时隔离进行了比较。

3.6。GBS图书馆幻灯片杂交和不同分布变量羊痘疮

所有变量并潜在的毒性基因的候选人。使用新颖的GBS洛微阵列平台大量GBS分离,这些变量的重要性,并可以有效地评估。我们现在初步评估23以上的35个orf确定使用GBS洛杉矶。我们不能合成好的探针和特定的信号很强在我们最初尝试其他12个变量orf由于其小尺寸或可怜的PCR扩增。因此,我们离开他们的初始洛筛查。GBS洛微阵列包含从949年GBS分离株基因组DNA打印一式两份。其中,386人被隔离,从患者侵袭性疾病,563人共餐的殖民隔离。此外,《数组包含DNA从各种控制压力。表 3列表23个ORF的流行在整个GBS收集和他们的患病率比殖民入侵病毒的比率。sag2060、sag2061 sag0832, gbs0474更频繁地出现在比殖民入侵隔离共生的压力。相比之下,sag0814比入侵更频繁地出现在殖民隔离隔离。

orf sag2060和sag2061是两个假定的糖基转移酶基因。糖基化在许多生物过程中扮演一个重要的角色在真核生物中,并且有越来越多的证据显示细菌的糖基化作用。许多表面细菌表达结构如有限合伙人,洛杉矶,胶囊,鞭毛,病原菌的菌毛糖化( 45- - - - - - 47]。糖基化还可用于灭活细菌抗生素( 48, 49]。有趣的是,糖基转移酶基因 lic2B 流感嗜血杆菌被发现更频繁地在隔离导致中耳炎比从孩子喉咙隔离 50]。未来的机械的研究应该阐明这些GBS糖基转移酶在发病机理的角色。

sag0832预测编码是一种纤维蛋白原结合蛋白。这个基因被认为是入侵的一个重要毒力基因GBS的疾病。在脓毒症的小鼠模型,野生型菌株比同基因的菌株毒力更强的基因灭活( 44]。sag0832也促进GBS入侵上皮细胞在体外( 43]。除了三个orf编码蛋白质,两个orf (sag0814和gbs0474)编码的蛋白质分布式入侵和殖民菌株之间有差异。鉴于没有已知的大量的子函数,存在于基因组测序,这并不奇怪。这些羊痘疮可能涉及复杂的特征,很难观察到在实验室条件和使用协会的研究将更容易识别。发现有趣的是,sag0814更频繁地在同桌的压力比在侵入性压力。可能缺乏这个基因增强毒性。commensal-to-pathogen进化过程中,细菌不仅获得毒性基因但也通过删除了基因( 51]。缺失的基因促进共生的生活方式可以提供一个额外的进化途径对毒性。例如,赖氨酸脱羧酶基因的缺失极大地促进了肠毒素的活动 志贺氏杆菌在其发展 51]。

而五23变羊痘疮不同分布式入侵和共生体之间的隔离,这些羊痘疮的关联与入侵隔离既不排斥也不强。这样的结果并不意外的有几个原因。首先,我们预期某种程度的随机错误分类降低入侵菌株也可以观察到的关联,因为同桌的,和非侵入性压力可以成为机会致病菌。第二,类似于几个不同的致病型的存在在许多细菌病原体,可能有许多不同的致病型GBS之内。一个毒力基因可能与菌株在一个特定的GBS致病型密切相关,但协会不太明显时所有的入侵隔离都包括在分析中。第三,GBS发病机理是由不是一个而是很多毒性基因和任何一个基因可能只贡献。我们在筛选的过程中这些和更多的变量并在2000年一个额外的隔离是为了执行一个更明确的分析。此外,合并GBS的人口结构可能会加强我们的分析,帮助解释。

筛选23 orf 949隔离还揭示了GBS的引人注目的基因组内容多样性。我们分配每个隔离一个基因型的存在与否全部23对。共有503个基因型949隔离观察。使用这个分类,但是脉冲场凝胶电泳的出现相同的模式菌株有不同的基因组合。剖析GBS的有限数量的基因探针可能因此提供一个高度区别的输入方法。

4所示。结论

随着越来越多的细菌基因组测序,后基因组研究将专注于识别virulence-related基因,这些基因的功能。我们使用三步分子流行病学方法使用两个新颖的微阵列平台,fine-tiling寡核苷酸微阵列,和图书馆在一个幻灯片识别细菌毒力基因可能导致GBS的疾病。在数百个变量并由全息标识,35缺席/发散的两三个同桌的测试压力,但出现在两个入侵参考基因组和测试人员侵入性压力。我们筛选了23这些羊痘疮949 GBS分离,和发现5个orf不同分布式入侵和共生体之间的隔离。我们表明,这种方法可以快速识别和评估细菌基因可能与致病性有关。

在我们的方法中,我们采用了芯片CGH代替传统基因组减法方法识别配对共生体和入侵GBS菌株之间的遗传差异。传统的基因组减法的方法只能样本毒株特异性基因的一小部分。高密度花砖寡核苷酸制成的全息允许我们识别DNA序列的完整数组的入侵而共生的GBS分离。密度和较短的寡核苷酸阵列设计了验证寡核苷酸阵列可用于识别甚至在基因组单核苷酸多态性( 35]。然而,CGH-based基因组比较依赖基因组测序的可用性,而且,毒株特异性基因识别是局限于基因组测序。我们不能检测和识别潜在的毒性基因可能存在于其他unsequenced致病性GBS毒株。鉴于pan-genome GBS物种的本质变量池的基因非常大( 20.),未来的基因组比较任意两个菌株可能依赖于廉价和快速直接测序方法如焦磷酸测序( 52]。这种新方法能够消除使用全息的局限性。

一旦确认了一组候选基因的基因组比较,一个更关键的一步是评估这些基因在疾病发病机制的作用。这可以通过大规模的关联研究,生物信息学预测,或生物功能的分析。生物信息学预测需要数据库与固体生物分子结构和功能信息。功能的方法往往限于characterizable毒性的表型。比较基因频率在细菌分离收集来自不同来源,例如,致病和同桌的隔离,使用统计协会,可以提供洞察一个基因序列的相对重要性在发病机制和传播。隔离的数量和多样性的集合是重要的在确定观察的重要性,在确保有足够的电力来检测协会。大以人群为基础的样本需要减少虚假的身份联系经常出现小样本的比较。包括共生的隔离(即。,nondisease-causing strains) for study is an integral part of this approach to understand bacterial pathogenesis. The LOS microarray platform is a robust system, adaptable to a wide variety of bacterial pathogens, for detecting the presence or absence of a candidate gene in thousands of isolates efficiently, thus providing a truly high throughput system to evaluate genes in the postgenome era.

确认

这项研究是由国家卫生研究院资助R01AI51675 (BF)。我们感谢卡罗尔·j·贝克贝勒医学院的博士和特伦斯·a·威斯康辛Kurzynski国家卫生实验室提供的一些GBS菌株用于这项研究。我们也想感谢Maneesh大卫和伊丽莎白·玛丽·莱文帮助洛杉矶筛选的。

法利 M . M。 B组链球菌疾病妊娠的成年人 临床感染疾病 2001年 33 4 556年 561年 10.1086/322696 Schuchat 一个。 流行病学的B组 链球菌疾病在美国:范式转变 临床微生物学检查 1998年 11 3 497年 513年 Schuchat 一个。 B组 链球菌 《柳叶刀》 1999年 353年 9146年 51 56 10.1016 / s0140 - 6736 (98) 07128 - 1 删除戴维斯 H。 阿黛尔 C。 麦基 一个。 B组的荚膜多糖抗体 链球菌在怀孕的加拿大女人:殖民状态和新生儿感染的关系 《传染病杂志》上的研究 2001年 184年 3 285年 291年 10.1086/322029 琼斯 N。 奥利弗 k。 巴里 J。 增强的侵蚀,bovine-derived新生儿序列类型17 B组 链球菌独立于荚膜血清型 临床感染疾病 2006年 42 7 915年 924年 10.1086/500324 哈里森 l . H。 艾略特 j . A。 德怀尔 d . M。 马里兰州入侵B组链球菌分离株的血清型分布:对疫苗配方的影响。马里兰新兴感染程序 《传染病杂志》上的研究 1998年 177年 4 998年 1002年 Lachenauer c·S。 卡斯帕 d . L。 第八种血清型六世和B组中占主导地位 链球菌与怀孕的日本女性 《传染病杂志》上的研究 1999年 179年 4 1030年 1033年 10.1086/314666 Zaleznik d F。 加入 m·A。 希利尔 年代。 由于B组侵入性疾病 链球菌在孕妇和新生儿来自不同人群 临床感染疾病 2000年 30. 2 276年 281年 10.1086/313665 坐浴盆 P。 卜拉希米 N。 Chalas C。 Aujard Y。 宾根 E。 B组血清型的分子表征III - 链球菌隔离导致新生儿脑膜炎 《传染病杂志》上的研究 2003年 188年 8 1132年 1137年 10.1086/378517 Bohnsack j·F。 高桥 年代。 德特里克 s R。 系统分类ⅲB组链球菌血清型的基础上 hylB基因分析和DNA序列特定限制消化III-3模式类型 《传染病杂志》上的研究 2001年 183年 11 1694年 1697年 10.1086/320717 M。 Jespersgaard C。 保尔森 K。 克里安 M。 人口结构的 链球菌agalactiae揭示了特定的进化谱系和假定的毒性因素之间的关联而不是疾病 感染和免疫 1996年 64年 3 919年 925年 Musseer j . M。 Mattingly 美国J。 昆汀 R。 Goudeau 一个。 届时 r·K。 的识别high-virulence克隆III型 链球菌agalactiae(B组 链球菌)导致入侵性新生儿疾病 美国国家科学院院刊》上的美利坚合众国 1989年 86年 12 4731年 4735年 10.1073 / pnas.86.12.4731 高桥 年代。 Adderson E·E。 长野 Y。 长野 N。 Briesacher m·R。 Bohnsack j·F。 识别一个高度封装,相关基因群入侵类型III B组 链球菌 《传染病杂志》上的研究 1998年 177年 4 1116年 1119年 Helmig R。 Uldbjerg N。 鲍里斯 J。 克里安 M。 克隆分析 链球菌agalactiae隔绝与新生儿败血症、脑膜炎和他们的母亲和婴儿健康的孕妇 《传染病杂志》上的研究 1993年 168年 4 904年 909年 Adderson E·E。 高桥 年代。 Y。 阿姆斯特朗 J。 米勒 d . V。 Bohnsack j·F。 减法杂交标识一个小说预测蛋白质调节上皮细胞毒性入侵血清型ⅲB组 链球菌agalactiae 感染和免疫 2003年 71年 12 6857年 6863年 10.1128 / iai.71.12.6857 - 6863.2003 赫伯特 m·A。 贝弗里奇 c·j·E。 桑德斯 n . J。 细菌毒力因素新生儿败血症:B组 streptococous 当前舆论传染病 2004年 17 3 225年 229年 10.1097 / 00001432-200406000-00009 林达尔 G。 Stalhammar-Carlemalm M。 Areschoug T。 表面蛋白的 链球菌agalactiae在其他细菌病原体和相关蛋白质 临床微生物学检查 2005年 18 1 102年 127年 10.1128 / cmr.18.1.102 - 127.2005 Nizet V。 链球菌 β 溶血素:遗传学和在疾病发病机理中的作用 微生物学的趋势 2002年 10 12 575年 580年 10.1016 / s0966 - 842 x (02) 02473 - 3 Nizet V。 鲁本斯 c, E。 Fischetti 诉。 诺维克 r P。 Ferretti) J·J。 Portnoy d . A。 十字架 j . I。 B组链球菌的致病机制和毒性因素 的革兰氏阳性病原体 2000年 美国华盛顿特区 ASM的新闻 Tettelin H。 Masignani V。 Cieslewicz m·J。 基因组分析多种病原的分离 链球菌agalactiae:影响微生物“pan-genome” 美国国家科学院院刊》上的美利坚合众国 2005年 102年 39 13950年 13955年 10.1073 / pnas.0506758102 格拉泽 P。 Rusniok C。 Buchrieser C。 基因组序列的 链球菌agalactiae,病原体引起侵袭性新生儿疾病 分子微生物学 2002年 45 6 1499年 1513年 10.1046 / j.1365-2958.2002.03126.x 赫伯特 m·A。 贝弗里奇 c·j·E。 麦考密克 D。 遗传的岛屿 链球菌agalactiae菌株NEM316和2603 vr在其他B组和他们的存在 链球菌菌株 BMC微生物学 2005年 5 31日 10.1186 / 1471-2180-5-31 Tettelin H。 Masignani V。 Cieslewicz m·J。 完整的基因组序列和比较基因组分析的新兴人类病原体,血清型V 链球菌agalactiae 美国国家科学院院刊》上的美利坚合众国 2002年 99年 19 12391年 12396年 10.1073 / pnas.182380799 l Foxman B。 曼宁 s D。 Tallman P。 马斯 c F。 分子流行病学方法在uropathogenic尿路感染基因发现 大肠杆菌 感染和免疫 2000年 68年 4 2009年 2015年 10.1128 / iai.68.4.2009 - 2015.2000 Schoolnik g·K。 病原菌的功能和比较基因组学 目前看来在微生物学 2002年 5 1 20. 26 10.1016 / s1369 - 5274 (02) 00280 - 1 Whittam t·S。 Bumbaugh a . C。 从全基因组序列的细菌病原体的推论 当前在遗传学和发展意见 2002年 12 6 719年 725年 10.1016 / s0959 - 437 x (02) 00361 - 1 幸福 美国J。 曼宁 s D。 Tallman P。 B组 链球菌妊娠殖民的男性和女性大学生:发病率横断面研究 临床感染疾病 2002年 34 2 184年 190年 10.1086/338258 Foxman B。 Gillespie B。 曼宁 s D。 B组的发生率和持续时间 链球菌通过血清型之间的男性和女性大学生住在一个宿舍 美国流行病学杂志》 2006年 163年 6 544年 551年 10.1093 / aje / kwj075 曼宁 s D。 克罗 m D。 Tallman P。 皮尔森 c . L。 Foxman B。 抗生素耐药性的频率在B组 链球菌与健康的大学生 临床感染疾病 2001年 33 12 e137 e139 10.1086/324588 曼宁 s D。 Tallman P。 贝克 c·J。 Gillespie B。 马斯 c F。 Foxman B。 与B组co-colonization的决定因素 链球菌在异性恋的大学情侣 流行病学 2002年 13 5 533年 539年 10.1097 / 00001648-200209000-00008 曼宁 s D。 Foxman B。 皮尔森 c . L。 Tallman P。 贝克 c·J。 克罗 m D。 抗生素耐药相关的B组 链球菌从孕妇分离 妇产科 2003年 101年 1 74年 79年 10.1016 / s0029 - 7844 (02) 02452 - 3 博查特 s M。 DeBusscher j . H。 Tallman p。 频率antimicrobal抵抗入侵和殖民B组链球菌分离株 《BMC传染病》杂志 2006年 6 57 10.1186 / 1471-2334-6-57 Lancefield r . C。 马克卡迪 M。 弗利 w . N。 多个鼠标保护性抗体针对B组 链球菌。特别提到对蛋白质有效抗原的抗体 实验医学杂志 1975年 142年 1 165年 179年 10.1084 / jem.142.1.165 博查特 s M。 Foxman B。 查尔 d . O。 比较DNA点状杂交和lancefield毛细管沉淀素B组的方法 链球菌荚膜打字 临床微生物学杂志 2004年 42 1 146年 150年 10.1128 / jcm.42.1.146 - 150.2004 艾伯特 t·J。 Dailidiene D。 Dailide G。 细菌基因组突变的发现:甲硝唑耐药性 幽门螺杆菌 自然方法 2005年 2 12 951年 953年 10.1038 / nmeth805 J。 J。 Z.-J。 Q。 盛ydF4y2Ba Y。 R。 微生物基因组比较GenomeComp:可视化工具 《微生物方法 2003年 54 3 423年 426年 10.1016 / s0167 - 7012 (03) 00094 - 0 Altschul 美国F。 马登 t . L。 谢弗 答:一个。 有缺口的爆炸和PSI-BLAST:新一代的蛋白质数据库搜索程序 核酸的研究 1997年 25 17 3389年 3402年 10.1093 / nar / 25.17.3389 l Srinivasan U。 马斯 c F。 戈什 D。 Gilsdorf j . R。 Foxman B。 图书馆在滑动细菌比较基因组学 BMC微生物学 2004年 4 12 10.1186 / 1471-2180-4-12 l Foxman B。 Gilsdorf j . R。 马斯 c F。 细菌基因组DNA微阵列分析隔离使用声波降解法 生物学技术 2005年 39 5 640年 644年 l Gillespie b·W。 马斯 c F。 Foxman B。 优化的fluorescent-based磷光成像点污点DNA杂交分析评估 大肠杆菌毒力基因 《微生物方法 2001年 44 3 225年 233年 10.1016 / s0167 - 7012 (01) 00222 - 6 Tatusov r . L。 加尔佩林 m . Y。 纳塔尔 d . A。 Koonin e . V。 齿轮数据库:一个公司的工具分析蛋白质的功能和演化 核酸的研究 2000年 28 1 33 36 10.1093 / nar / 28.1.33 琼斯 a . L。 诺尔 k . M。 鲁本斯 c, E。 的识别 链球菌agalactiae毒力基因的新生儿使用signature-tagged诱变大鼠脓毒症模型 分子微生物学 2000年 37 6 1444年 1455年 10.1046 / j.1365-2958.2000.02099.x 古特孔斯特 H。 Eikmanns b . J。 Reinscheid d . J。 这部小说fibrinogen-binding FbsB促进蛋白质 链球菌agalactiae入侵上皮细胞 感染和免疫 2004年 72年 6 3495年 3504年 10.1128 / iai.72.6.3495 - 3504.2004 琼森 I.-M。 Pietrocola G。 Speziale P。 Verdrengh M。 Tarkowski 一个。 的角色fibrinogen-binding adhesin表达化脓性关节炎和败血症所致 链球菌agalactiae 《传染病杂志》上的研究 2005年 192年 8 1456年 1464年 10.1086/491478 奔驰 我。 施密特 m·A。 巡弋飞弹:蛋白质糖基化在致病性细菌 分子微生物学 2002年 45 2 267年 276年 10.1046 / j.1365-2958.2002.03030.x 戈什 美国K。 J。 Philogene m . C。 Alzaharani 一个。 美国莱恩 年代。 巴纳吉 一个。 致病性的后果 淋病奈瑟氏菌菌毛蛋白多糖变化 微生物和感染 2004年 6 7 693年 701年 10.1016 / j.micinf.2004.02.019 西曼斯基 c . M。 雷恩 b·W。 蛋白质糖基化在细菌粘膜病原体 自然评论微生物学 2005年 3 3 225年 237年 10.1038 / nrmicro1100 松岗 M。 佐佐木 T。 失活的大环内酯类生产商和病原体 目前的药物靶点——传染性疾病 2004年 4 3 217年 240年 10.2174 / 1568005043340696 奎洛斯 l . M。 Carbajo r . J。 萨拉斯 j . A。 反转的异头配置转移糖在大环内脂类抗菌素的失活竹桃霉素由一个大环内酯物催化糖基转移酶 2月的信 2000年 476年 3 186年 189年 10.1016 / s0014 - 5793 (00) 01721 - x 小矮星 M . M。 Foxman B。 马斯 c F。 Gilsdorf j . R。 lipooligosaccharide生物合成基因的识别 lic2B作为一个公认的nontypeable菌株的毒力因素 流感嗜血杆菌导致中耳炎 感染和免疫 2002年 70年 7 3551年 3556年 10.1128 / iai.70.7.3551 - 3556.2002 Maurelli a . T。 费尔南德斯 r·E。 布洛赫 c。 c K。 一个。 “黑洞”和细菌致病性:大量基因删除的毒性增强 志贺氏杆菌种虫害和enteroinvasive 大肠杆菌 美国国家科学院院刊》上的美利坚合众国 1998年 95年 7 3943年 3948年 10.1073 / pnas.95.7.3943 Ronaghi M。 焦磷酸测序揭示了DNA测序 基因组研究 2001年 11 1 3 11 10.1101 / gr.11.1.3