研究文章|gydF4y2Ba开放获取gydF4y2Ba
托马斯·c·哈特,帕特里夏·m·寇比米洛斯岛Hauskrecht,好的庆熙Ryu,理查德•Pelikan米甲Valko,玛丽亚·b·奥利维拉杰拉尔德·t·Hoehn沃尔特·a .亲眼见识gydF4y2Ba,gydF4y2Ba ”gydF4y2Ba识别微生物和蛋白质组生物标志物在童年早期龋齿gydF4y2Ba”,gydF4y2Ba国际牙科杂志gydF4y2Ba,gydF4y2Ba 卷。gydF4y2Ba2011年gydF4y2Ba,gydF4y2Ba 文章的IDgydF4y2Ba196721年gydF4y2Ba,gydF4y2Ba 13gydF4y2Ba 页面gydF4y2Ba,gydF4y2Ba 2011年gydF4y2Ba。gydF4y2Ba https://doi.org/10.1155/2011/196721gydF4y2Ba
识别微生物和蛋白质组生物标志物在童年早期龋齿gydF4y2Ba
文摘gydF4y2Ba
本研究的目的是提供一个单变量和多变量分析质谱仪和唾液蛋白质组的微生物基因组数据资料对龋齿的结果。为了确定潜在有用的生物标志物龋齿,多元分类分析来构建预测模型能够对微生物和唾液样本资料进行分类和泛化性能。我们使用高通量方法包括多路复用微生物数组和SELDI-TOF-MS剖析的口腔菌群和唾液蛋白质组204年1 - 8岁儿童(gydF4y2Bacaries-free,gydF4y2Bacaries-active)。人口很少的牙科保健和被认为是高危儿童龋齿。这项研究的结果表明,模型将微生物和蛋白质组数据都优于模型只有微生物或唾液数据。联合和独立数据的比较结果表明,蛋白质组学和微生物来源的组合有利于结合数据的分类精度和改善预测模型caries-active和caries-free病人。最好的预测模型测试误差6%,> 92%的敏感性,特异性和> 95%。这些发现表明,口腔微生物群落的进一步表征和唾液蛋白质组与健康和龋齿可能提供临床上有用的生物标记物更好的预测未来龋齿体验。gydF4y2Ba
1。介绍gydF4y2Ba
龋齿,最常见的儿童疾病,传染性疾病是一个复杂的多因子的病因。龋齿过程的特征是接受宿主和微生物之间的相互作用和潜在的殖民和发病机理。微生物、遗传、免疫、行为、环境和社会经济因素导致的风险,确定临床疾病的发生和严重程度gydF4y2Ba1gydF4y2Ba,gydF4y2Ba2gydF4y2Ba]。识别风险因素,生龋齿的口腔唾液微生物菌群和得到了特定研究的关注。gydF4y2Ba
微生物在过去四十年进行的研究表明gydF4y2Ba变形链球菌gydF4y2Ba是主要病原体与儿童龋齿发病,乳酸杆菌与龋齿发展(gydF4y2Ba3gydF4y2Ba,gydF4y2Ba4gydF4y2Ba]。已经取得了很多这方面的知识可能使用传统的培养方法采用选择性媒体对这些病原体。采用微生物分子技术的最新进展已允许更好的理解植物的复杂性与口腔感染,特别是龋齿。超过750名口腔微生物类群在口腔(gydF4y2Ba5gydF4y2Ba]。其中,大约有50%尚未培育,许多门尚未和分类学的分类特征。将更新的分子遗传学方法研究表明,更大的口腔微生物的多样性与病理相关从口腔健康过渡到龋齿(gydF4y2Ba6gydF4y2Ba- - - - - -gydF4y2Ba8gydF4y2Ba]。gydF4y2Ba
各种唾液成分,唾液流率,和唾液缓冲能力与龋齿的风险(gydF4y2Ba9gydF4y2Ba- - - - - -gydF4y2Ba11gydF4y2Ba]。唾液是一个复杂的流体运动多种功能在口腔gydF4y2Ba12gydF4y2Ba]。唾液组件可以扮演一个角色在敏感性和釉质脱矿釉质补充矿质和抗龋齿(gydF4y2Ba11gydF4y2Ba]。虽然大多数唾液蛋白质和多肽的生物功能特征并不好,很多唾液蛋白功能的保护口腔组织(gydF4y2Ba13gydF4y2Ba,gydF4y2Ba14gydF4y2Ba]。数组的分子包括黏蛋白、histatins脯氨酸肽,defensins,乳铁蛋白,氧化物酶调节口腔微生物菌群通过施加直接的抗菌效果(gydF4y2Ba10gydF4y2Ba,gydF4y2Ba13gydF4y2Ba]。此外,很可能有许多有待唾液蛋白特征,可能是关键的保护口腔组织对微生物、病毒或真菌感染(gydF4y2Ba14gydF4y2Ba]。而唾液的大部分功能通过古典生化方法,并阐述了当前蛋白质组学技术,包括唾液蛋白质组的高通量分析,可以描述所有唾液蛋白质的综合目录,可能他们的转化影响龋齿发病和发展的动力gydF4y2Ba15gydF4y2Ba- - - - - -gydF4y2Ba17gydF4y2Ba]。gydF4y2Ba
Schipper et al。gydF4y2Ba13gydF4y2Ba]证明了表面增强激光解吸/电离time-of-flight-mass谱(SELDI-TOF-MS)提供了一个简单的和高通量方法快速识别大量的不同表达了对唾液的蛋白质和多肽。虽然兴趣评估唾液作为诊断液监测健康正受到越来越多的关注gydF4y2Ba16gydF4y2Ba- - - - - -gydF4y2Ba20.gydF4y2Ba),到目前为止,没有健壮的龋齿研究采用唾液蛋白质组分析和微生物基因组分析相符。gydF4y2Ba
迄今为止,为个人唾液的诊断效用分析化验的组件或单个微生物已经有限的临床效用评估儿童龋齿的风险。虽然一种慢性疾病,儿童龋齿的最一致的预测风险仍然是过去的龋齿经验(gydF4y2Ba1gydF4y2Ba]。更有效的预防方法在牙科保健需要改进方法的早期识别儿童龋齿的风险。龋齿可能继发于生态失衡口腔生物膜微生物驱动的。可想而知,唾液蛋白质组的变化可能在龋齿发展平行的微生物菌群的变化。本研究的目的是提供一个计算验证框架,允许我们评估微生物基因组数据的重要性和质谱仪唾液蛋白质组配置文件对龋齿的结果。为了确定潜在有用的生物标志物龋齿,多元分类分析来构建预测模型能够对微生物和唾液样本资料进行分类和泛化性能。这项研究是在高危人群中进行面积没有含氟水的孩子,接受最小的专业牙科保健,代表自然的人类早发性龋齿的发生。gydF4y2Ba
2。方法gydF4y2Ba
2.1。受人口的人口学特征gydF4y2Ba
一群孩子的研究人群包括低社会经济城市的家庭居住在城市蒙蒂斯克拉鲁斯的米纳斯吉拉斯,巴西。城市供水氟化非最佳水平的0.2 ppm,大部分人口评估(> 96%)没有收到常规专业牙科保健(gydF4y2Ba7gydF4y2Ba]。孩子的父母签署同意书,和四个人类受试者的研究机构审查委员会批准的协议。总共有204名儿童,年龄在1 - 8岁,由人口研究。孩子提供唾液和菌斑生物膜样品和随后对龋齿检查。gydF4y2Ba
2.2。龋齿检查gydF4y2Ba
两个考官进行龋齿检查根据国家牙科和颅面研究所的标准(gydF4y2Ba21gydF4y2Ba)修改区分龋齿病变白垩白色/黄色不透明的外观,没有临床检测物质损失(白斑病变),从形成空洞龋的病变。邻间的表面龋齿评估使用数字成像光纤透照(美国纽约DIFOTI,欧文顿)。gydF4y2Ba
2.3。牙菌斑生物膜取样gydF4y2Ba
早上Supragingival菌斑样本收集。Caries-free儿童池菌斑样本收集从三个健康的表面,可能包括前部和后部牙齿。Caries-active儿童牙菌斑样本分开收集完整的牙釉质表面(网站1)和三种类型的龋齿病变:表面白斑病变(网站2),最初的釉质表面损伤(网站3),并从深度挖掘斑块牙质的病变(网站4)。所有龋齿活动主题提供三到四个网站收集的斑块分别来自不同的牙齿根据疾病的严重程度。完整的搪瓷和白斑病变斑块被刷牙齿表面收集与Stimudent(强生公司,纽约,纽约,美国),而从形成空洞病变斑块是收集通过一个小Gracey刮匙(1 - 2;Hu-Friedy、芝加哥、生病,美国)。共有448个斑块样本(118收集从caries-active caries-free儿童和330名儿童)被用于分析。gydF4y2Ba
2.4。微生物基因组分析gydF4y2Ba
孤立的细菌DNA样本采用标准程序执行先前描述(gydF4y2Ba7gydF4y2Ba]。reverse-capture棋盘杂交试验是用来检测相对水平(丰度)82年的口腔细菌物种或组。短暂,reverse-capture DNA探针(已知序列的寡核苷酸互补DNA)用于目标分布的未知序列(16 s rRNA)细菌基因在生物样品的解决方案。探测器放置在尼龙膜在不同的水平通道使用微型槽装置。16 s rRNA来自菌斑样本的基因扩增使用特定菌进行基因标记引物。杂交过程中进行垂直渠道与标记的扩增子Miniblotter装置(目标基因16 s rRNA) 45个样本。共有1350个杂交过程同时进行使用单一膜。执行标准chemifluorescence检测使用风暴成像系统(美国新泽西州Amersham,皮斯卡塔韦)。膜上的每个点,从他们的背景中提取的信号水平运用边缘检测方法(现货gydF4y2Ba7gydF4y2Ba]。该方法定位地点周围的平均强度的轮廓,然后应用此为背景。背景,因此,独立地为每一个点,计算和信号水平(标准化意味着计数)独立计算为每个点(ImageQuant软件;美国新泽西Amersham,皮斯卡塔韦)。低质量的斑点也过滤质量控制,消除了背景噪声分析。通用探针被放置在两个车道在每个膜作为标准,和信号被转换为水平意味着数量与标准相比膜。信号水平然后调整比较丰富的通用控制探针。这种方法允许计算目标物种的丰度分别通过调整每个样本的DNA浓度。gydF4y2Ba
2.5。唾液取样gydF4y2Ba
Paraffin-stimulated全唾液样本收集9到12点。从儿童避免吃喝2 h。唾液收集了与孩子们坐着,头稍向前倾斜,睁开了眼睛一段2分钟。样本收集在冰上,他们立即在13000转离心5分钟去除不溶性材料,和所有在4°C程序进行。上层清液取出来放在埃普多夫管被储存在−80°C。gydF4y2Ba
2.6。女士的蛋白质组学分析唾液样本gydF4y2Ba
Cy染料都购自Amersham淀粉微球生物科技(美国新泽西州Picataway)。解冻唾液样本处理在4°C。两种类型的芯片具有不同表面亲和中使用的协议。CM10和Q10阴离子交换ProteinChip (Ciphergen生物系统公司,弗里蒙特,加州,美国)表面与150年被平衡gydF4y2BaμgydF4y2BaL具有约束力的缓冲区(100毫米Tris-Hcl, pH值9.0)。个人唾液样本混合变性缓冲区(9 M尿素和皮套裤2%),在一个比2:3。每一个变性的样品(10gydF4y2BaμgydF4y2BaL(每个)应用于重复了90gydF4y2BaμgydF4y2BaL绑定缓冲的预平衡芯片。ProteinChip数组孵化了60分钟在室温下剧烈的颤抖,洗两次为5分钟每个绑定缓冲,紧随其后的是两个与蒸馏水洗。数组是干在室温下15分钟后跟两个补充(1gydF4y2BaμgydF4y2BaL) 50%的解决方案sinapinic酸(σ)准备在50%乙腈和0.5%三氟乙酸(组织)。样品处理,包括沉积矩阵,进行Biomek 2000自动化工作站(美国加州千橡市,beckman coulter)使用两个96孔Bioprocessors (Ciphergen)。样本分析使用SELDI-TOF-MS(蛋白质生物学系统II, Ciphergen生物系统公司)。每个芯片被击中两次不同激光强度(高低)。所有光谱由130年平均激光枪和外部校准使用标准一体化的蛋白II (Ciphergen生物系统公司),包含七个calibrants 7和147 kDa之间。光谱数据处理同样使用Ciphergen Express 3.1数据管理软件。整个唾液蛋白质组数据由2组:caries-active儿童(gydF4y2Ba)和caries-free儿童(gydF4y2Ba)。相当于每组的儿童数量是相同的芯片类型和激光强度。gydF4y2Ba
2.7。数据预处理女士gydF4y2Ba
女士概要文件进行预处理和解释分析使用蛋白质组学数据分析软件包(PDAP)开发了匹兹堡大学gydF4y2Ba22gydF4y2Ba),在MATLAB中实现(MathWorks Inc .) PDAP支持所有SELDI-TOF-MS数据分析步骤包括概要文件预处理,峰选择,单变量和多变量特征选择方法,分类、评估和验证方法。我们应用五个预处理步骤中实现PDAP:(1)方差稳定,(2)基线校正,(3)强度归一化、平滑(4),(5)剖面调整步骤(gydF4y2Ba22gydF4y2Ba]。简而言之,我们应用以下PDAP预处理选择:立方根方差稳定化,PDAP基线减法常规基于当地的移动窗口宽度200跨度为,总离子电流正常化的范围限制在1500 - 16500道尔顿,高斯核平滑,peak-based动态编程对齐。没有一个概要文件用于研究表现出总离子电流(TIC)值的两个标准差以上不同的意思是抽搐,这是我们当前的质量控制方面/质量控制阈值样本排除。预处理后,复制光谱为每个病人平均来创建一个每个病人平均分布。gydF4y2Ba
2.8。峰女士选择gydF4y2Ba
大多数的蛋白质组学数据分析文献中限制他们的注意力只有信息信号的峰值。执行峰选择,我们应用两阶段过程中实现PDAP [gydF4y2Ba22gydF4y2Ba]。程序首先确定峰值位置;后来,它在每个概要文件分配强度等职位。的gydF4y2Ba峰鉴别阶段gydF4y2Ba与平均概要文件获得的平均训练数据中的所有资料。方法足够健壮,即使一个特定峰值不是记录在所有配置文件,而它往往平均随机信号波动。峰值检测过程依赖于当地的最大窗口位置的方法被认为是只有最大峰值对信号在其附近。来gydF4y2Ba强度值分配给每一个峰值gydF4y2Ba在一个配置文件中,我们使用读数的平均值在当地社区的峰值位置。这种方法减少了的机会在一个嘈杂的阅读gydF4y2Ba的位置。通过这些技术,我们减少每个孩子的频谱的峰值位置及其强度。山峰的范围内1500年和40000年哒。这让我们专注于一个更少吵,更有意义的部分质谱。gydF4y2Ba
2.9。统计分析的数据gydF4y2Ba
微生物蛋白质组学数据分析了使用单变量和多变量统计方法在蛋白质组学中实现数据分析软件包(PDAP) [gydF4y2Ba22gydF4y2Ba]。分类方法被用来确定细菌水平存在差异caries-free和caries-active科目或搜索龋齿病的早期诊断标志物检测唾液。分别分析首先表现为每个数据类型。之后,结合蛋白质组和基因组数据进行了分析。gydF4y2Ba
2.10。单变量分析gydF4y2Ba
单变量分析的目的是确定功能(微生物物种或山峰女士)能区分和控制(caries-active和caries-free)配置文件。单变量的分数,允许比较相对的每一个潜在的生物标记物的存在。这些包括相关性、费雪,gydF4y2Ba统计数据,或卡方得分以及分数来自gydF4y2Ba值的统计测试。我们用一个分数基于Wilcoxon rank-sum测试在我们的分析。gydF4y2Ba
2.11。多变量分析gydF4y2Ba
多变量分析的目标是建立一个预测模型gydF4y2Ba可以,高精度,分配正确的类标签Y(或控制)病人的测量(gydF4y2Ba)。与单变量分析所有概要文件特性及其组合。我们采用机器学习方法的模型从数据中学习和评价研究。gydF4y2Ba
每个分类模型的质量验证通过使用随机重采样验证计划(gydF4y2Ba23gydF4y2Ba,gydF4y2Ba24gydF4y2Ba]。简单地说,我们的目标是评估预测模型的泛化性能,也就是说,它的性能在样品我们期望看到未来。因为这些不是可用,我们将数据提供给我们分成训练集和测试集。该模型总是学习训练集和测试集上进行了测试。70年的分裂:30用于将数据划分为训练集和测试集。一旦发达国家设置的学习模型,它是不会再修改。减少可能的偏见的机会由于幸运或不幸的分裂,随机二次抽样,和40个不同的分割方法(gydF4y2Ba23gydF4y2Ba)应用于评估模型的预测性能。平均统计数据包括测试报告错误,模型的敏感性和特异性。gydF4y2Ba
许多不同的分类模型和算法适合学习任务存在。在这项工作中,我们报告两个分类模型的结果:线性支持向量机(SVM) [gydF4y2Ba25gydF4y2Ba- - - - - -gydF4y2Ba28gydF4y2Ba]。所有这些方法应用于高维数据时相当强劲。此外,我们测试蛋白质组数据也支持向量机模型通过特性与先天特征选择过滤的基础上gydF4y2Ba价值Wilcoxon rank-sum测试。gydF4y2Ba
3所示。结果gydF4y2Ba
3.1。研究人群gydF4y2Ba
总共204个孩子平均年龄为3.83±2.55年收到了口试,对微生物菌斑和唾液取样。父母/监护人报道,大多数孩子从未被牙医(> 96%),和那些见过牙医被认为仅供紧急护理。基于临床检查,118名儿童(60雌性,58岁女性,平均年龄为2.3±0.2岁)被确定为caries-free (caries-free组)与地基龋齿患病率(SBCPR) = 0),和86名儿童(40岁女性,46岁男性,平均年龄为6.02±0.2年)测定龋齿(caries-active组);没有一组现有的修复(意味着SBCPR =gydF4y2Ba%)。gydF4y2Ba
3.2。微生物的分析数据gydF4y2Ba
图gydF4y2Ba1gydF4y2Ba显示了表达水平(丰富)的细菌种类或组caries-free和caries-active样本。我们看到,增加细菌物种的丰度水平或组左边和丰富的抑制水平的细菌种类或团体在右边显示疾病的发生(龋齿)。凭直觉,这些对应于社区的有益和有害的细菌。值得注意的是,物种等gydF4y2Ba变异链球菌gydF4y2Ba和乳酸杆菌常与龋齿不丰富caries-free儿童相对于caries-active孩子,而一个物种有益的物种的数量或不与龋齿等有关gydF4y2Ba链球菌/ oralisgydF4y2Ba,gydF4y2Ba链球菌肝病杂志gydF4y2Ba,gydF4y2Ba链球菌cristatusgydF4y2Ba更丰富的caries-free孩子相对于caries-active的孩子。gydF4y2Ba
图gydF4y2Ba2gydF4y2Ba说明了单变量的分布分数基于Wilcoxon rank-sum测试细菌阵列探测器的研究。排名前十的细菌种类或组根据一定的分数,和/或可能包括可能涉及龋齿发病和进展gydF4y2Bas . parasanguinis a . defectiva美国缓和的/ oralis, g . haemolysans变异链球菌gydF4y2Ba乳酸杆菌,gydF4y2Ba放线菌gydF4y2Basp.应变B19SC Selemonas sp. EY047克隆,gydF4y2BaAtobopiumgydF4y2Basp.克隆GW027,gydF4y2BaPorphyromonasgydF4y2Basp.克隆DS033。gydF4y2Ba
3.3。多元分类分析gydF4y2Ba
多变量分析探索三种多元分类模型的预测性能表明,测试误差分类性能变化在8.4% - -15.65%之间,敏感性和特异性82%和87.5%之间(表86.24%和94.91%gydF4y2Ba1gydF4y2Ba)。这些结果通过优化误分类错误。除了分类分析表gydF4y2Ba1gydF4y2Ba,我们也不同误分类的成本获得中华民国的方法及其面积receiver-operator-characteristic (ROC) (ROC曲线下面积(AUC)统计(图gydF4y2Ba3gydF4y2Ba)。的三个模型测试随机森林分类器实现最佳性能。gydF4y2Ba
|
||||||||||||||||||||||||||||
| 支持向量机:线性支持向量机。gydF4y2Ba 支持向量机在前20名Wilcoxon峰值。gydF4y2Ba 随机森林。gydF4y2Ba |
||||||||||||||||||||||||||||
图gydF4y2Ba4gydF4y2Ba展示了物种的重要性,随机森林分类器的性能使用提供的相对重要性度量方法。前25个物种和他们的分数。与单变量得分(见图gydF4y2Ba2gydF4y2Ba),多元成绩评估功能的重要性在上下文的其他功能面板中。得分之间的差异可以解释物种间存在的相关性及其“可代换性”。在这种情况下,两个高度相关的生物标记物的相对重要性在多元面板可能减少。虽然有一些重叠,细菌在caries-active分类(如很重要gydF4y2Ba放线菌gydF4y2Ba应变B19SC,gydF4y2Ba变异链球菌gydF4y2Ba和乳酸杆菌)和caries-free团体(如gydF4y2Ba年代gydF4y2Ba。gydF4y2BaparasanguinisgydF4y2Ba,gydF4y2BaAbiotrophia缺陷gydF4y2Ba,gydF4y2Ba美国可锻铁/ oralisgydF4y2Ba)使用随机森林模型是不同的比认同Wilcoxon rank-sum分数(图gydF4y2Ba2gydF4y2Ba),这表明可能存在临界龋齿和健康相关的生物膜微生物区系的变化,和定量变化(表示为丰富)在特定的细菌可能作为生物标志物。gydF4y2Ba
3.4。蛋白质组学数据的分析gydF4y2Ba
作为第一步的分析,我们研究了女士资料用单变量统计方法。简单地说,每个概要物种被认定为其歧视caries-active和caries-free样本的能力。类似于微生物数据,非参数Wilcoxon rank-sum测试应用。图gydF4y2Ba5gydF4y2Ba说明了这个在statgram Wilcoxon rank-sum测试应用于女士资料后CM-10芯片。视图的范围被限制为11000 - 16000道尔顿。意思是概要文件为例和对照组也观察到。的Wilcoxon rank-sum分数是最大的特点,表现出一个大强度的差异意味着组概要。图gydF4y2Ba6gydF4y2Ba显示了前25名的分数Wilcoxon峰值。gydF4y2Ba
(一)gydF4y2Ba
(b)gydF4y2Ba
(c)gydF4y2Ba
3.5。多元分类分析gydF4y2Ba
表gydF4y2Ba2gydF4y2Ba显示性能统计数据获得的三个预测模型:支持向量机,支持向量机顶部100 Wilcoxon山峰,随机森林;在四个不同的数据集获得两个不同的芯片:CM-10 Q-10,每一个镜头有两个激光强度:高和低。代表平均测试结果误差、灵敏度和特异性。测试错误的22.73%至35.68%,这是比预期的错误在一个完全随机的分类器,45.6%。灵敏度范围从54.24%到75.82%,而特异性范围从69.80%到83.20%。gydF4y2Ba
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 支持向量机:线性支持向量机。gydF4y2Ba 支持向量机顶部100 Wilcoxon峰值。gydF4y2Ba 随机森林。gydF4y2Ba |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
四种类型的光谱分析两个似乎执行最佳光谱获得较低的激光强度设置。我们怀疑这是由于碎片的机会增加物种的高强度设置。图gydF4y2Ba7gydF4y2Ba显示了完整的ROC分析的结果低强度的数据集,CM-10低。随机森林模型似乎是最有效的分类方法。gydF4y2Ba
分类分析的结果显示,这是绝对有可能观察到蛋白质组光谱区别的模式。然而,信号出现弱于信号中发现的微生物数据。这可以解释为SELDI-TOF-MS检测更可靠和可重复的蛋白质种类更加丰富的唾液标本。很可能一些高度区别的唾液蛋白质caries-active和caries-free组发生在较低的浓度,因此没有发现由于SELDI-TOF-MS固有的局限性,分析技术。gydF4y2Ba
图gydF4y2Ba8gydF4y2Ba显示了分类精度的相对重要性的峰值随机森林模型的CM-10低数据集。只显示前25的山峰。功能重要性高的解释非常相关的分类任务,他们合作与其他功能面板。再一次,注意高峰物种数据之间的差异gydF4y2Ba8gydF4y2Ba和gydF4y2Ba6gydF4y2Ba独立:Wilcoxon rank-sum分数评估每一个峰值,而多元的方法,如随机森林的目标来评估每个峰值特性结合其他峰的特性。gydF4y2Ba
3.6。结合微生物和蛋白质组学数据分析gydF4y2Ba
最后,为了确定微生物和蛋白质组数据是否包含协作信息,我们与病人和附加的微生物功能蛋白质组CM-10低的峰值特性列表数据。gydF4y2Ba
3.7。多元分类分析gydF4y2Ba
表gydF4y2Ba3gydF4y2Ba显示了分类统计获得的三种分类模型:支持向量机,支持向量机顶部100 Wilcoxon特性,和随机森林。合并两个数据集后,测试错误结果的范围从6.00%到16.05%,敏感性从76.52%提高到92.68%,和特异性从91.14%降至95.20%。特别好的结果的支持向量机模型局限于前100名Wilcoxon特性,平均收益率6%测试错误。gydF4y2Ba
|
||||||||||||||||||||||||||||
| 支持向量机:线性支持向量机。gydF4y2Ba 支持向量机在前20名Wilcoxon峰值。gydF4y2Ba 随机森林。gydF4y2Ba |
||||||||||||||||||||||||||||
结合和独立数据的比较结果表明,女士的结合蛋白质组学和微生物来源有利于结合数据的分类精度和改善预测模型caries-active和caries-free病人。特别是线性SVM分类器微生物数据错误降至16%和26%的蛋白质组学数据女士对合并后的数据大约9%。同样,一个功能受限的线性支持向量机(Wilcoxon特性过滤)从11%提高微生物蛋白质组学数据和26%数据合并后的数据6%的误差。唯一的标识符,并没有产生一个改进合并后的数据是随机森林。微生物的方法实现了9%的测试错误数据和32%,蛋白质组学数据,同时结合导致16%的测试错误。我们猜想的下降(从低测试错误微生物蛋白质组学数据更高的错误和组合数据)是高维数据的影响分类精度的随机森林模型:微生物数据集包括60特性而女士蛋白质组学数据集包括约2000的峰值。与此相比,支持向量机分类器的性能显得更加强劲的高维度数据。为了验证这一猜想我们运行随机森林分类器顶部100 Wilcoxon特性和获得的平均测试误差8.68%,敏感性87.78%,特异性94.45%,似乎支持我们的猜想。gydF4y2Ba
结果类似性质的表gydF4y2Ba3gydF4y2Ba如果我们得到执行完整的ROC分析的三种方法(图gydF4y2Ba9gydF4y2Ba)和计算ROC曲线下的面积(AUC)统计。曲线下的面积表明,合并后的数据提高正确分类的支持向量机模型的能力情况和控制样品在不同类型的不同偏好下误分类错误。gydF4y2Ba
4所示。讨论gydF4y2Ba
目前的研究是在一群年轻的孩子可能代表龋齿发展的自然历史的高危人群。虽然以前的流行病学和实验室研究表明,口腔唾液蛋白质组的微生物和组件发展龋齿的风险因素(gydF4y2Ba1gydF4y2Ba- - - - - -gydF4y2Ba4gydF4y2Ba,gydF4y2Ba9gydF4y2Ba,gydF4y2Ba10gydF4y2Ba),使用高通量方法描述细菌生物被膜和唾液蛋白质组允许进一步的大规模临床抽样和测试来验证先前的研究。然而,口腔菌群和唾液蛋白质组都是复杂的,都是静态的。这项研究代表了一个应用程序的统计机器学习原理预测模型建设。我们采用相对高通量方法来收集口腔菌群和唾液蛋白质组、多路复用微生物数组和SELDI-TOF-MS剖析。使用这种方法,我们演示了这两种技术获得的实验数据携带信息用于识别caries-active caries-free精度高的患者。我们的结果表明,微生物数据比女士更强大的分类目的蛋白质组学数据,如果两个独立的数据源进行了分析。然而,两个数据源似乎也携带不重叠的信息,当他们相结合,提高分类性能和提高caries-free和caries-active病人的歧视。结合数据集的分析导致降低试验误差和提高敏感性和特异性(表gydF4y2Ba3gydF4y2Ba,图gydF4y2Ba9gydF4y2Ba),这表明来自不同数据源的数据最终可能允许识别更多的疾病临床上有用的生物标志物。gydF4y2Ba
分子遗传学方法描述的出现健康和疾病的口腔菌群是揭示复杂的口腔生物膜(gydF4y2Ba29日gydF4y2Ba]。使用16 s DNA分析是用来建立与不同站点相关的植物在口腔和指示植物特定细分市场的健康和疾病之间的不同。最近的研究描述caries-free口腔菌群和caries-afflicted个人表明微生物菌群与龋齿比原来想象的要更复杂和定量多个口腔微生物的相对量的变化可以导致龋齿的发展gydF4y2Ba6gydF4y2Ba- - - - - -gydF4y2Ba8gydF4y2Ba]。鉴于口腔菌群的生物膜的概念与牙齿表面,这些发现并不意外。这种微生物场景的一个推论是,识别关键微生物不仅存在,而且也在健康和疾病状态定量改变可能导致临床上有用的生物标记的发展。当前的研究估计的数量相对水平82个细菌采样的齿面在健康和疾病,开发了一个模型来区分情况和控制敏感性和特异性为86%和90%,分别为(表gydF4y2Ba1gydF4y2Ba)。gydF4y2Ba
龋齿是一个慢性的过程,也演示了一个双向的质量在疾病过程的早期。人口在当前的研究中,118年caries-free个人,10个人显示先前确定的caries-associated植物转移(gydF4y2Ba7gydF4y2Ba]。我们分类模型预测,这些个体的微生物的状况是类似于caries-active群虽然临床上他们没有任何疾病的迹象。在随后的后续研究的临床检查人口一年之后,我们发现所有10个个体龋临床表现明显。这些发现表明,先前口腔菌群的变化与临床相关的龋齿先于疾病的临床表现。微生物表达数据建模的结果在最近的研究中,因此,可能被认为是相当不错的,因为有些人可能会出现临床健康,但展示与疾病相关的植物。gydF4y2Ba
唾液的定量和定性方面长期以来被建议作为龋齿(病因学的因素gydF4y2Ba2gydF4y2Ba]。证据表明,减少唾液流积极增加龋齿是实质性的,和相关性与自然疾病被发现,这样一个干燥综合征以及医源性诱导等州后放射治疗,切除唾液腺(gydF4y2Ba2gydF4y2Ba]。证据为特定的唾液蛋白质作用分摊或龋齿过程中保护较不确定gydF4y2Ba11gydF4y2Ba,gydF4y2Ba30.gydF4y2Ba]。困难的一部分可能与这一事实有关某些唾液蛋白质的丰度很难识别的蛋白质水平的变化出现在低得多。SELDI-TOF-MS提供了一个简单但高通量和非常敏感的蛋白质组学的方法,可以让蛋白表达分析大型的复杂的生物标本的gydF4y2Ba13gydF4y2Ba]。重要的是,这种方法允许评估低质量的蛋白质(< 10 kDa),这是通过其他方式难以有效地分析。虽然SELDI-TOF-MS确实允许评估一个潜在的广泛的蛋白质,它有一定的局限性,包括无法识别特定的蛋白质。SELDI-TOF-MS已成功用于检测唾液生物标记(gydF4y2Ba31日gydF4y2Ba,gydF4y2Ba32gydF4y2Ba]。评价SELDI-TOF-MS蛋白质峰区分情况和控制导致了一个公平的模式,但不如微生物数据集。我们相信该模型可以提高能力检测和识别特定的蛋白质包括那些存在于少量唾液。目前正在努力的唾液蛋白质组,应该允许识别和量化的唾液蛋白质高通量的方式(gydF4y2Ba17gydF4y2Ba,gydF4y2Ba19gydF4y2Ba,gydF4y2Ba33gydF4y2Ba]。gydF4y2Ba
这项研究的目标是确定从微生物和蛋白质来源的数据可以提高可预见性和灵敏度和减少误差相对于单个微生物或蛋白质组学模型。我们目前的研究结果表明,这是,实际上,(表gydF4y2Ba3gydF4y2Ba)。这些发现符合口腔微生物病原学的作用,唾液蛋白质也表明,这些因素是相互独立的。这些发现表明,表征微生物和唾液蛋白质组可以提供更好的预测价值个人发展儿童龋齿的风险的识别。识别这些微生物和蛋白质组变量也可能允许一个更加精炼的潜在疾病过程的理解和阐明重要的病原学的因素重要的转变从健康和疾病。这些数据可能允许识别那些没有开发临床疾病但谁体现微生物和唾液生物标志物特征,表明他们在患该疾病的风险。这将允许干预状态发生前症状。这是尤其重要的早期儿童龋齿,随着疾病被认为是可逆的早期阶段(gydF4y2Ba34gydF4y2Ba]。进一步细化临床上有用的微生物和唾液生物标记将帮助风险评估和治疗靶点的识别。此外,这些生物标志物分析可能提供治疗端点允许的决心成功治疗微生物和蛋白质组配置文件修改与龋齿易感性相关。gydF4y2Ba
5。结论gydF4y2Ba
我们演示了使用相对高通量方法描述幼儿口腔菌群和唾液蛋白质组儿童龋齿的危险。使用一个统计机器学习方法,我们演示了这两种技术获得的实验数据携带信息用于识别caries-active caries-free精度高的患者。我们的结果表明,微生物数据比女士更强大的分类目的蛋白质组学数据,如果两个独立的数据源进行了分析。然而,两个数据源似乎也携带不重叠的信息,当他们相结合,提高分类性能和提高辨别力龋齿自由和龋齿活跃的病人。结合数据集的分析导致减少测试误差和改进的敏感性和特异性,表明来自不同数据源的数据最终可能允许识别更多的疾病临床上有用的生物标志物。gydF4y2Ba
识别这些微生物和蛋白质组变量最终可能允许一个更加精炼的潜在疾病过程的理解和阐明重要的病原学的因素重要的转变从健康和疾病。这些数据可能允许识别那些没有开发临床疾病但谁体现微生物和唾液生物标志物特征,表明他们在患该疾病的风险。这将允许干预状态发生前症状。这是特别重要的儿童早期龋齿随着疾病的早期阶段被认为是可逆的。进一步细化临床上有用的微生物和唾液生物标记将帮助风险评估和治疗靶点的识别。此外,这些生物标志物分析可能提供治疗端点允许的决心成功治疗微生物和蛋白质组配置文件修改与龋齿易感性相关。gydF4y2Ba
确认gydF4y2Ba
作者承认NIDCR的校内项目的支持,国家卫生研究院的贝塞斯达,医学博士,20892年美国,从NIDCR批准号DE15315。gydF4y2Ba
引用gydF4y2Ba
- 诊断和管理龋齿的整个生活。”美国国立卫生研究院的发展共识会议声明,3月26 - 28日期间,2001年,“gydF4y2Ba牙科教育杂志gydF4y2Ba,卷65,不。10日,1162 - 1168年,2001页。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
- r·h·Selwitz人工智能伊斯梅尔,n . b .皮特“龋齿”,gydF4y2Ba《柳叶刀》gydF4y2Ba,卷369,不。9555年,51-59,2007页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- w . j .:“人类牙科衰变,变形链球菌的作用”gydF4y2Ba微生物学检查gydF4y2Ba,50卷,不。4、353 - 380年,1986页。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
- j . van Houte“微生物在龋齿病因中的作用。”gydF4y2Ba牙科研究杂志》gydF4y2Ba,卷73,不。3、672 - 681年,1994页。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
- h·f·詹金森和r . j .拉蒙特”口腔微生物群落在疾病和健康,”gydF4y2Ba微生物学的趋势gydF4y2Ba,13卷,不。12日,第595 - 589页,2005年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- m·r·贝克尔b·j·帕斯特e . j .草地的et al .,“分子分析与儿童龋齿的细菌物种,”gydF4y2Ba临床微生物学杂志gydF4y2Ba,40卷,不。3、1001 - 1009年,2002页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- p·m·寇比j . Lyons-Weiler w·a .毕捷et al .,“儿童早期龋微生物风险指标”,gydF4y2Ba临床微生物学杂志gydF4y2Ba,43卷,不。11日,第5759 - 5753页,2005年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- y, y通用电气、d . Saxena和p . w . kpcb风险”的遗传分析口腔微生物群与严重的早期儿童龋齿时,“gydF4y2Ba临床微生物学杂志gydF4y2Ba,45卷,不。1,第87 - 81页,2007。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- m . Lenander-Lumikari和诉Loimaranta唾液和蛀牙。”gydF4y2Ba牙科研究进展gydF4y2Ba,14卷,40-47,2000页。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
- a . Van Nieuw Amerongen、j·g·Bolscher和e·c·Veerman“唾液蛋白质:保护和诊断价值在牙体?”gydF4y2Ba龋齿研究gydF4y2Ba,38卷,不。3、247 - 253年,2004页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- r . Vitorino m . j . c . Lobo j . r . Duarte a . j . Ferrer-Correia p . m . domingue和f·m·l·阿马多“龋齿唾肽的作用”,gydF4y2Ba生物色谱法gydF4y2Ba,19卷,不。3、214 - 222年,2005页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- i d·曼德尔”,唾液在维持口腔内稳态的作用。”gydF4y2Ba《美国牙科协会杂志》上gydF4y2Ba,卷119,不。2、298 - 304年,1989页。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
- r . Schipper转舵,j . de Groot l . Harthoorn e . Dransfield和w·范Heerde”SELDI-TOF-MS唾液:方法和预处理效果,”gydF4y2Ba《色谱B:分析技术在生物医学和生命科学gydF4y2Ba,卷847,不。1,45-53,2007页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- f·g·奥本海姆,e·萨利赫w . l . Siqueira w . Zhang和e . j . Helmerhorst“唾液蛋白质组及其遗传多态性,”gydF4y2Ba纽约科学院上gydF4y2Ba卷。1098年,22-50,2007页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- f·m·l·阿马多r·m·p·Vitorino p . m . d . n . domingue m . j . c . Lobo和j·a·r·杜阿尔特“人类唾液蛋白质组的分析,gydF4y2Ba蛋白质组学的专家审查gydF4y2Ba,卷2,不。4、521 - 539年,2005页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- 美国,y, j .王et al .,“人类唾液蛋白质组和转录组,”gydF4y2Ba牙科研究杂志》gydF4y2Ba,卷85,不。12日,第1133 - 1129页,2006年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- d . t . Wong“唾液诊断由纳米技术、蛋白质组学和基因组学,”gydF4y2Ba美国牙科协会杂志》上gydF4y2Ba,卷137,不。3、313 - 321年,2006页。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
- c . f . Streckfus和l . r . Bigler“唾液作为诊断液,”gydF4y2Ba口腔疾病gydF4y2Ba,8卷,不。2、69 - 76年,2002页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- 胡,j . a .厕所,d . t . Wong“人体液蛋白质组分析,”gydF4y2Ba蛋白质组学gydF4y2Ba》第六卷,没有。23日,第6353 - 6326页,2006年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- 洛杉矶Tabak”,现场即时诊断输入口,“gydF4y2Ba纽约科学院上gydF4y2Ba,卷1098,7 - 14,2007页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- l . m . Kaste r·h·Selwitz r . j . Oldakowski j·a·布鲁内尔·d·m·韦恩和l . j .布朗,“冠龋在儿童和青少年的主要和永久齿列17岁:美国,1988 - 1991,”gydF4y2Ba牙科研究杂志》gydF4y2Ba卷,75年,第641 - 631页,1996年。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
- m . Hauskrecht r . Pelikan d . e . Malehorn et al .,“SELDI-TOF-MS蛋白质组配置文件分类特征选择,”gydF4y2Ba应用生物信息学gydF4y2Ba,4卷,不。4、227 - 246年,2005页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- s·m·维斯和c a . KulikowskigydF4y2Ba学习计算机系统:从统计分类和预测方法,神经网络、机器学习、专家系统gydF4y2Ba加州圣马特奥,m·考夫曼出版商,美国,1991年。gydF4y2Ba
- b·埃夫隆和r . TibshiranigydF4y2Ba介绍了引导gydF4y2Ba查普曼&大厅,纽约,纽约,美国,1993年。gydF4y2Ba
- v . n . VapnikgydF4y2Ba统计学习理论的本质gydF4y2Ba施普林格,纽约,纽约,美国,1995年。gydF4y2Ba
- c . j . c . Burges”教程对支持向量机模式识别,”gydF4y2Ba数据挖掘和知识发现gydF4y2Ba,卷2,不。2、121 - 167年,1998页。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
- b . Scholkopf和a·j·SmolagydF4y2Ba学习与内核:支持向量机,正规化,优化和超越gydF4y2Ba美国剑桥,麻省理工学院出版社,质量,2002年。gydF4y2Ba
- l . Breiman“随机森林”,gydF4y2Ba机器学习gydF4y2Ba,45卷,不。1,5-32,2001页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- b . j .贴纸,s . k .德国人j·l·加尔文et al .,“人类龈下的菌斑细菌多样性,”gydF4y2Ba细菌学期刊gydF4y2Ba,卷183,不。12日,第3783 - 3770页,2001年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- m . Ayad b . c . Van Wuyckhuyse k Minaguchi et al .,“基本协会脯氨酸肽从人类腮腺分泌物与龋齿的经验,“gydF4y2Ba牙科研究杂志》gydF4y2Ba,卷79,不。4、976 - 982年,2000页。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
- c . f . Streckfus l . r . Bigler m·茨威格,“使用表面增强激光解吸/电离飞行时间质谱检测唾液中假定的乳腺癌标记:可行性研究,“gydF4y2Ba口腔病理学和医学杂志》上gydF4y2Ba,35卷,不。5,292 - 300年,2006页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- o . h . Ryu j·c·阿特金森g . t . Hoehn g . g . Illei t·c·哈特,“干燥综合征腮腺唾液鉴定生物标记物的表面增强激光解吸/电离飞行时间质谱和二维凝胶电泳,”gydF4y2Ba风湿病学gydF4y2Ba,45卷,不。9日,第1086 - 1077页,2006年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- h·谢:l . Rhodus r·j·格里芬j . v . carli t·j·格里芬,“人类唾液蛋白质的目录被自由流动electrophoresis-based肽分离和串联质谱,”gydF4y2Ba分子和细胞蛋白质组学gydF4y2Ba,4卷,不。11日,第1830 - 1826页,2005年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
- w·h·阿诺德·a·Dorow s Langenhorst z Gintner, j . Banoczy和p . Gaengler“含氟牙膏对釉质脱矿的影响,”gydF4y2BaBMC口腔健康gydF4y2Ba第八条,卷。6日,2006年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
版权gydF4y2Ba
版权©2011年托马斯·c·哈特等。这是一个开放的分布式下文章gydF4y2Ba知识共享归属许可gydF4y2Ba,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。gydF4y2Ba