文摘

背景。结核病是一种严重的慢性细菌感染引起的结核分枝杆菌(MTB)。它是世界上最致命的疾病之一,世界各地的人们的一个沉重的负担。然而,中心基因在宿主反应在很大程度上仍不清楚。方法。研究了数据集GSE11199澄清的潜在基因网络和信号转导通路在结核病。受试者分为潜在的结核病和肺结核、差异表达基因的分布使用GEO2R它们之间(度)进行了分析。我们验证了丰富度的过程和途径利用基因和基因组的京都百科全书(KEGG)和基因本体论(去)。建设(PPI)蛋白质间交互作用的网络度是通过利用搜索工具的交互检索基因(字符串),旨在识别中心的基因。然后,中心潜在基因表达水平和肺结核被箱线图。最后,通过利用基因集富集分析(GSEA),我们进一步分析了通路相关的度数据集GSE11199显示模式之间潜在的变化和肺结核。结果。我们确定了数据集GSE11199 98度,包括91个基因调节和7个基因表达下调。去的浓缩和KEGG途径证明cytokine-mediated信号通路调节度主要是丰富的,应对移行,内质网腔,苷酶活动,麻疹,JAK-STAT信号通路,cytokine-cytokine受体相互作用,等。基于PPI网络,我们获得4中心基因拥有更高的学位,即CTLA4, GZMB GZMA, PRF1。箱线图显示,这四个中心肺结核组的基因表达水平高于潜在的集团。最后,通过基因集富集分析(GSEA),得出度在很大程度上与蛋白酶体和初级免疫缺陷有关。结论。本研究揭示了在结核病感染致病基因的协调,为结核病的诊断提供了一个有前途的基因组。这些中心基因还提供新的方向发展的潜在的分子结核病治疗的目标。

1。背景

结核病是一种严重的慢性细菌感染引起的结核分枝杆菌(MTB),主要通过飞沫传播(1]。它是世界上最致命的疾病之一,世界各地的人们的一个沉重的负担。它的存在不仅把微生物感染也会导致肺组织(2,3]。此外,大多数患者有典型症状像轻度发热、盗汗,疲劳(4]。结核病是很难通过临床诊断放射学、细菌学和组织学5]。治疗结核病的药物治疗是最重要手段(6),但有太多的耐药患者,特别是多个和广泛的耐药性(7]。因此,寻找一种新的方式来治疗结核病仍然是重要的。

目前,高通量测序的出现,基因组学,转录组提供了许多新的治疗结核病治疗(8]。例如,Mboowa等人的报告提到,高通量测序技术已经广泛的应用于传染病的研究(9]。这种技术产生了大量的生物学和改变了历史上前所未有的信息管理的传染病。Chiner-Oms等人发现结核分枝杆菌的演变复杂通过大量基因组数据和找到更多细微的差别在不同的人类肺结核隔离,导致病原体的理解和确定相关的生物医学的目标(10]。此外,伦斯和Loxton的研究表明,转录途径和基因表达技术的联合应用可以帮助澄清更有效的诊断和治疗结核病,以及更有效的药物疗法和新疫苗的发展(11]。生物标志物的鉴定转录资料可以帮助改善结核病的诊断和治疗(12]。上面的方法占有重要的地位在结核病的研究和实践,证实了大量的研究,也促进了诊断,认知,和治疗结核病。

在这个研究中,我们分析了8潜伏性结核病和8肺结核GSE11199数据库中的样本,然后确定差异表达基因通过GEO2R(度)。之后,度是由基因和基因组的京都百科全书丰富(KEGG)和基因本体论(去),我们构建了一个蛋白质相互作用(PPI)网络来识别基因中心。最后,我们得到了关键路径通过基因集富集分析(GSEA)。通过以上研究,结核病的诊断特点探索和发现生物标志物的临床治疗。

2。材料和方法

2.1。基因表达微阵列数据采集

常见的功能基因组学数据库,NCBI基因表达综合数据库(地理,http://www.ncbi.nlm.nih.gov/geo)高通量测序基因表达数据和微阵列数据。基因表达数据集GSE11199 [13从地理)下载。在这个数据集,8对潜伏性结核病和肺结核样本进行了分析。

2.2。识别差异表达基因(度)

我们使用GEO2R [14)(http://www.ncbi.nlm.nih.gov/geo/geo2r),地理数据库基于R语言互动分析工具,执行度分析的识别。的基因 被定义为差异表达。与此同时,与调整 值< 0.05,差异有统计学意义。此外,我们使用了火山显示潜在的和肺样本显示使用ImageGP视觉层次聚类(http://www.ehbio.com/ImageGP/index.php/Home/Index/index.html)。

2.3。KEGG,浓缩度的分析

针对理解度的函数,我们通过去KEGG进行富集分析。去和KEGG数据库中的浓缩为注释,可视化和综合发现网站(大卫,https://david.ncifcrf.gov/)使用。途径包括三个部分:分子功能(MF),细胞组件(CC)和生物过程(BP)。作为数据库整合化学、基因组和系统功能信息,KEGG具有强大的图形功能。它显示了代谢途径相关的基因列表,这有助于全面了解疾病。

2.4。PPI网络建设

为了确定中心结核病患者的基因,我们构建了一个PPI网络利用检索在线数据库搜索工具的相互作用基因(字符串,http://string-db.org)。在此基础上,基因之间的交互可视化和中心基因预测根据协会的力量。

2.5。GSEA

根据GSE11199数据集,结核病患者被分成8组的潜伏性结核病和8组肺结核。针对确定度的潜在功能,GSEA GSE11199使用GSEA执行3.0 (http://www.broad.mit.edu/gsea/), 被认为是具有统计学意义。

3所示。结果

3.1。的识别度

我们下载的基因表达谱GSE11199从GEO数据库,包括两组(8潜伏肺结核主题和8肺结核科目)。之后,我们确定了98度GSE11199数据集,包括91个基因调节和7个基因表达下调。我们显示的分布度通过火山图(图1)。前7调节基因包括MMP12、TACSTD2 IDO1, CCL23, LIMK2 CYP27B1, CD1B。前7表达下调的基因包括KITLG、SRPX HS3ST2、EDNRB, HNRNPU-AS1, HAMP贷款,CDC42EP3。

3.2。去KEGG通路富集分析

分析结果表明,在BP,调节度在cytokine-mediated丰富的信号通路,应对移行,peptidyl-tyrosine自身磷酸化,酶联受体蛋白信号通路,和其他流程。在CC,调节度丰富的内质网腔中,轴杆、轴杆中心体,等等。在MF,调节度的活动,丰富的β-半乳糖组蛋白苏氨酸激酶活性,牛乳糖活动,等等(图2(一个))。此外,在KEGG分析的结果,调节度明显丰富JAK-STAT信号通路,cytokine-cytokine受体相互作用,麻疹,细胞凋亡,巴尔病毒感染、细胞周期以及其他途径(图2 (b))。

3.3。PPI网络建设

从数据库的字符串数据显示给定基因之间的交互。PPI网络的调节度由89个节点和96边缘(图3)。在这些节点 筛选标准,4最重要的主节点基因筛选。这些基因是CTLA4, GZMB、GZMA PRF1。在这四个基因,CTLA4最高节点度( ),和PRF1最低的节点度( )。除此之外,这四个基因的表达进行了分析(数据4(一)- - - - - -4 (d)),证明CTLA4的表达水平,GZMB, GZMA, PRF1肺结核样本明显高于那些潜在的对照组。

3.4。GSEA

去KEGG通路富集分析只是用来探测度,而GSEA是用来检测基因数据集,这是方便补充其他相关浓缩通路。根据图5(一个)可以看到,这些蛋白酶体通路中的基因明显富集,并规范化浓缩指数为2.353477。另一浓缩途径是主要的免疫缺陷(图5 (b)),其规范化浓缩指数为2.187469。

4所示。讨论

肺结核是一种传染病导致全球发病率和死亡率的增加(15]。尽管共同努力开发新的诊断方法、药物和疫苗,扩大管道在过去的20年里(16全球紧急[],结核病仍然是一个17]。在这个研究中,我们分析了GEO数据库中的数据集GSE11199识别关键路径和中心与结核病相关的基因。通过GSE11199数据集,98度之间的识别潜在的和肺结核的样本。其中,火山地图直观地显示91调节基因和7表达下调的基因。然后,根据和KEGG分析,我们得到了生物过程和途径与调节度有关。大大丰富了条款cytokine-mediated顶部信号通路(18),反应移行细胞(19),peptidyl-tyrosine自身磷酸化,麻疹,JAK-STAT信号通路(20.],cytokine-cytokine受体相互作用[21],Th17细胞分化[22)等。Pai和罗德里格斯解释间接MTB暴露移行细胞释放试验的迹象,表明有结核分枝杆菌的细胞免疫反应(23]。研究表明,Th17细胞分化诱导中性粒细胞炎症,中转组织损伤,并参与结核的病理24]。它起着保护的作用在结核病的早期阶段,但诱发疾病的发展阶段末的结核病。

PPI网络建立数据库使用字符串,和四个中心的基因,即CTLA4, GZMB, GZMA,和PRF1确认通过学位的价值。因此,我们得出的结论是,这四个基因可能与肺结核的发病和治疗。据报道,这四个基因参与其他疾病的发展。例如,Froelich J GZMA等人进行一个特殊的研究报告,指出GZMA最丰富的丝氨酸蛋白酶在杀死细胞毒性颗粒,激活新细胞死亡通路并生成过程中活性氧(25]。这导致单链DNA损伤激活,激活单核细胞,产生炎性细胞因子。特纳等人确认GZMB水平在慢性疾病和炎症性皮肤病的表达水平显著高于正常健康的人类和相关皮肤损伤,炎症和修复(26]。CTLA4 Buchbinder和德赛本文提出CTLA4是负调节T细胞免疫功能和参与的所有方面对黑色素瘤免疫治疗,非小细胞肺癌和其他癌症(27]。此外,在PRF1很少有研究报告,但研究表明,该基因参与表达等疾病家族hemophagocytic lymphohistiocytosis 2型(28),再生障碍性贫血(29日),糖尿病,多发性硬化(30.),和淋巴瘤(31日]。

根据GSEA的结果,我们发现结核明显与蛋白酶体和原发性免疫缺陷有关。Samanovic等人的研究提到,水解酶主要存在于古细菌和真核生物和结核分枝杆菌的发病密切相关32]。结核病的发生取决于蛋白酶体的功能,结核分枝杆菌的生化降解酶及其在毒性作用。不仅如此,Cerda-Maira在学业和达尔文也显示,蛋白酶体负责目标蛋白质的降解在真核生物,和一系列的数据也证实,蛋白酶体与结核分枝杆菌的发病机制(33]。Glanzmann等人解释个人原发性免疫缺陷和结核病和之间的关系,基于调查数据在非洲,发现个人损失的主要免疫功能更可能导致结核病和其他重大疾病(34]。这项研究有一些局限性。首先,需要验证度的表达水平存在。其次,基因在结核病中心的具体机制需要进一步探讨。

简而言之,我们有冗长的98度,其中包括91年调节和7之间的表达下调的潜伏性结核病和肺结核。然后,移行细胞反应等途径,Th17细胞分化,蛋白酶体,和初级免疫缺陷,很大程度上是通过KEGG与结核病有关,,GSEA。最后,我们确定4基因通过PPI网络中心;这些中心基因可以作为结核病的诊断或预后的生物标志物,为结核病的治疗提供新的方向和技术。

数据可用性

本研究中所有数据分析从发表文章或可从获得相应的作者合理的请求。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

概念和设计由天成。发展的方法是由Xiwen高。样本集合是由桂花饶。分析和解释数据是由张天成和桂花饶。写作,评论,和/或修改的手稿是由天成,桂花Rao, Xiwen高。