文摘
强直性脊柱炎(AS)是一种自身免疫性疾病,主要影响脊柱关节、骶髂关节、邻近软组织。我们进行了生物信息学分析,探讨发病机制和相关的分子机制揭示小说的潜在分子靶点治疗。GSE25101的概要文件,包含基因表达数据从血液中提取的16病人和匹配控制,从基因表达获得综合(GEO)数据库。背景校正和标准化进行了利用文字记录每百万(TPM)的方法。患者和正常组织的分析之后,我们确定了199个差异表达基因(度)与upregulation和121度的差别,对这些limma R包。京都基因和基因组的百科全书的结果(KEGG)通路和基因本体论(去)生物过程浓缩分析显示,与upregulation度主要是与剪接体,核糖体,RNA-catabolic过程中,电子传递链等。主要差别和度对这些参与T细胞相关途径和过程。后(PPI)网络蛋白质间交互作用的分析,我们的数据显示,中心的基因,包括MRPL13、MRPL22, LSM3, COX7A2, COX7C, EP300, PTPRC, CD4细胞,可以作为治疗目标。我们的数据提供新线索发现的特点,探索更有前途的治疗目标转向。
1。背景
强直性脊柱炎(AS),主要发生在骶髂关节,脊柱、关节和外部(1),是一种风湿免疫疾病的发病率0.3%在中国(2)。患者大多是年轻人(3)。大多数患者早期症状像钝痛的腰,臀部,和骶髂关节区域,后来随着心脏并发症,眼睛、耳朵和神经系统(4)。的具体发病机理尚不清楚。只有理解,遗传因素在发病机理(扮演主要角色5)。此外,环境、免疫、代谢等因素也常见的原因(6)。目前,不能完全治愈。大多数患者可使用非甾体类药物治疗和锻炼。在严重的情况下,手术是必需的(7)。应该注意,不影响患者的生存,但它会逐渐破坏他们的生活(4)。因此,为了避免加重的患者,需要开发新的治疗方法尽快。
生物信息学是一个新的边缘学科,计算机作为一种工具来存储,检索和分析生物信息研究生命科学(8)。目前,生物信息学的研究重点主要体现在基因组学和蛋白质组学(9),这是分析生物信息的结构和功能表达观点的核酸序列和蛋白质序列。生物信息学还扮演着一个重要的角色在人类疾病的研究(10)。如建立疾病相关的生物信息学数据库(11),隔离和标识的人类基因和疾病相关基因(12),加速基因药物的开发(13),这些具有重要和积极的影响人类疾病的预防和治疗。我们执行的生物信息学分析探讨发病机制和挖出的分子机制和可能的治疗方法对不清楚细节。GSE25101是利用检测标本的差异表达基因(度)的患者和正常对照组。然后,分子机制的分析途径和功能性浓缩后得到。最后,使用这些度,我们建立了蛋白质相互作用(PPI)网络寻求潜在基因在目标。
2。材料和方法
2.1。数据源
GSE25101 (14),如RNA表达谱,从基因表达综合数据库(地理,下载https://www.ncbi.nlm.nih.gov/geo/在NCBI)。GSE25101含有RNA表达数据从血液中提取的16个病人和16匹配控制使用PAXgene管(15)。
2.2。数据预处理和度筛选
GSE25101数据集的表达数据被记录每百万(TPM)归一化方法。运用记录id变成了基因的符号。中值被认为是基因的表达水平,如果不同的探针是相同的基因注释。然后,我们利用limma R包屏幕作为患者和正常对照组之间的度。截止设置是 和 基于Benjamini和业务(BH)过程。睡眠是用于绘制热图基于网站(https://software.broadinstitute.org/morpheus/)。
2.3。分析途径和功能性浓缩
Metascape用于分析基因和基因组的京都百科全书(KEGG)通路和基因本体论(去)生物过程浓缩(16)通过访问https://metascape.org/gp/index.html /主/步骤1。全基因组基因被认为是丰富的背景。我们获得了前20名大大丰富了关于条款值的累计超几何分布的基础上获得的。
2.4。PPI网络的分析
检索的搜索工具相互作用基因(17)(字符串,https://string-db.org)执行分析和可视化PPI网络的调节和表达下调度。一个中等 表示有很大差别。此外,中心基因,作为关键候选基因与基本生理监管使用,选择基于他们的程度的重要性。
3所示。结果
3.1。数据预处理和度筛选
TPM是利用标准化GSE126118转录组表达数据的数据集。limma R包被带到屏幕匹配患者和对照组之间的度。火山显示识别度(图的阴谋1(一))。根据的关键标准值< 0.05和 ,320度被筛选。其中,199度和121度增加减少。此外,我们还构建了基因表达与颜色模式热图显示基因表达的差异存在的患者和正常组(图1 (b))。
(一)
(b)
3.2。分析途径和功能性浓缩
考虑到本体的来源,包括KEGG途径和生物过程,我们分析了路径和功能性浓缩Metascape度的。所有的基因被认为是浓缩的背景。根据计算值的累计超几何分布,统计上明显的前20名KEGG通路和生物过程与调节和表达下调度提出了数据2和3,分别。它可以观察到,度与upregulation主要参与RNA和蛋白质有关途径,如剪接体,核糖体,氧化磷酸化,蛋白酶体、RNA降解和蛋白质出口(图2(一个))。丰富生物过程的调节度与能源生产如呼吸电子传递链、氧化磷酸化,细胞色素c氧气线粒体ATP合成耦合电子传递,和ATP合成耦合电子传递(图2 (b))。富集度使之抑制与免疫反应相关的途径和过程,特别是Th17 Th1、Th2细胞分化;T细胞受体信号通路;抗原加工和演示;积极的T细胞的选择;淋巴细胞分化;淋巴细胞激活感人的免疫反应;免疫response-activating细胞表面受体信号通路;抗原受体介导的信号通路;T细胞的选择; and activation and differentiation (Figures3(一个)和3 (b))。
(一)
(b)
(一)
(b)
3.3。PPI网络分析
字符串软件构建PPI网络使用调查度之间的相互作用。数据从数据库的字符串显示这些度彼此互动。图4显示,PPI网络的调节度是734年由198个节点和边缘。在198个节点,MRPL13 ( ),LSM3 ( ),COX7A2 ( ),COX7C ( ),和MRPL22 ( )前5个重要枢纽节点基因。同时,表达下调的PPI网络度(图5)包含120个节点和159个边缘。在120个节点,EP300 ( ),PTPRC ( ),和CD4 ( )前3个重要枢纽节点基因。
4所示。讨论
是一种复杂的疾病,涉及许多因素(6)。为患者,目前还没有完全治愈。患者改善预后不良的唯一途径是积极配合治疗和执行一些康复锻炼。此外,早期发现和早期治疗是非常必要的。有证据显示,一些lncRNAs也参与的发展。一些研究表明,HLA-B27可能参与了发病机理(18)。例如,李等人报道的表达lncRNA梅格3被下调为(19),影响病人的住院时间的长度。棕褐色等人提出的发病机制的差别可能与自噬不足和对这些lncRNA气体5和lncRNA气体5可能有临床应用价值(20.)。我们发现了新的发现提示的特征像处理和利用的潜在目标。
我们的研究试图探索相关的潜在机制。公共基因表达数据从GEO数据库GSE25101被应用于分析数据。首先,我们规范化存在的原始数据,并挖出度为患者和正常对照组。然后,我们执行KEGG去分析来检测这些DEG-related通路和生物过程。我们确认199度增加和121度的减少PPI网络。丰富的数据分析显示,upregulation主要参与了剪接体的度,核糖体,RNA-catabolic过程中,电子传递链,等等。主要差别的度对这些参与T细胞相关途径和过程。研究表明,一些新的先天性或身体疾病相关变异在二级剪接体组件(21),如小脑性共济失调、骨髓增生异常综合征,spondyloepiphyseal获得性迟发性发育异常、肌萎缩性脊髓侧索硬化症,脊髓性肌萎缩。的生成活性氧(ROS)的线粒体电子传递链(等)被认为是重要的神经退行性疾病的发病机制,如老化过程和帕金森病(22)。MRPL22, PPI网络分析表明MRPL13 LSM3, COX7A2,和COX7C中心调节基因,和EP300 PTPRC, CD4基因的差别,对这些中心。
核基因编码MRPL13和MRPL22线粒体核糖体蛋白质的成员(可机读护照)。MRPL13 MRPL22生成在细胞质中,然后运送到线粒体组装线粒体核糖体(23)。可机读护照是必不可少的线粒体氧化磷酸化和展览最重要的是在调节凋亡诱导因素(24)。异常的MRP表达会导致多个失调,如线粒体代谢紊乱和不正常的细胞(25)。在这里,我们报告异常表达可机读护照的。
LSM3,作为组成部分precatalytic剪接体,参与大会的剪接体(26)。它的功能本质上pre-mRNA拼接的过程中愉快的一部分/ U6-U5 tri-snRNP (27)。Pre-mRNA拼接显示一个至关重要的角色,在真核细胞一代成熟的mrna调节基因的表达(28)。结合富集分析,我们的结果表明,表现出与剪接体的关系。COX7A2和COX7C组件的细胞色素c氧化酶(COX)是线粒体呼吸链的终端酶。考克斯负责催化氧还原成水,这是所有生物能源生产的关键(29日)。COX-related通路包含ATP合成、呼吸电子传递热量生产,等等,符合我们富集分析。
Ep300编码一个p300与腺病毒E1A相关的转录共激活剂(30.)。组蛋白乙酰转移酶Ep300介导转录的调制通过染色质重塑、细胞增殖和分化31日)。Ep300也被报道的共激活剂HIF1A(低氧诱导因子1α)从而激活VEGF诱导基因(32)。疾病与EP300包含Menke-Hennekam综合症2和Rubinstein-Taybi综合症(33)。EP300包含相关通路调节TP53活动通过乙酰化和Nur77 T细胞信号。蛋白质酪氨酸磷酸酶受体类型C (PTPRC)属于酪氨酸磷酸酶家族,通常功能作为管理者的一些细胞过程,即。、有丝分裂、细胞增殖和分化,致癌转换(34)。PTPRC显示的基本分子调节T细胞和B细胞抗原受体信号(35)。PTPRC-related信号工作通过直接与抗原受体交互复杂或激励几个Src的激酶家族。CD4膜糖蛋白,也称为CD4抗原,是编码的CD4 T淋巴细胞的基因(36)。不仅T淋巴细胞表达CD4基因,还巨噬细胞、B细胞、粒细胞,大脑的不同区域。CD4膜糖蛋白与T细胞受体和受体在一起工作来识别抗原的抗原递呈细胞的情况下II类MHC分子(37)。它可以激活或增强T细胞激活的早期阶段和展览的核心中介间接传染病和免疫介导的神经元损伤的中枢神经系统疾病。总之,这三个基因与T细胞是符合我们浓缩表达下调的基因分析和可能的治疗目标。
这项研究有一些局限性。中心基因的表达水平需要进一步验证。在接下来的研究中,我们将收集临床样本的表达水平,并确定中心通过TaqMan实时PCR基因。我们将进一步探索中心基因表达之间的关系和临床参数(包括临床分期、年龄、和生存时间)。
5。结论
本研究利用生物信息学方法分析基因表达数据GSE25101发掘人们相当大的点,并承诺目标的治疗。总的来看,我们筛选后差别与upregulation 199度,121度对这些分析患者和正常控制的。KEGG去富集分析证明了调节度在很大程度上与剪接体,核糖体,RNA-catabolic过程,电子传递链。通常是丰富的差别和度对这些T细胞相关途径和过程。PPI网络分析表明MRPL13、MRPL22 LSM3, COX7A2, COX7C, EP300, PTPRC, CD4基因中心和可能的治疗目标。我们的数据提供新线索发现的特点,探索更有前途的治疗目标转向。在医学领域,它有积极的和未来的治疗具有重要意义。
数据可用性
和/或使用的数据集分析在当前研究可从相应的作者以合理的要求。
的利益冲突
作者声明没有竞争的经济利益。
作者的贡献
概念和设计是由孟Fanyan和刘拉妮。发展的方法是由煤矿秀和Ningna Du。样本集合是由Ningna Du, Daoming徐,李块。分析和解释数据是由Fanyan孟和煤矿秀。写作,评论,和/或修改的手稿被孟Fanyan处理,Ningna Du,拉妮。Fanyan孟和Ningna Du贡献了同样的工作。
确认
这项工作由自然科学基金支持的项目管理员江苏省中医医院(Y20056,申请人:Fanyan Meng)。