研究文章|开放获取
Shuaiqun王、徐小玲魏, ”识别基于生物信息学的中心与肺腺癌相关的基因分析”,计算和数学方法在医学, 卷。2021年, 文章的ID5550407, 12 页面, 2021年。 https://doi.org/10.1155/2021/5550407
识别基于生物信息学的中心与肺腺癌相关的基因分析
文摘
肺腺癌(LUAD)是肺恶性肿瘤之一。然而,它的病理尚未完全了解。本研究的目的是确定中心与LUAD相关的基因的生物信息学方法。三个基因表达数据集包括GSE116959、GSE74706 GSE85841从基因表达综合(GEO)下载数据库被用于这项研究。相关的差异表达基因(度)LUAD筛选利用limma包。基因本体论(去)和KEGG度进行了分析通过大卫的网站。差异表达基因的蛋白质相互作用(PPI)吸引了字符串的网站,并为可视化结果导入Cytoscape。然后,分析了PPI网络使用MCODE,模块得分大于5使用cytoHubba被发现。最后,GEPIA数据库和UALCAN数据库被用来验证和分析中心的生存基因。我们确认67调节基因和277个表达下调基因从三个LUAD数据集。 The results of GO analysis showed that the downregulated genes were significantly enriched in matrix adhesion and angiogenesis and upregulated differential genes were significantly enriched in cell adhesion and vascular development. KEGG pathway analysis showed that the differential genes of LUAD were significantly enriched in viral carcinogenesis and adhesion spots. The PPI network of differentially expressed genes consists of 269 nodes and 625 interactions. In addition, three modules with scores greater than 5 and seven hub genes, namely, MCM4, BIRC5, CDC20, CDC25C, FOXM1, GTSE1, and RFC4, playing an important role in the PPI network were screened out. In this study, we obtained the hub genes and pathways related to LUAD, revealing the molecular mechanism and pathogenesis of LUAD, which is helpful for the early detection of LUAD and provides a new idea for the treatment of LUAD.
1。介绍
肺癌是一种恶性肿瘤,目前为止没有发现有效的治疗。腺癌是最常见的组织学亚型,占大约一半的肺癌(1]。由于大多数肺癌诊断为发达地区或遥远的恶性蔓延后,这种疾病在全球范围内(死亡率高2]。尽管各种治疗方法包括手术的可用性,辐射,和有针对性的治疗,不幸的是,有很大障碍的有效治疗LUAD和总生存期不超过5年的患者肺腺癌(3]。如果能在早期发现疾病,将大大提高病人的生存率。一些研究指出,许多生物标记物与肿瘤的发生和发展密切相关,可用于肿瘤的早期筛查。然而,许多生物标记物是高度表达的各种肿瘤没有良好的特异性(4]。因此,有必要探索LUAD具体生物标志物早期诊断。近年来,基因表达分析芯片已广泛应用于各种疾病的研究领域,揭示了疾病和基因之间的联系,为疾病的发病机制提供有价值的线索来确定癌症的诊断和预后5]。生物信息学方法被广泛用于研究肺腺癌,和MCODE6)是用于构建的庞大网络聚类基因功能模块。这些模块在PPI网络的连接分子复杂的预测至关重要。为了进一步发现复杂网络的关键基因,本研究提出MCODE和cytoHubba相结合的研究方法。根据网络中节点的属性,与疾病相关的基因会被发现。
在这项研究中,三个肺腺癌从地理数据集被下载。差异表达基因的获得是通过比较肺腺癌样本和正常样本之间的基因表达。然后,去和KEGG信号通路富集分析被用来进行功能注释和信号通路分析度。最后,发生和发展的机理与LUAD研究在分子水平上。基因表达水平验证了通过GEPIA [7与UALCAN[],预后分析8]。它可能提供有价值的想法在未来LUAD的诊断和预后。
2。材料和方法
2.1。数据预处理和相关分析
摘要limma包被用来获得差异表达基因。数据被分为正常组和病变组和差异分析是提取不同的差异基因进行三个数据集,分别。标准筛选差异表达基因 和 在这篇文章中。差异分析的结果从三个数据集分割的三个数据集和基因共享的基因用于下面的分析研究中。维恩图在线工具用于交叉基因的维恩图。大卫(http://david.abcc.ncifcrf.gov/)是一个数据库用于基因功能注释和通路富集分析的差异。去分析描述了来自三个部分,包括分子的基因功能(MF)、生物过程(BP)和细胞组件(CC)和发现大大丰富了词。KEGG通路富集分析丰富微分基因通路,这有利于发现基因之间的关联程度,途径,和疾病。在这项研究中,我们选择 在分析和KEGG通路富集分析。
2.2。PPI网络结构和预后分析中心的基因
通过构建蛋白质相互作用网络,蛋白质和蛋白质之间的关系可以可视化,可以推导出蛋白质和功能之间的相关性。它是通过字符串数据库(http://string-db.org),选择与组合得分大于0.5。Cytoscape软件用于可视化PPI网络,分子复杂性检测(MCODE)方法被用来屏幕PPI网络的模块度的截断值2,节点评分截止值为0.2, - - - - - -核心价值,和100年的最大深度。网络得分大于5筛选,分析了使用cytoHubba插件屏蔽中心基因与分数大于10。GEPIA (http://gepia.cancer-pku.cn/)是一个免费的在线可视化平台特定的基因表达水平差异分析肿瘤组织和正常组织。UALCAN (http://ualcan.path.uab.edu)是一种非常有效和方便的网站用于分析癌症数据。在这项研究中,进行生存分析中心基因使用这个网站来验证基因和疾病之间的相关性。为了使研究结果更加可信,评估中心癌症基因是非常著名的在线网站使用kaplan meier (https://kmplot.com/analysis/),可以用来评估信使rna的影响,microrna的存活率和蛋白质21类型的癌症和基因表达信息的影响。通过整合临床预后分析和生存的价值研究,可以发现和验证相关的分子标记。
3所示。结果与讨论
3.1。基因表达谱数据
本研究使用的数据从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/),包括各种高通量基因表达数据提交世界各地的研究机构和专家学者都是免费的。GSE116959 GPL17077平台是基于(安捷伦- 039494确定打印G3人类通用电气V2 039381 x60k微阵列)和由68个样本,包括11个正常肺组织和57 LUAD样本。GSE74706 GPL13497平台是基于(安捷伦- 026652整个人类基因组芯片4 x44k V2), 36个样本包括18岁患肿瘤肺组织和18肿瘤组织。GSE85841 GPL20115平台是基于人类CBC lncRNA(安捷伦- 067406 + mRNA微阵列V4.0),包含8 LUAD样品和8邻nontumor组织。数据选择在本研究中所有满足三个条件:(1)样本都来自人类的肺组织,(2)样本量≥16,和(3),它包含一个对照组和实验组。平台和一系列矩阵文件被下载为TXT文件,和数据信息如表所示1。
|
||||||||||||||||||||||||||||||||||||||||||
3.2。的识别度
三个数据集地理网站使用limma包(9差距分析);我们建立了小于0.05, 大于1的标准。它获得总共3051调节基因和3817个表达下调基因,如图1。重叠的调节基因的数量在三个LUAD数据集是67,如图2(一个),这三个数据集之间的重叠基因表达下调是277,如图2 (b)。
(一)
(b)
(c)
(一)
(b)
3.3。去分析度和KEGG通路富集分析
为了理解微分的生物功能基因LUAD,差异基因的去分析和KEGG通路分析的网站上进行了大卫,并解释了两个主要的基因功能和路径分析。的结果去分析表明,最初的15去调节基因和表达下调基因表中列出2(一个)和2 (b),分别。至于分子功能(MF),表达下调度发挥重要作用的蛋白质激酶抑制剂(:0004860)活动,整合素绑定(去:0005178)和离子通道绑定(去:0044325)。度的upregulation蛋白质异构化活动扮演了一个角色(去:0046982),DNA结合(去:0003677)和丝氨酸肽链内切酶活动(去:0004252)。生物功能(BP)而言,表达下调度明显富集在细胞基质粘附(去:0007160),积极的监管RNA聚合酶II启动子转录(去:0045944)和血管生成(去:0001525)。调节度特别丰富的肺血管发展(去:0060426),细胞粘附(去:0007155)和细胞外基质组织(去:0030198)。电池组件(CC)分析表明,表达下调度集中在囊泡(去:0031982),溶酶体(去:0005764)和转录因子复合物(去:0005667)。调节度主要是集中在细胞外空间(去:0005615),细胞外基质蛋白(去:0005578)和细胞外基质(去:0031012)。
|
(一)的调节差异基因的分析结果 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
(b)去分析微分基因表达下调的结果 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
根据KEGG通路分析,表3表明度主要集中在病毒的致癌效应(HSA05203),粘附血小板(HSA04510),调节肌动蛋白细胞骨架(HSA04810),营信号通路(HSA04024)和cGMP-PKG信号通路(HSA04022)。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.4。PPI网络建设和模块分析
字符串数据库用于构造PPI网络,然后,Cytoscape软件被用来可视化度的三个数据集。在Cytoscape MCODE插件用于进一步分析PPI网络,最后,三个模块得分大于5。PPI网络的建设涉及到269个节点和625个交互,如图3。MCODE筛选了三个模块包括140年共有38个节点和交互,如图4。10的344 PPI网络的差异表达基因。cytoHubba应用于这三个模块的时候,选择得分大于10的基因,这表明这些基因包括MCM4 CDC20, CDC25C, BIRC5, FOXM1, GTSE1, RFC4可能LUAD的发病机制中发挥重要作用。
(一)
(b)
(c)
3.5。基因表达水平及预后分析中心
根据GEPIA数据库,结果七个中心基因都是调节在LUAD(图5)。然后,UALCAN数据库用于预后分析中心的基因,和结果表明,MCM4的表达,CDC20, CDC25C, GTSE1显著降低LUAD患者的生存时间(图6)。最后,kaplan meier的存活曲线也被用来证明LUAD患者的存活率低表达组显著高于高表达组的相对于UALCAN数据库(图7)。它可以发现与获得的结果在图一致6。
4所示。讨论
尽管世界医疗水平已经大大提高,仍然没有完全有效的方法治疗肺腺癌。此外,由于其快速发展和在疾病的早期无明显症状,具有重要意义,研究肺腺癌相关的致病基因。生物信息学的快速发展,微阵列技术已越来越多地应用于研究诊断、治疗和预后的癌症(10]。
在这项研究中,三个LUAD基因表达数据集从GEO数据库下载。共有67个调节和277年下调差异基因筛选和用于后续分析。进一步理解这些度的生物功能,我们进行分析和KEGG通路分析这些差异基因。
分析表明,在BP,重要基因参与细胞粘附和细胞外基质的组织和骨骼系统的发展提高,和基因的不同高度参与神经系统的发展,血管生成,细胞基质粘附降低。现有文献表明,细胞粘附的reduceness是肿瘤转移的关键因素(11),这是符合我们要的结果。基因变异和CC结果表明,主要作用在细胞外空间的增加,细胞外区域,和细胞外基质蛋白类,不同的基因在细胞骨架,溶酶体,和小泡沫,扮演一个角色,细胞质基质的肿瘤实际调整所有方面的肿瘤细胞和癌症相关的间质细胞(12]。在曼氏金融方面,调节微分基因在DNA结合大大丰富,蛋白质异质二聚体活动,和生长因子结合,而转录因子基因表达下调微分明显丰富绑定,整合素结合,和离子通道绑定,胰岛素生长因子起着重要的作用在癌症的发生和发展13,14]。Heterodimerization是一个重要的机制,它的激活erbB受体高表达在很多癌症,特别是乳腺癌,卵巢癌,和非小细胞肺癌15),这也进一步证实了我们去分析的结果的准确性。
KEGG路径分析表明,差异表达基因在病毒致癌途径极大地丰富和粘附斑。致癌病毒复制选择细胞过程和破坏免疫识别,通过共享宿主细胞促进oncogeny目标和途径(16]。在众多微环境因素,影响肿瘤细胞的耐药性,细胞粘附到细胞外基质(ECM)已被确定为一个关键因素17]。
为了更好地理解这些度之间的关系和相互作用,我们用Cytoscape软件可视化的PPI网络DEG-encoded蛋白质和高七中心基因筛选,即MCM4, CDC20, CDC25C, BIRC5, FOXM1 GTSE1, RFC4。MCM4突变干扰正常的复制控制和影响有丝分裂阶段,进而影响DNA复制和导致DNA断裂。基因组不完整大大增加癌症易感性;例如,老鼠携带MCM4 Chaos3亚型等位基因最终患乳腺癌18]。BIRC5,也被称为生存素,是一个著名的癌症治疗的目标。通过寻找survivin-partner蛋白质相互作用破坏抑制剂和存活素为破坏抑制剂,据透露,一些抑制剂可以减少癌症生存素的表达情况,包括乳腺癌、非小细胞肺癌,胰腺癌19]。细胞分裂周期20个同系物,CDC20是细胞分裂后期的重要催化剂。Cdc20作品通过激活APC E3连接酶,干扰细胞周期调控的关键在中期到后期过渡。此外,损耗Cdc20也会导致有丝分裂停滞,导致细胞死亡(20.]。CDC20调节不仅在非小细胞肺癌,而且在其他恶性肿瘤,也与患者的预后相关(21]。研究表明MCM4、BIRC5 CDC20潜在肺癌司机基因,这些基因是放大在肺癌患者的基因组,而当他们的数量减少,癌症细胞的数量减少以及[22]。CDC25C是一个典型的双特异性磷酸酶调节CDK1脱磷酸作用和细胞周期蛋白的核条目B1 / CDK1复杂,这是一个关键机制调节细胞分裂的起始和扮演着一个重要的角色在细胞周期的控制23]。CDC25C在细胞周期的调控是受多种信号通路与肿瘤发生密切相关,肿瘤的发展。FOXM1,致癌forkhead家族的转录因子,表示通过组织损伤或氧化应激和促有丝分裂的刺激诱导的成熟细胞。FOXM1的异常表达已被证明的发展中起着非常重要的作用各种肿瘤细胞的扩散和周期(24]。研究表明,FOXM1存在于大多数人类癌症通过调节目标基因在转录水平的表达25]。GTSE1细胞是人类GTSE1 cycle-related蛋白质编码的基因,主要调节细胞周期G1 / S过渡。之前的研究表明,高表达的GTSE1与抵抗各种癌症有关,和nonexpression GTSE1可以显著促进NSCLC细胞凋亡后红外(26]。RFC4是C的基因家族的复制因子(RFC)。之前的研究表明,在各种恶性肿瘤、生物活性rfc扩散可能发挥重要作用,发展,入侵和转移的癌细胞,确认rfc可以用作有效的癌症的诊断和预后预测标记(27]。
5。结论
在这项研究中,七个中心发现了生物信息学基因。来验证这些基因是否与LUAD有关,我们使用了GEPIA数据库和UALCAN数据库验证和生存分析,分别。结果表明,所有这些基因调节与正常肺组织,MCM4 CDC20, CDC25C, BIRC5调节显著降低LUAD患者的生存时间。因此,我们相信,这些中心基因发挥关键作用在肿瘤的发生和发展,尤其是四个基因MCM4 CDC20, CDC25C, BIRC5,似乎是未来研究的一个重要基础LUAD的诊断和预后。
数据可用性
从大卫得到的数据(http://david.abcc.ncifcrf.gov/)和地理数据库(https://www.ncbi.nlm.nih.gov/geo/)。
的利益冲突
作者宣称没有利益冲突有关的出版。
作者的贡献
王Shuaiqun导致数据分析、方法和文章写作。徐小玲了调查,图施工,验证了同样Shuaiqun王。魏香港造成了监管和写文章的。所有作者的文章和批准提交的版本。
确认
这项研究得到了国家自然科学基金(61803257)和上海自然科学基金(18 zr1417200)。
引用
- p .迈克尔,“收回了:100年的肺癌,”呼吸系统药物,卷100,不。12日,第2084 - 2073页,2006年。视图:出版商的网站|谷歌学术搜索
- r . s . Herbst j . v . Heymach, s·m·利普曼“肺癌”新英格兰医学杂志》上,卷359,不。13日,1367 - 1380年,2008页。视图:出版商的网站|谷歌学术搜索
- t . v . Denisenko i n Budkevich, b . Zhivotovsky“细胞death-based肺腺癌的治疗,”细胞死亡和疾病,9卷,不。2,p。117年,2018年。视图:出版商的网站|谷歌学术搜索
- t . k . p, n . k .灰色,m·布鲁克”调制哺乳动物细胞质功能的转录后调控蛋白甲基化和乙酰化作用:调节的关键层等待着被发现?”生化社会事务,43卷,不。6,1285 - 1295年,2015页。视图:出版商的网站|谷歌学术搜索
- d . g .艾伯森,d . Pinkel。”在人类遗传疾病和癌症基因微阵列,”人类分子遗传学补充2卷。12日,R145-R152, 2003页。视图:出版商的网站|谷歌学术搜索
- 赵,z . j . Li Li y的歌,l . Si和x王,“识别关键基因、关键microrna和肺腺癌的关键转录因子,”胸疾病杂志,12卷,不。5,1917 - 1933年,2020页。视图:出版商的网站|谷歌学术搜索
- z, c, b . Kang g .高c·李和z,“GEPIA: web服务器对癌症和正常基因表达分析和交互式分析,“核酸的研究,45卷,不。W1, w98 - 102、2017页。视图:出版商的网站|谷歌学术搜索
- d . s . Chandrashekar b . Bashel s . a . h . Balasubramanya et al .,“UALCAN:门户为促进肿瘤组基因表达和生存分析,“瘤形成,19卷,不。8,649 - 658年,2017页。视图:出版商的网站|谷歌学术搜索
- 吴m·e·里奇Phipson, d . et al .,“Limma权力RNA-sequencing和微阵列研究微分表达式分析”核酸的研究,43卷,不。7 p . e47 2015。视图:出版商的网站|谷歌学术搜索
- 施p, t . Chidanguro z et al .,“识别候选生物标志物和通路与SCLC通过生物信息学分析,“分子医学报告,18卷,不。2、1538 - 1550年,2018页。视图:出版商的网站|谷歌学术搜索
- 大肠Gumuslu:电影,m . e . Gokbayrak o . Mutlu i . k . Celikyurt和g . Ulak”Exenatide改变基因表达的神经细胞粘附分子(NCAM)在细胞间的细胞粘附分子(ICAM)和血管细胞黏附分子(VCAM)在2型糖尿病模型小鼠海马,”医学科学监控22卷,第2669 - 2664页,2016年。视图:出版商的网站|谷歌学术搜索
- m·w·皮卡,j·k·乌,诉m·韦弗”细胞外基质调节癌症的标志。”EMBO报告,15卷,不。12日,第1253 - 1243页,2014年。视图:出版商的网站|谷歌学术搜索
- p .迈克尔,“胰岛素和胰岛素样生长因子在肿瘤信号,”自然评论癌症,8卷,不。12日,第928 - 915页,2008年。视图:出版商的网站|谷歌学术搜索
- j .杜邦a·皮埃尔·p·Froment, c .男人味儿,“胰岛素样生长因子轴在细胞周期进展,”激素和代谢研究,35卷,不。11 - 12,740 - 750年,2003页。视图:出版商的网站|谷歌学术搜索
- z . Wang“ErbB受体和癌症,”ErbB受体信号卷,1652分子生物学方法页,3-35施普林格,2017年。视图:出版商的网站|谷歌学术搜索
- n . a . Krump和j·你“病毒在人类肿瘤形成的分子机制,自然评论微生物学,16卷,不。11日,第698 - 684页,2018年。视图:出版商的网站|谷歌学术搜索
- 我勉强和n Cordes”,粘着斑信号,在癌症治疗抵抗。”在癌症生物学研讨会31卷,第75 - 65页,2015年。视图:出版商的网站|谷歌学术搜索
- l . Gineau c Cognet:卡拉et al .,“部分MCM4缺乏症患者的生长迟缓,肾上腺机能不全,缺和自然杀伤细胞,”《临床研究杂志》上,卷122,不。3、821 - 832年,2012页。视图:出版商的网站|谷歌学术搜索
- f·李,即Aljahdali x凌,“癌症疗法使用生存素BIRC5作为一个目标:在二十年后我们能做什么研究?”实验临床癌症研究杂志》上,38卷,不。1,p。368年,2019。视图:出版商的网站|谷歌学术搜索
- j·l . Wang, l . Wan周x, z . Wang和w·魏”针对Cdc20小说作为一个癌症治疗策略,”药理学和治疗卷,151年,第151 - 141页,2015年。视图:出版商的网站|谷歌学术搜索
- 加藤t、y Daigo m . Aragaki k .石川m .佐藤和m .个性”的过度CDC20预测原发性非小细胞肺癌患者预后不良,”肿瘤外科杂志》,卷106,不。4、423 - 430年,2012页。视图:出版商的网站|谷歌学术搜索
- j .咦,x, x, l . Wan j .董和r·王,“全基因组的变化综合分析驱动基因在非小细胞肺癌,”抗癌药物卷,29号1,10 - 18,2018页。视图:出版商的网站|谷歌学术搜索
- k . Liu m .郑陆r . et al .,“CDC25C的角色在细胞周期调控和临床癌症治疗:系统回顾,“癌细胞国际,20卷,不。1,p。213年,2020。视图:出版商的网站|谷歌学术搜索
- 问:香,g . Tan x江,k . Wu w . Tan和y Tan“抑制FOXM1转录活动通过SELEX生成的单链DNA适体,“科学报告,7卷,不。1,2017。视图:出版商的网站|谷歌学术搜索
- G.-B。廖,X.-Z。李,美国曾et al .,“主监管机构的监管FOXM1在癌症,”细胞通讯和信号传导,16卷,不。1,57页,2018年。视图:出版商的网站|谷歌学术搜索
- x Lei, l . Du, p . Zhang et al .,“击倒GTSE1增强辐射敏感度在非小细胞肺癌DNA损伤修复途径,”细胞和分子医学杂志》上,24卷,不。9日,第5167 - 5162页,2020年。视图:出版商的网站|谷歌学术搜索
- 李y s Gan l . Ren et al .,“多方面的调节和功能的复制因子C家庭在人类癌症,”美国癌症研究杂志》上,8卷,不。8,1343 - 1355年,2018页。视图:谷歌学术搜索
版权
版权©2021王Shuaiqun et al。这是一个开放分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。