肺腺癌(LUAD)是肺恶性肿瘤之一。然而,它的病理尚未完全了解。本研究的目的是确定中心与LUAD相关的基因的生物信息学方法。三个基因表达数据集包括GSE116959、GSE74706 GSE85841从基因表达综合(GEO)下载数据库被用于这项研究。相关的差异表达基因(度)LUAD筛选利用limma包。基因本体论(去)和KEGG度进行了分析通过大卫的网站。差异表达基因的蛋白质相互作用(PPI)吸引了字符串的网站,并为可视化结果导入Cytoscape。然后,分析了PPI网络使用MCODE,模块得分大于5使用cytoHubba被发现。最后,GEPIA数据库和UALCAN数据库被用来验证和分析中心的生存基因。我们确认67调节基因和277个表达下调基因从三个LUAD数据集。 The results of GO analysis showed that the downregulated genes were significantly enriched in matrix adhesion and angiogenesis and upregulated differential genes were significantly enriched in cell adhesion and vascular development. KEGG pathway analysis showed that the differential genes of LUAD were significantly enriched in viral carcinogenesis and adhesion spots. The PPI network of differentially expressed genes consists of 269 nodes and 625 interactions. In addition, three modules with scores greater than 5 and seven hub genes, namely, MCM4, BIRC5, CDC20, CDC25C, FOXM1, GTSE1, and RFC4, playing an important role in the PPI network were screened out. In this study, we obtained the hub genes and pathways related to LUAD, revealing the molecular mechanism and pathogenesis of LUAD, which is helpful for the early detection of LUAD and provides a new idea for the treatment of LUAD.
肺癌是一种恶性肿瘤,目前为止没有发现有效的治疗。腺癌是最常见的组织学亚型,占大约一半的肺癌(
在这项研究中,三个肺腺癌从地理数据集被下载。差异表达基因的获得是通过比较肺腺癌样本和正常样本之间的基因表达。然后,去和KEGG信号通路富集分析被用来进行功能注释和信号通路分析度。最后,发生和发展的机理与LUAD研究在分子水平上。基因表达水平验证了通过GEPIA [
摘要limma包被用来获得差异表达基因。数据被分为正常组和病变组和差异分析是提取不同的差异基因进行三个数据集,分别。标准筛选差异表达基因
通过构建蛋白质相互作用网络,蛋白质和蛋白质之间的关系可以可视化,可以推导出蛋白质和功能之间的相关性。它是通过字符串数据库(
本研究使用的数据从GEO数据库(
LUAD数据集的详细信息。
| 参考 | 组织 | 地理 | 平台 | 正常的 | 肿瘤 |
|---|---|---|---|---|---|
| Rezzonico et al。 | LUAD | GSE116959 | GPL17077 | 11 | 57 |
| Marwitz et al。 | LUAD | GSE74706 | GPL13497 | 18 | 18 |
| 他et al。 | LUAD | GSE85841 | GPL20115 | 8 | 8 |
三个数据集地理网站使用limma包(
火山的地图差异表达基因数据集:(一)GSE116959;(b) GSE74706;(c) GSE85841。
基因的维恩图GSE116959、GSE74706 GSE85841数据集:(a)之间的重叠的调节基因三个数据集;(b)三个数据集之间的重叠基因表达下调。
为了理解微分的生物功能基因LUAD,差异基因的去分析和KEGG通路分析的网站上进行了大卫,并解释了两个主要的基因功能和路径分析。的结果去分析表明,最初的15去调节基因和表达下调基因表中列出
的调节差异基因的分析结果
| 类别 | 术语 | 数 | % |
|
罗斯福 |
|---|---|---|---|---|---|
| GOTERM_CC_DIRECT | 去:0005615 ~细胞外空间 | 39 | 14.82889734 |
|
0.001099172 |
| GOTERM_CC_DIRECT | 去:0005578 ~蛋白质的细胞外基质 | 17 | 6.463878327 |
|
|
| GOTERM_CC_DIRECT | 去:0031012 ~细胞外基质 | 16 | 6.08365019 |
|
0.001099172 |
| GOTERM_MF_DIRECT | 去:0046982 ~蛋白质heterodimerization活动 | 10 | 15.38461538 |
|
0.002144305 |
| GOTERM_CC_DIRECT | 去:0005576 ~细胞外区域 | 38 | 14.4486692 | 0.001389295 | 0.034176669 |
| GOTERM_BP_DIRECT | 去:0060426 ~肺脉管系统的发展 | 3 | 1.140684411 | 0.002890084 | 0.264603216 |
| GOTERM_BP_DIRECT | 去:0007155 ~细胞粘附 | 15 | 5.703422053 | 0.006047621 | 0.383326151 |
| GOTERM_MF_DIRECT | 去:0003677 ~ DNA结合 | 12 | 18.46153846 | 0.017676955 | 1 |
| GOTERM_BP_DIRECT | 去:0030198 ~组织细胞外基质 | 8 | 3.041825095 | 0.021602865 | 0.726561651 |
| GOTERM_CC_DIRECT | 去:0005581 ~胶原三聚物 | 5 | 1.901140684 | 0.038323481 | 0.336699153 |
| GOTERM_BP_DIRECT | 去:0001501 ~骨骼系统的发展 | 6 | 2.281368821 | 0.045594478 | 0.963329484 |
| GOTERM_MF_DIRECT | 去:0004252 ~ serine-type肽链内切酶的活动 | 4 | 6.153846154 | 0.050324984 | 1 |
| GOTERM_MF_DIRECT | 去:0004222 ~ metalloendopeptidase活动 | 3 | 4.615384615 | 0.052417683 | 1 |
| GOTERM_MF_DIRECT | 去:0019838 ~生长因子绑定 | 3 | 1.140684411 | 0.053114668 | 1 |
| GOTERM_BP_DIRECT | 去:0048845 ~静脉血管形态发生 | 2 | 0.760456274 | 0.082095344 | 0.9933695 |
去分析微分基因表达下调的结果
| 类别 | 术语 | 数 | % |
|
罗斯福 |
|---|---|---|---|---|---|
| GOTERM_BP_DIRECT | 去:0007160 ~ cell-matrix附着力 | 8 | 3.041825095 |
|
0.102142936 |
| GOTERM_CC_DIRECT | 去:0031982 ~泡 | 8 | 3.041825095 | 0.001990645 | 0.044518052 |
| GOTERM_BP_DIRECT | 去:0045944 ~积极监管RNA聚合酶II启动子的转录 | 26 | 9.885931559 | 0.003278681 | 0.284382424 |
| GOTERM_MF_DIRECT | 去:0004860 ~蛋白激酶抑制剂的活动 | 5 | 1.901140684 | 0.005702224 | 0.547413482 |
| GOTERM_CC_DIRECT | 去:0005764 ~溶酶体 | 9 | 3.422053232 | 0.013045455 | 0.168904314 |
| GOTERM_BP_DIRECT | 去:0001525 ~血管生成 | 9 | 3.422053232 | 0.01406595 | 0.56315124 |
| GOTERM_MF_DIRECT | 去:0005178 ~整合素绑定 | 6 | 2.281368821 | 0.015197451 | 0.669135708 |
| GOTERM_CC_DIRECT | 去:0005667 ~转录因子复杂 | 8 | 3.041825095 | 0.017573444 | 0.216153357 |
| GOTERM_MF_DIRECT | 去:0044325 ~离子通道绑定 | 6 | 2.281368821 | 0.020239455 | 0.747302944 |
| GOTERM_CC_DIRECT | 去:0005911 ~信息结 | 7 | 2.661596958 | 0.031802418 | 0.320786082 |
| GOTERM_CC_DIRECT | 去:0005856 ~细胞骨架 | 11 | 4.182509506 | 0.033419216 | 0.320786082 |
| GOTERM_MF_DIRECT | 去:0008134 ~转录因子绑定 | 9 | 3.422053232 | 0.04387505 | 1 |
| GOTERM_BP_DIRECT | 去:0007399 ~神经系统的发展 | 9 | 3.422053232 | 0.05231756 | 0.9933695 |
| GOTERM_BP_DIRECT | 去:0071356 ~细胞对肿瘤坏死因子的反应 | 5 | 1.90114068441064 | 0.071273931 | 0.993369499698613 |
| GOTERM_MF_DIRECT | 去:0043014 ~ alpha-tubulin绑定 | 3 | 1.140684411 | 0.056693325 | 1 |
根据KEGG通路分析,表
KEGG途径差异基因的分析。
| 术语 | 数 |
|
罗斯福 |
|---|---|---|---|
| hsa05203:病毒致癌作用 | 8 |
|
|
| hsa00982:药物metabolism-cytochrome P450 | 7 |
|
0.080541591 |
| hsa05133:百日咳 | 7 | 0.001442889 | 0.089940108 |
| hsa04024:阵营信号通路 | 10 | 0.005406893 | 0.252772253 |
| hsa04022: cGMP-PKG信号通路 | 8 | 0.01563192 | 0.354612366 |
| hsa04510:粘着斑 | 9 | 0.020671678 | 0.354612366 |
| hsa04810:调节肌动蛋白细胞骨架 | 9 | 0.02290057 | 0.354612366 |
| hsa04921:催产素信号通路 | 7 | 0.037911973 | 0.393863279 |
| hsa04015: Rap1信号通路 | 8 | 0.059226004 | 0.517534094 |
| hsa04110:细胞周期 | 3 | 0.073872691 | 0.783050528 |
字符串数据库用于构造PPI网络,然后,Cytoscape软件被用来可视化度的三个数据集。在Cytoscape MCODE插件用于进一步分析PPI网络,最后,三个模块得分大于5。PPI网络的建设涉及到269个节点和625个交互,如图
度的PPI网络图。红色是调节基因,绿色是表达下调的基因。
MCODE筛选网络与分数大于5:(a)得分:12日(b)得分:7.714,和(c)得分:5.529。红色节点代表调节微分基因,和绿色的节点表示微分基因表达下调。
根据GEPIA数据库,结果七个中心基因都是调节在LUAD(图
LUAD之间中心基因的表达水平与正常肺组织GEPIA数据库。
生存分析中心的基因。红线和蓝线表示生存分析基因的高表达和低表达LUAD患者,分别。
7的预后信息中心的基因。
尽管世界医疗水平已经大大提高,仍然没有完全有效的方法治疗肺腺癌。此外,由于其快速发展和在疾病的早期无明显症状,具有重要意义,研究肺腺癌相关的致病基因。生物信息学的快速发展,微阵列技术已越来越多地应用于研究诊断、治疗和预后的癌症(
在这项研究中,三个LUAD基因表达数据集从GEO数据库下载。共有67个调节和277年下调差异基因筛选和用于后续分析。进一步理解这些度的生物功能,我们进行分析和KEGG通路分析这些差异基因。
分析表明,在BP,重要基因参与细胞粘附和细胞外基质的组织和骨骼系统的发展提高,和基因的不同高度参与神经系统的发展,血管生成,细胞基质粘附降低。现有文献表明,细胞粘附的reduceness是肿瘤转移的关键因素(
KEGG路径分析表明,差异表达基因在病毒致癌途径极大地丰富和粘附斑。致癌病毒复制选择细胞过程和破坏免疫识别,通过共享宿主细胞促进oncogeny目标和途径(
为了更好地理解这些度之间的关系和相互作用,我们用Cytoscape软件可视化的PPI网络DEG-encoded蛋白质和高七中心基因筛选,即MCM4, CDC20, CDC25C, BIRC5, FOXM1 GTSE1, RFC4。MCM4突变干扰正常的复制控制和影响有丝分裂阶段,进而影响DNA复制和导致DNA断裂。基因组不完整大大增加癌症易感性;例如,老鼠携带MCM4 Chaos3亚型等位基因最终患乳腺癌
在这项研究中,七个中心发现了生物信息学基因。来验证这些基因是否与LUAD有关,我们使用了GEPIA数据库和UALCAN数据库验证和生存分析,分别。结果表明,所有这些基因调节与正常肺组织,MCM4 CDC20, CDC25C, BIRC5调节显著降低LUAD患者的生存时间。因此,我们相信,这些中心基因发挥关键作用在肿瘤的发生和发展,尤其是四个基因MCM4 CDC20, CDC25C, BIRC5,似乎是未来研究的一个重要基础LUAD的诊断和预后。
从大卫得到的数据(
作者宣称没有利益冲突有关的出版。
王Shuaiqun导致数据分析、方法和文章写作。徐小玲了调查,图施工,验证了同样Shuaiqun王。魏香港造成了监管和写文章的。所有作者的文章和批准提交的版本。
这项研究得到了国家自然科学基金(61803257)和上海自然科学基金(18 zr1417200)。