研究文章|开放获取
探月沈,Chenlu他Haimiao Chen Lishun肖,Yingliang金,黄水平, ”与肺腺癌的生存相关的潜在基因被甲基化识别”,计算和数学方法在医学, 卷。2020年, 文章的ID7103412, 13 页面, 2020年。 https://doi.org/10.1155/2020/7103412
与肺腺癌的生存相关的潜在基因被甲基化识别
文摘
背景。肺腺癌(LUAD)是最常见的病理类型的肺癌。本研究的目的是寻找LUAD的预后相关基因甲基化基于线性混合模型(LMM)。方法。基因表达、甲基化和TCGA LUAD患者的生存数据下载的数据库。基于LMM模型,吉玛算法被用来屏幕LUAD生存预测基因相关。Cox模型被用来进一步筛选预测基因,然后,蛋白质相互作用(PPI)网络构造。通过软件插件Cytoscape MCODE 3.8.0,最密切相关的基因在PPI网络模块选择进行深入的生物功能分析,以进一步探讨基因之间的交互和相关性。结果。我们筛选了97个预测基因的18834个基因和消除与肺鳞状细胞癌相关基因从先前的研究中,留下了96个基因。MCODE和用于kaplan - meier曲线分析最后确定两个基因ASB16和NEDD4LUAD的预后相关。结论。新发现的与预后相关的两个基因LUAD可能病人的治疗提供依据。
1。介绍
全球癌症数据显示,肺癌的发病率和死亡率再次榜首1]。每年大约有520000新发病例报告男性和267000名女性。近61%的肺癌是肺腺癌的病理亚型(LUAD)和肺癌对人类健康构成严重的威胁(2]。病理上,不同类型的癌细胞来自不同网站的肺。LUAD分泌粘液的指的是来自小支气管黏膜上皮细胞,所以大部分腺癌位于外围部分球面质量接近胸膜肺。与鳞状细胞肺癌,LUAD更可能发生在妇女和不吸烟者(3]。然而,吸烟是肺癌的一个主要环境风险因素(4]。从LUAD高死亡率的原因包括缺乏敏感和特定的早期生物标志物,高耐药的可能性和转移(5]。近年来,一些预后相关基因LUAD已经找到,它提供了一个有效的早期分子诊断标准LUAD和极大地促进患者的治疗。肺癌的生存率逐渐呈上升趋势。在中国,5年相对存活率约为40.5%。从十年前的10%。在这项研究中,新的预测基因筛选模型和生物信息学分析是用来确定司机与LUAD生存相关的基因,并提供一个有效的标准LUAD的早期分子诊断。
传统治疗LUAD通常包括手术、化疗、放疗、靶向治疗(6]。在过去的几年里,研究LUAD都集中在分子靶向治疗,控制LUAD细胞的转移,并确定目标基因(7)受LUAD干细胞。在以前的研究中,SNP主要是用来预测基因表达,它有一个良好的性能在预测基因的表达。之前的研究表明,基因与LUAD生存等都集中在地区5 p15.33 15问。
甲基化是用来预测基因表达为了获得methylation-driven基因与LUAD预后有关。DNA甲基化是表观遗传修饰的核心元素之一,一个重要的信号转导调节基因组的工具功能(4]。此外,甲基化状态的改变是导致肿瘤生成的一个重要因素,包括整个基因组甲基化水平的降低和异常增加CpG岛当地的甲基化水平,导致基因组的不稳定性和nonexpression肿瘤抑制基因。因此,甲基化可以提供癌症的早期诊断和预后的一个重要基础,为进一步临床应用提供一个新的想法。TCGA癌症和肿瘤基因图谱项目于2005年由美国发起的。这个项目的目的是研究癌症的基因组变化通过基因组分析技术。大规模基因组测序已经完成,包括30多种癌症。TCGA奠定了基础的分类和深入研究的分子发病机制LUAD [8]。
搜索与LUAD的预后相关基因,我们使用一个开放的癌症基因组图谱数据库癌症基因组图谱TCGA()获得遗传和表观遗传数据LUAD [9]。LMM是一个多基因模型,因为它假定所有的突变有一个非零对基因表达的影响。我们使用了有效的吉玛算法以适应LMM使用有限的最大似然方法。由甲基化基因表达值预测,预测基因(定义为基因的筛选 )(10]。COX模型被用来进一步筛选预测基因获得LUAD预后相关基因,确定甲基化动力和LUAD之间的关系。蛋白质相互作用网络分析在理解这些基因甲基化的角色LUAD的开发和发展。核心基因与最高的分数最高的集群被MCODE提取Cytoscape软件。去富集分析核心基因和kaplan meier曲线分析。
2。方法和材料
2.1。数据处理和分析
基因表达、甲基化和临床数据的LUAD获得UCSC齐娜(https://xenabrowser.net/)。样品浸泡在formalin-fixed石蜡包埋组织被排除在外。分位数转换是由使用qqnorm函数R中的软件。原始的基因表达数据包括20530个基因和515个样本,和甲基化数据来自458个样本。首先,对基因表达数据进行质量控制,和超过50%的零表达式被淘汰。DNA甲基化水平在一组500 kb的基因被过滤结合基因表达水平与DNA甲基化水平。结合基因表达和甲基化数据根据样本的名字,18834个基因和450个样本。
总共有450个样本包含在我们的分析,和临床变量包括年龄、性别、吸烟和年度体积。详情,LUAD患者基本临床资料总结表1。取而代之的是中间缺失的值。
|
||||||||||||||||||||||||||
2.2。两步识别基因与LUAD的预后有关
2.2.1。使用LMM预测基因被确定
我们把数据转换为线性混合模型。让我们先假设所有的标记都是归一化意味着0和方差1。让是一个 - - - - - -向量的表达水平th基因检测个人,是 DNA甲基化的矩阵。简单的线性模型,与DNA甲基化是基因表达水平 ,在哪里是 - - - - - -矢量效应值对应th基因。广场相关系数( )预测的值是用来测量性能。预测的基因表达值可以看作是DNA甲基化的潜在影响。的 基因甲基化被认为是驱动的,这些基因保留进行进一步分析。
2.2.2。Cox回归分析确定了预后的基因
Cox回归模型被用来进一步分析预测基因筛选的线性混合模型,探讨LUAD methylation-driven基因和预后之间的关系(36]。它仍然是假设所有的标记可能参与LUAD的发展,和每个基因的效应大小应该遵循正态分布:
在哪里是任意的基线风险函数对应的参考电平,然后呢是基因的效应大小 ,和 是 - - - - - -维向量随机效应大小的DNA甲基化;是DNA甲基化的差异。我们使用了错误的发现方法来调整值结果( )。
2.3。蛋白质相互作用网络和模块分析
为了我的核心监管基因,我们使用字符串构建蛋白质相互作用网络数据库(版本11.0)。我们还为这些基因信号通路实现通过Cytoscape软件(版本3.8.0)通过CluePedia和可视化。Cytoscape MCODE插件的软件,选择最紧密相连的模块构造PPI网络的深入的生物功能分析(37]。中包含的基因模块是核心基因。
2.4。kaplan meier曲线分析
kaplan meier曲线分析用于分析核心基因和生存之间的关系。我们使用原来的表达基因和甲基化的预测表达式值的值来计算其对生存的影响,分别。预后基因筛选 统计上的显著差异。
2.5。基因集富集分析(GSEA)
为了分析预后基因的生物学特性和他们的角色在LUAD的发展,预后基因选择通过分析kaplan - meier曲线分析基因集富集分析。GSEA包、clusterProfiler包和GSEA函数用于R软件获取浓缩KEGG途径,途径的结果,分别。排列的数量设置为1000,a 被认为是具有统计学意义。
3所示。结果
3.1。先前的研究的描述
在2019年10月之前,我们全基因组关联目录搜索“肺癌、肺腺癌”作为搜索词和文献进行了系统搜索在EBI初步理解LUAD致病基因的先前的研究成果。总共有26篇文章包括,这些研究主要是在欧洲进行的人口。26日文章的细节我们包括如表所示2和图1,从2008年到2019年出版。总共有314个基因报道。与LUAD生存相关的基因主要位于5 p15.33, 6 . 3, 15 q25, 17 q24.3。通过分析去KEGG通路相关的基因在GWAS LUAD,结果表明,基因富集的分子功能主要是相同的蛋白结合,和生物过程主要是积极的从RNA聚合酶II启动子的转录调节,和组件主要包括膜的有机组成部分。总共有22个在KEGG通路。几篇文章证实基因TP63,叔,CLPTM1LLUAD的预后有关。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
:初始样本大小;流行:人口的种族。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
(一)
(b)
(c)
3.2。线性混合模型和Cox回归模型的结果
放置18834个基因为线性混合模型后,我们测量他们的性能通过使用预测平方相关系数( )。结果表明,有18495个基因大于或等于0.5。表3显示十个基因具有更高的信息价值。总共有114个预后基因筛选通过Cox回归模型来消除nonprotein-coding基因。最后,得到了97个预后基因。搜索EBI之后,我们排除在外DTNBP1与肺鳞状细胞癌在先前的研究[38]。此外,我们已经确认了与吸烟有关的基因,ASB18,这可能会进一步影响肺癌的发展(39]。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.3。蛋白质相互作用网络和选择的核心基因
在这项研究中,蛋白质相互作用网络使用字符串是由数据库(版本11.0)。我们把96个基因为字符串,该物种选择智人。PPI评分参数设置为0.400(表示温和的信心)。网络包含96个节点and37边缘,和我们无关的隐藏节点的网络。值得注意的是,有一种强烈的基因之间的联系ASB16,ASB18,MYLIP,NEDD4,ZDHHC2。结果如图2。
基因之间的联系是通过CluePedia可视化的,如图3。通过MCODE插件Cytoscape 3.8.0软件(设置参数 , , ,和 ),最密切联系模块选择了PPI网络的深入的生物功能分析。发现的基因包含在集群中是最紧凑的模块NEDD4,ASB18,MYLIP,ASB16集群中,得分最高的节点ASB16。
3.4。kaplan meier曲线分析结果
我们使用kaplan meier曲线来描述生存分析的四个选择基因,分别分析了原始基因表达数据和预测的甲基化的基因表达数据。结果表明,基因的ASB16和NEDD4有一个明确的效果( )的预后LUAD不管原始值或预测价值,而基因的ASB18和MYLIP没有显著的影响。具体结果见图4。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
3.5。GSEA结果
GSEA分析显示的主要职能ASB16基因是共价染色质的修改、组蛋白甲基化和细胞外的运输;的主要浓缩味觉转导通路,DNA复制,核苷酸切除修复。的主要职能NEDD4multiorganism过程的基因是积极的调节,调节细胞骨架组织,和二价无机阳离子体内平衡;主要浓缩通路是MAPK信号通路和癌症通路。根据最重要的丰富信号通路NES如表所示4;部分浓缩结果如图5。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
NES:规范化浓缩分数;罗斯福:错误发现率。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
(一)
(b)
(c)
(d)
4所示。讨论
肺癌是恶性肿瘤发病率和死亡率高,不仅很难确定疾病的原因,但也有一个可怜的存活率。LUAD肺癌是最常见的病理分类,因此具有重要的研究价值提高LUAD的存活率。发现与肺癌相关的基因和LUAD生存主要位于6号染色体上。这些基因的富集分析表明分子功能主要是选择性和共价相互作用相同的蛋白质或蛋白质,和生物过程主要是一个激活的过程或增加转录频率,速度,或程度的RNA聚合酶II启动子。组件组成主要包括膜的有机组成部分。
近年来,研究患者的存活率LUAD大多集中在预测预后相关的基因,免疫系统的操作治疗LUAD [6),吸烟和LUAD的发生的研究,以及利用SNP预测LUAD的预后。本研究的目的是使用新的模型筛选与LUAD预后的基因相关。resulrs表明这两个基因与预后有关LUAD和预测基因的选择由线性混合模型和Cox回归模型。由于太多的筛选基因,有过度的分析信号通路的生物功能分析。因此,我们使用MCODE插件连接许多基因与基因提取,然后单独的生物学相关分析。基因NEDD4在多个通路也丰富。先前的研究已经发现,相关的位点LUAD大多位于5号染色体6、15和17。在这项研究中,基因ASB16(17 q21.31)NEDD4(15 q21.3)。
编码的蛋白质,ASB16基因蛋白家族的成员包含soc的包装盒(ASB)和锚的重复序列的蛋白质。它们包含锚定蛋白重复序列和soc箱领域。锚蛋白重复序列是一种广泛存在于生物体蛋白质序列的尸体。
的NEDD4基因是一个创始成员的HECT泛素连接酶NEDD4家庭,扮演一个角色在protein-degrading泛素蛋白酶体系统。根据一项新的研究,ubiquitin-proteasome系统的重要作用也充分利用之后,可以代谢毒素,如垃圾,脂肪,和肿瘤细胞;人类的身体;和代谢能量可以刺激细胞繁殖的self-metabolism为了完成人体修复功能。
在这项研究中,我们发现两个预后与LUAD生存相关的基因,它提供了一个依据改善LUAD的存活率。虽然基因ASB18还未确定LUAD与预后有关,它已被证明是与吸烟有关。LUAD吸烟是一个环境风险因素,可以进一步研究。
5。结论
我们的研究发现多个基因,可能与肺腺癌的生存有关,特别是两个新基因(ASB16,NEDD4)),肺腺癌的预后提供依据,还需要进一步的研究来证实我们的发现。
数据可用性
数据分析在当前的研究中获得UCSC齐娜(https://xenabrowser.net/)。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
z设计研究中,进行了统计分析,解释结果,并写了初稿的手稿。CH和HC导致了数据分析。LX、YJ和SH修订。所有作者阅读和批准了最终版本的手稿。
确认
作者承认TCGA的贡献研究网络公共可用性的癌症数据集用于我们的纸。本研究为研究基金资助从徐州科技项目(KC19017)。
引用
- f·布雷,j . Ferlay Soerjomataram, r·l·西格尔,l·a·托瑞和a . Jemal”2018年全球癌症统计数据:GLOBOCAN估计36癌症的发病率和死亡率全球185个国家,“CA:临床医生的癌症杂志》上,卷68,不。6,394 - 424年,2018页。视图:出版商的网站|谷歌学术搜索
- y Yu和x田”,与肺腺癌的预后相关的基因分析基于地理和TCGA数据库,”医学,卷99,不。19日,e20183条,2020年。视图:出版商的网站|谷歌学术搜索
- m·迪亚斯r . Linhas s Campainha Conde,和a·巴罗佐”不吸烟者肺癌——有什么区别?”Acta Oncologica卷,56号7,931 - 935年,2017页。视图:出版商的网站|谷歌学术搜索
- 朱j .戴j . Lv m . et al .,“风险识别位点和多基因对肺癌风险评分:中国人口大规模的前瞻性队列研究,“《柳叶刀》杂志上呼吸医学,7卷,不。10日,881 - 891年,2019页。视图:出版商的网站|谷歌学术搜索
- 郭t、h·马和y周,“微阵列数据的生物信息学分析来识别候选人肺腺癌的生物标记物,”PeerJe7313条,卷。7日,2019年。视图:出版商的网站|谷歌学术搜索
- c罗x l . Wang, c . Cheng阿莫斯,g . Cai和f·肖,“肺腺癌预后的基因免疫签名,“癌症免疫学、免疫疗法,卷69,不。9日,第1890 - 1881页,2020年。视图:出版商的网站|谷歌学术搜索
- 廖y, y,黄c . m . Cheng和x的粉丝,“加权基因coexpression网络分析的功能,控制癌症干细胞显示肺腺癌的预后标志物,”遗传学前沿p . 311,卷。11日,2020年。视图:出版商的网站|谷歌学术搜索
- 刘董y, y, h .呗,娇,“系统评估的临床病理的预后意义为肺腺癌组织中细胞因子表达式基于TCGA综合分析的数据,”科学报告,9卷,不。1,p。6301年,2019。视图:出版商的网站|谷歌学术搜索
- y辽、h·肖,m . Cheng和x的粉丝,“生物信息学分析揭示了生物标志物与肺鳞状细胞癌,癌症干细胞特点”遗传学前沿p . 427,卷。11日,2020年。视图:出版商的网站|谷歌学术搜索
- 黄曾p . x,周,美国“预测基因表达与cis-SNPs使用混合模型和正则化方法,”BMC基因组学,18卷,不。1,p。368年,2017。视图:出版商的网站|谷歌学术搜索
- c·阿莫斯,吴x p·布罗德里克et al .,“全基因组关联标记snp的扫描识别为肺癌易感性位点15 q25.1,”自然遗传学,40卷,不。5,616 - 622年,2008页。视图:出版商的网站|谷歌学术搜索
- r . j .挂j·d·麦凯诉Gaborieau et al .,”一个肺癌易感性位点映射到烟碱乙酰胆碱受体亚基基因q25 15日,“自然,卷452,不。7187年,第637 - 633页,2008年。视图:出版商的网站|谷歌学术搜索
- p, h . g .维基·d·王et al .,“家族性聚集的公共子序列变异抓起- 25.1在肺癌,15日”美国国家癌症研究所杂志》上,卷100,不。18日,第1330 - 1326页,2008年。视图:出版商的网站|谷歌学术搜索
- y . Wang·布罗德里克·e·韦伯et al .,“常见的5 p15.33和6 p21.33变异影响肺癌的风险,”自然遗传学,40卷,不。12日,第1409 - 1407页,2008年。视图:出版商的网站|谷歌学术搜索
- j·d·麦凯r . j .挂诉Gaborieau et al .,“肺癌易感性位点5 p15.33,”自然遗传学,40卷,不。12日,第1406 - 1404页,2008年。视图:出版商的网站|谷歌学术搜索
- j·p·布罗德里克,y . Wang Vijayakrishnan et al .,“破解常见遗传变异的影响肺癌风险:全基因组关联研究”癌症研究,卷69,不。16,6633 - 6641年,2009页。视图:出版商的网站|谷歌学术搜索
- m . t .蓝迪n . Chatterjee于克俊et al .,“全基因组关联研究肺癌的识别染色体区域5 p15与腺癌的风险有关,”美国人类遗传学杂志》上,卷85,不。5,679 - 691年,2009页。视图:出版商的网站|谷歌学术搜索
- c . c . y . Li许凤,y你们et al .,“基因变异和从不吸烟者患肺癌的风险:一个全基因组关联研究”柳叶刀肿瘤学,11卷,不。4、321 - 330年,2010页。视图:出版商的网站|谷歌学术搜索
- c . a .融合,问:局域网,y . c .香港et al .,“5 p15.33轨迹与肺腺癌的风险有关,从不吸烟女性在亚洲,“公共科学图书馆遗传学》第六卷,没有。8 p . e1001051 2010。视图:出版商的网站|谷歌学术搜索
- d .杨爱瑾m . Kubo说a高桥et al .,“TP63变化与肺腺癌易感性在日本和韩国的人口,”自然遗传学,42卷,不。10日,893 - 896年,2010页。视图:出版商的网站|谷歌学术搜索
- j·k·A·Yoon j . h .公园汉et al .,“全基因组关联研究揭示了对非小细胞肺癌易感性变异在朝鲜人口,”人类分子遗传学,19卷,不。24日,第4954 - 4948页,2010年。视图:出版商的网站|谷歌学术搜索
- y z, c . Wu Shi et al .,“全基因组关联研究确定了两个新的肺癌易感性位点在汉族13 q12.12 22 q12.2”自然遗传学,43卷,不。8,792 - 796年,2011页。视图:出版商的网站|谷歌学术搜索
- 李·m·j·安·h·h·获胜,j . et al .,”18 p11.22轨迹与从不吸烟者非小细胞肺癌易感性有关韩国人口,”人类遗传学,卷131,不。3、365 - 372年,2012页。视图:出版商的网站|谷歌学术搜索
- k . Shiraishi h . Kunitoh y Daigo et al .,“全基因组关联研究确定了两个新的肺腺癌的易感性位点日本人口,”自然遗传学,44卷,不。8,900 - 903年,2012页。视图:出版商的网站|谷歌学术搜索
- m . n . Timofeeva r . j .挂t Rafnar et al .,“常见的遗传变异对肺癌的影响风险:荟萃分析14 900例和29 485控制,”人类分子遗传学,21卷,不。22日,第4995 - 4980页,2012年。视图:出版商的网站|谷歌学术搜索
- 问:局域网,c . a .融合,k .松尾et al .,“全基因组关联分析确定新的肺癌易感性位点,从不吸烟的妇女在亚洲,“自然遗传学,44卷,不。12日,第1335 - 1330页,2012年。视图:出版商的网站|谷歌学术搜索
- m·楚r·张y赵et al .,“全基因组基因基因交互分析确定一个上位基因对肺癌易感性的汉族人,”致癌作用,35卷,不。3、572 - 577年,2014页。视图:出版商的网站|谷歌学术搜索
- r·张m .楚y赵et al .,“全基因组基因-环境相互作用分析吸烟和肺癌易感性,”致癌作用,35卷,不。7,1528 - 1535年,2014页。视图:出版商的网站|谷歌学术搜索
- j·d·麦凯y . Wang t Rafnar et al .,“罕见变异的巨大影响BRCA2和CHEK2影响肺癌的风险,”自然遗传学,46卷,不。7,736 - 741年,2014页。视图:出版商的网站|谷歌学术搜索
- 唐,y, y王et al .,“全基因组关联研究在早期非小细胞肺癌的生存,”《肿瘤外科,22卷,不。2、630 - 635年,2015页。视图:出版商的网站|谷歌学术搜索
- m·k·a·扎内蒂z . Wang奥尔德里奇et al .,“全基因组关联研究证实肺癌易感性位点染色体5 p15 15 q25在一个非裔美国人的人口,”肺癌卷。98年,33-42,2016页。视图:出版商的网站|谷歌学术搜索
- k . Shiraishi y Okada, a高桥et al .,”协会HLA II类和其他位点的变化对EGFR-mutated肺腺癌,”自然通讯,7卷,不。1,2016。视图:出版商的网站|谷歌学术搜索
- SpiroMeta财团,j·d·麦凯,r . j . et al .,“大规模关联分析确定新的肺癌易感性位点和异质性在组织学亚型遗传易感性,”自然遗传学卷,49号7,1126 - 1132年,2017页。视图:出版商的网站|谷歌学术搜索
- j . Byun a·g·施瓦茨c Lusk et al .,“全基因组关联研究家族性肺癌,”致癌作用,39卷,不。9日,第1140 - 1135页,2018年。视图:出版商的网站|谷歌学术搜索
- x, y宝仕,m . t .蓝迪et al .,“识别易感性通路作用的染色体15 q25.1修改肺癌风险,”自然通讯,9卷,不。1,p。3221年,2018。视图:出版商的网站|谷歌学术搜索
- r·李黄懿慧阴,j·金et al .,“综合分析的DNA methylation-driven基因使用MethylMix肺鳞状细胞癌的预后,”国际医学科学杂志》上,17卷,不。6,773 - 786年,2020页。视图:出版商的网站|谷歌学术搜索
- 杨董,w .男性,美国,美国,“识别基于生物信息学分析和人类的肺腺癌生物标记样本,”肿瘤的报道,43卷,不。5,1437 - 1450年,2020页。视图:出版商的网站|谷歌学术搜索
- s·j·l·m·帕尔多w .问:Li黄et al .,“多角化细胞的全基因组关联研究癌症,”《公共科学图书馆•综合》,12卷,不。1,文章e0169873, 2017。视图:出版商的网站|谷歌学术搜索
- 23 andme研究小组、打猎总精神病学、m .刘et al .,“关联研究的120万人产生新的见解的遗传病因烟草和酒精的使用,“自然遗传学,51卷,不。2、237 - 244年,2019页。视图:出版商的网站|谷歌学术搜索
版权
版权©2020年探月沈等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。