文摘
背景。长非编码rna (lncRNAs)可以作为竞争内源性rna(龙头)竞争性吸附小分子核糖核酸(microrna),从而调节目标蛋白质编码mrna的表达。在这项研究中,我们的目标是找出更有效的对肺腺癌的诊断和预后标记(LUAD)。方法。我们得到差异表达lncRNAs (DElncRNAs), microrna (DEmiRNAs),信使rna (DEmRNAs) LUAD使用癌症基因组图谱,TCGA门户。加权基因coexpression网络分析(WGCNA)进行公布与LUAD相关核心基因模块。Cox比例风险模型进行确定DElncRNAs的预后意义。的诊断和预后意义DElncRNAs进一步验证基于接受者操作特征曲线(ROC)。Cytoscape被用来构造组成lncRNAs-miRNAs-mRNAs轴的龙头、网络基于相关性从miRcode获得,miRDB, TargetScan。结果。与正常肺组织相比,2355 DElncRNAs, 820 DEmiRNAs, 17289 DEmRNAs LUAD组织鉴定。我们生成8 WGCNA核心模块的lncRNAs coexpression网络,microrna 5个模块,分别在mrna coexpression网络和12个模块。一个441 lncRNAs lncRNA模块(蓝色)组成的,两个microrna的模块包含563个microrna(蓝色和绿色),和一个信使rna模块(青绿色),由15162 mRNA,大多是LUAD状况显著相关。此外,67年DEmRNAs被发现是肿瘤相关的靶基因以及DElncRNAs-DEmiRNAs轴。生存分析显示,6 lncRNAs (LINC01447、WWC2-AS2 OGFRP1, LINC00942, LINC01168,和AC005863.1) LUAD患者的预后有显著相关性。最终,潜在的龙头、网络包括6个DElncRNAs, 4 DEmiRNAs, 22 DEmRNAs构造。结论。我们的研究表明,6 DElncRNAs有可能作为LUAD诊断和预后的生物标志物。的lncRNA-mediated电抗器,网络可能会提供新颖的见解LUAD进展的分子机制。
1。介绍
肺癌是全世界癌症相关死亡的主要原因,其中肺腺癌(LUAD)是主要的组织学亚型,占所有病例的40% (1,2]。统计数据显示,令人沮丧的5年生存率小于20%尽管治疗最新进展(3]。不利预后的主要因素LUAD诊断在晚期癌症和转移的倾向4]。因此,迫切需要确定新的生物标志物在早期诊断和预后预测和探索的新治疗靶点LUAD [5]。
高通量基因组测序和微阵列已经表明,75%的人类基因组转录成非编码rna与蛋白质编码基因的异常(6,7]。长非编码RNA的RNA转录(LncRNAs)是一个类的长度超过200个核苷酸不编码蛋白质的能力(8]。LncRNAs广泛被认为对他们的功能通过不同的机制在调节生物过程在各种癌症和举行了实质性的承诺作为癌症治疗的新型生物标志物(9- - - - - -11]。小分子核糖核酸(microrna)也被证实在癌症的发展过程中起着重要的作用在过去的几十年中(12,13]。有趣的是,越来越多的证据支持,lncRNAs作为内源性分子海绵,识别和竞争性结合microrna通过共享microrna的反应元素(研究硕士),间接调节目标mrna转录后水平(14,15]。此外,假设复杂的龙头、网络参与肿瘤发展验证(16,17]。据报道,例如,lncRNA ITGB8-AS1-miR-33b-5p-ITGA3轴促进结直肠癌(入侵和迁移18]。LncRNA PVT1,电抗器,mir - 143,调节HK2表达式和促进胆囊肿瘤细胞扩散19]。
加权基因coexpression网络分析(WGCNA)撒谎基因coexpression无标度网络的建设来识别关键模块的高度相关的基因与特定临床特征(20.,21]。WGCNA的优点是,它可以识别和集群高度相关的基因到相同的模块。目前,WGCNA在多个领域中起着重要作用,比如癌症,神经系统,和遗传数据分析,这是非常有用的对于潜在候选标志物的或新的治疗靶点22- - - - - -25]。
在当前的研究中,我们确定了不同表达lncRNAs (DElncRNAs), microrna (DEmiRNAs)和mrna (DEmRNAs)和获得的关键模块利用WGCNA LUAD特征有关。六个诊断和预后DElncRNAs和6 lncRNAs-4 miRNAs-22 mrna电抗器,网络可以提供一个有用的基础制定LUAD早期诊断和个体化治疗。
2。方法
2.1。研究过程设计
生物信息学研究的方案设计是图所示1。
2.2。数据收集和处理
的转录组分析数据和临床数据LUAD患者肿瘤= 534;正常= 59)得到TCGA的数据库(https://portal.gdc.cancer.gov/)(补充表S3)。LncRNA-seq数据提取通过比较lncRNA注释根据Genecode (https://www.gencodegenes.org/)。我们进行数据分析基于“三级”读计数。TMM(修剪的意思米值)规范化和微分表达式分析与实现R包磨边机(| logFC | > 1.5值< 0.05)。火山的地图创建使用ggplot2 Sangerbox (https://sangerbox.com/)。维恩图都使用了Venny网站(https://bioinfogp.cnb.csic.es/tools/venny/index.html)。
2.3。建设Eigengenes基因Coexpression加权网络和识别模块
我们结合RPKM每百万)(每千碱基读取文件lncRNAs, microrna, mrna WGCNA使用WGCNA coexpression分析和构建基因网络R包(26]。这个过程包括以下关键步骤(20.,21:首先,使用abline函数异常值被移除的集群样本。其次,建立了相似矩阵转换成邻接矩阵的基础上β价值。在此基础上,一个重叠拓扑矩阵(汤姆)是用来执行相应的构造不同,和层次聚类树的基因(系统树图)生成通过分层聚类模块来实现检测。最后,模块成员(MMs)和基因的意义(GS)计算,进一步追究模块签名与癌症恶化密切相关的基因。
lncRNA之间的施工过程,microrna的mRNA coexpression网络相似除了一些参数:在软实力值的选择,β值lncRNAs, microrna mrna 4, 3,分别和1。的高度截止MEDissThres lncRNA, microrna的mRNA设置类似的模块是0.5,0.8,和0.4,分别。识别的动态模块,三种rna有同样的条件(deepSplit = 2, minModuleSize = 30)。
2.4。预测lncRNAs-miRNAs-mRNAs网络
预测目标lncRNAs和microrna基因通过网站工具:首先,重叠lncRNA-targeted microrna (pre-miRNAs)预测通过miRcode网站(https://www.mircode.org/从我们获得的microrna的反应元素(绝笔)信息。信使rna (pre-mRNAs)的目标共享microrna被TargetScan预测(https://www.targetscan.org/vert_72/)和miRDB数据库(https://mirdb.org/)。基因具有相同目标提取关系构建lncRNAs-miRNAs-mRNAs龙头、网络使用Cytoscape可视化。
2.5。生存分析
结合临床信息TCGA-LUAD样品,单变量和多变量Cox回归分析进行使用的生存R包Coxph函数来澄清lncRNAs特点和总生存期(OS)之间的关系,并使用forestplot森林地图绘制R方案的可视化。LncRNAs与预后显著相关参与建设的龙头、监管网络。曲线下的面积(AUC) 1年,3年,5年的操作系统是计算的“timeROC”R包来评估预后的预测精度。此外,诊断ROC曲线绘制与IBM SPSS统计26 lncRNA签名。 被认为是具有统计学意义。
3所示。结果
3.1。识别DElncRNAs、DEmiRNAs DEmRNAs LUAD
TCGA-LUAD mRNA表达数据,其中包括534 LUAD 59样本和正常样本,已经下载并与Genecode v38获取lncRNA表达数据。microrna的表达谱46 521年肿瘤样本和正常样本探索。原始统计数据标准化,微分表达式分析与实现R包磨边机。总共641 DElncRNAs, 224 DEmiRNAs, 5000 DEmRNAs筛选(| logFC | > 1.5 )(补充表S1)。火山109 lncRNAs展示情节表达下调,48个microrna和536 mrna表达下调,4464和532 lncRNAs, 176 microrna,信使rna调节LUAD样本(数据2(一个)- - - - - -2 (c))。
(一)
(b)
(c)
3.2。基因Coexpression网络建设获得中心模块
WGCNA,系统生物学的方法,进行了证明临床表型与coexpressed基因网络。软阈值的选择是一个关键的步骤,构建WGCNA。确定规模的独立和平均连通性之间的相对平衡,我们分析了网络拓扑与软阈值功率从1到20。当功率值(β)确认4 (lncRNAs), 3 (microrna)和1 (mrna),相应的拟合指数达到0.9,coexpression网络满足无标度分布(补充数据S1 (a)- - - - - -S1 (c))。我们生成8、5、12个关键模块(由不同的颜色表示)lncRNA, microrna和mRNA coexpression网络通过动态树切割方法(数据3(一个)- - - - - -3 (f))。每个模块是颜色编码,但基因的灰色模块不属于任何其他模块。值得注意的是,我们还确定每个模块与LUAD表型之间的关系。
(一)
(b)
(c)
(d)
(e)
(f)
结果表明,有显著关联中的蓝色模块和肿瘤表型lncRNAs coexpression网络(加权相关模块功能= 0.78)(图3 (b))。与此同时,绿松石模块显然是与肿瘤相关特征在mrna coexpression网络(模块特征加权关联= 0.71)(图3 (f))。microrna的coexpression网络,蓝色和绿松石模块与肿瘤表型显著相关(模块特征加权关联= 0.59/0.56)(图3 (d))。核心模块提取的基因进行进一步分析(WGCNA-lncRNAs = 441, WGCNA-miRNAs = 563, WGCNA-mRNAs = 15162)(数据4(一),4 (c),4 (d),4 (f))。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
3.3。预测lncRNAs-miRNAs和miRNAs-mRNAs对
首先,我们筛选了197 lncRNAs通过匹配DElncRNAs WGCNA-lncRNAs使用Venny网站(图4 (b))。预测潜在的microrna (pre-miRNAs)与197年lncRNAs获得使用miRcode数据库和确定7770 lncRNAs-miRNAs对,包括150 lncRNAs和282 microrna。24 DEmiRNAs的交集,282 pre-miRNAs 10和563 WGCNA-miRNAs, microrna最终包括(图4 (e))。然后,选择1107 mrna的十字路口5000 DEmRNAs和15162 WGCNA-mRNAs(图4 (g))。接下来,10区间的microrna TargetScan和miRDB在线预测的目标基因预测工具的目标基因(图4 (e))。没有有针对性的基因预测mir - 142 - 3 - p TargetScan网站,和其余9 microrna的结果表明,3074 miRNAs-mRNAs对包括2742个目标基因;6121对miRNAs-mRNAs miRDB网站检索,包含2742个目标基因。有1388信使rna复制在两个站点(图4 (h))。最后,67年目标mrna选择从DEmRNAs mrna在WGCNA核心模块,并预测mrna (pre-mRNAs)(数据4 (g)和4(我))(补充表S2)。我们进行反向推理基于67年目标基因和收到38对miRNAs-mRNAs(包括6 microrna 38 mrna)。6 microrna之间的相互影响和99年lncRNAs也终于结束。
3.4。LUAD lncRNAs-miRNAs-mRNAs网络建设
当microrna结合lncRNAs绝笔,mRNA表达不是抑制;因此,microrna大多与lncRNA和mRNA表达负相关(补充图S2)[27]。因此,我们筛查负相关的基因,其中包括59 lncRNAs, 4 microrna, 22 mrna。临床数据从TCGA-LUAD下载,其中512样品有完整的临床信息。pT阶段的临床病理的特点,pN阶段,阶段,下午和pTNM阶段纳入分析,Coxph生存函数R包被用来进行单变量和多变量Cox回归分析(补充表S4和S5)。因此,6 lncRNAs被确定为重要的预后因素(WWC2-AS2、OGFRP1 LINC00942, LINC01168,和AC005863.1风险因素,只有LINC01447属于保护性因子)(数据5(一个)和5 (b))(补充表S6)。Cox回归分析获得风险得分的每个样本用于ROC分析预后分级利用“timeROC”R包中。如补充图所示S3 (a)lncRNA签名是一个独立的预测指标,达成optimism-corrected AUC为0.79(1年),0.79(3年),和0.77(5年)。同时,诊断ROC曲线进一步展示了卓越的临床预后lncRNA模型的效用(AUC = 0.728)(补充图S3 (b))。最终,我们构造的龙头、网络六lncRNAs, 4 microrna和22 mrna,可视化使用Cytoscape v3.7.2软件和一个冲积情节(数字6(一)和6 (b))。
(一)
(b)
(一)
(b)
4所示。讨论
由于不利的预后和LUAD死亡率高,有必要改进诊断和治疗的策略。的lncRNA-mediated电抗器假说提出,lncRNA为龙头、调节基因表达的功能影响microrna的活动。先前的研究表明lncRNA-KRTAP5-AS1 lncRNA-TUBB2A可以作为龙头、强化扩散,入侵,EMT Claudin-4的函数(28]。HOXD-AS1注定mir - 130 - a - 3 - p在竞争方式,激活EZH2的表达和MMP2和促进肝癌转移29日]。先前的研究表明,lncRNA LUAD电抗器,发挥了重要的生物功能,但肿瘤特异性龙头、网络发起lncRNAs仍然默默无闻(30.,31日]。不同于lncRNA-regulated LUAD龙头、网络建立了吴et al .,六个不同的lncRNAs展出我们的龙头、网络。其原因可能是不同的生物信息学工具和问题(即。,we used the WGCNA analysis and conducted Cox regression analysis to identify cancer-related prognostic lncRNAs).
在目前的研究中,我们确定了6个差异表达和预后lncRNAs。其中,LINC01447、LINC01168 AC005863.1迄今为止还没有被报道。有趣的是探索摘要的作用这三个lncRNAs LUAD的开发和发展。LINC00942,其他三个是lncRNA OGFRP1 WWC2-AS2,都报道领域的恶性肿瘤(32- - - - - -36]。OGFRP1促进肿瘤进展通过增加mTOR / AKT通路的活性或直接接触mir - 4640 - 5 - p (32,33]。最近的研究表明,LINC00942强乳腺癌细胞增殖和发展影响METTL14-mediated m6A甲基化(34]。WWC2-AS2和LINC00942参与建设的宫颈癌预后lncRNA签名和肺腺癌(35,36]。在最近的研究中,高表达OGFRP1 LINC00942,和WWC2-AS2与LUAD患者的不良预后相关,这是符合abovereported结果。然而,所有这些lncRNAs与分子事件在LUAD仍然需要进一步的实验验证。
四个预测microrna在电抗器,网络在我们的研究中脱颖而出。这些DEmiRNAs如下:mir - 139 - 5 - p(下调),miR-30a-5p(下调),mir - 490 - 3 - p(下调),和mir - 449 c - 5 p(调节)。一致,mir - 139 - 5 - p在LUAD表达下调,对抑制扩散的能力,癌细胞的迁移和入侵目标MAD2L1 [37]。此外,一些研究已经发现miR-30a-5p抑制多种癌症的扩散,如乳腺癌、神经胶质瘤、肺鳞状细胞癌(38- - - - - -40]。据报道,mir - 490 - 3 - p超表达显著地抑制扩散,入侵和迁移的肝癌细胞通过激活BCYRN1 [41]。mir - 449 - c - 5 - p是一个中心circ-NOTCH1具备干细胞促进转移和胃癌细胞,导致胃癌的疾病进展42]。这些DEmiRNAs可能作为假定的目标LUAD诊断和治疗。
龙头、建立网络,22 DEmRNAs吸引了研究者的注意,他们发现他们有效的监管机构在癌症进展(43- - - - - -49]。EPHB2已经具备干细胞与癌症有关,通过收购了索拉非尼阻力β连环蛋白/ TCF1轴[43]。CXCL5作为肿瘤血管生成因子促进FOXD1的表达通过激活一种蛋白激酶/ NF -κB通路在结肠直肠癌44]。高表达CDCA7 TNBC患者促进肿瘤发生和预测预后差和ESCC45,46]。Downregulation TNNC1(肌钙蛋白C1)表达式加速肿瘤形成和LUAD患者死亡率增加47]。较低的神经胶质瘤细胞SYT14 (Synaptotagmin 14)表达观察抑制增殖能力(48]。Upregulation SPOCK2消极监管MMP2的基因表达,从而抑制前列腺癌细胞的浸润和转移49]。这些研究表明这些强有力的癌症监管机构参与目前的龙头、网络。
5。结论
我们用生物信息学方法构建LUAD-specific lncRNA-mediated龙头、监管网络。我们也认为6 DElncRNAs预后生物标志物可能在肿瘤发生和发展扮演关键角色的肺癌。需要进一步的实验验证,阐明在未来潜在的调控机制。
数据可用性
所有生成的数据或分析在本研究中包括发表的这篇文章及其补充信息文件。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
沂蒙崔崔Yaowen,顾瑞雪的贡献同样这项工作。
确认
作者承认TopEdit LLC的语言编辑和校对在准备这个手稿。这个项目部分由中国国家自然科学基金(81772474和81772474 LC和81803023和81803023 y),海岩重要基金从哈尔滨医科大学肿瘤医院(JJZD2020-14 XL和JJZD2021-07 YX),中国和黑龙江省博士后科学基金资助(2017 m621307和LBH-Z17182 YX),和一流的青年基金从哈尔滨医科大学肿瘤医院(BJQN2019-07 YX)。
补充材料
补充图S1。分析网络拓扑结构的软阈值的权力(权重系数,β)lncRNAs, microrna mrna。的x设在代表不同的软阈值的权力。上:评估R2日志(k),相关系数对应于不同β网络中值。红线表示无标度拓扑指数R20.9。低:分析的意思是连接不同β值。补充图S2。相关性分析lncRNAs, microrna mrna的龙头、网络。(一)LncRNAs microrna呈负相关。(b)负相关在mrna和microrna。(c) LncRNAs与mrna正相关。补充图S3。中华民国情节TCGA-LUAD预后lncRNA签名的数据集。(一)Survival-dependent ROC曲线证明DElncRNAs的预后意义。红线代表1年期AUC下的面积; the area under the blue line represented the 3-year AUC; and the area under the black line represented the 5-year AUC. (b) ROC curve analysis showed the application value of DElncRNAs in the diagnosis. Supplementary Table S1. The summarized data of DERNAs. Supplementary Table S2. The integrated results of DERNAs via differential expression analysis, WGCNA, and website prediction. Supplementary Table S3. Baseline clinicopathological characteristics of the TCGA-LUAD cohort. (n= 513)。补充表S4。单变量Cox回归分析相关因素的整体存活率TCGA-LUAD数据集。补充表S5。多变量Cox回归分析相关因素的整体存活率TCGA-LUAD数据集。补充表S6。6预后lncRNA-mediated龙头、网络。(补充材料)