文摘
背景。圆形rna (circRNAs)函数作为小分子核糖核酸的诱饵(microrna)或蛋白质,为翻译模板,假基因的来源的一代。本研究的目的是确定诊断circRNAs,有关肺腺癌(LUAD),吸附microrna的基础上竞争内源性RNA(龙头)假说。方法。的差异表达circRNAs (DEcircRNAs) LUAD被微阵列数据显示(GSE101586和GSE101684)获得的基因表达数据库综合(GEO)。针对性的microrna的DEcircRNAs CircInteractome预测,和目标mrna的microrna miRDB和TargetScan被发现。由Cytoscape龙头、网络建成。的潜在生物角色和监管机制circRNAs被基因本体论(去)浓缩调查分析和基因和基因组的京都百科全书(KEGG)分析。circRNAs的宿主基因的表达被Ualcan检查。生存分析是由kaplan meier绘图仪。结果。与正常肺组织相比,LUAD组织包含7重叠癌症特异性DEcircRNAs 294 microrna的响应元素(研究硕士)。在7 DEcircRNAs 3 circRNAs (hsa_circ_0072088、hsa_circ_0003528 hsa_circ_0008274)是调节和4 circRNAs (hsa_circ_0003162, hsa_circ_0029426 hsa_circ_0049271, hsa_circ_0043256)表达下调。circRNA-miRNA-mRNA监管网络,其中包括33个差异表达microrna (DEmiRNAs)和2007差异表达mrna (DEmRNAs)构造。这些信使rna是丰富的生物功能和信息粘附,对缺氧的反应,和干细胞分化和参与PI3K-Akt信号,HIF-1信号,信号通路。结论。我们的研究结果表明,7 DEcircRNAs LUAD有诊断价值。此外,circRNAs-mediated电抗器,网络可能会提供一个新颖的视角揭示LUAD的发病和进展。
1。介绍
肺癌是第二个最常见的癌症诊断和全世界癌症死亡的主要原因。1]。在2020年,超过220万个新的肺癌病例和死亡人数估计达180万lung-cancer-related [1]。非小细胞肺癌(NSCLC)病例中占85%的肺癌,和最常见的组织学类型的非小细胞肺癌肺腺癌(LUAD) [2]。尽管改善化疗和放疗,LUAD的5年生存率仍然低于20% (3]。因此,它是至关重要的澄清LUAD的潜在机制和治疗目标,有利于诊断和预后评估(4]。
越来越多的证据表明,非编码rna如长非编码rna (lncRNAs) pseudogenic rna,圆形rna (circRNAs)可以作为竞争内源性rna(龙头)通过竞争性结合几个microrna [5,6]。与传统的班轮rna相比,圆形rna (circRNAs)有一个完全闭环结构(7]。CircRNAs已确定的microrna的海绵参与癌症发展(8- - - - - -10]。CircRNAs和mrna争夺绑定目标有限microrna通过丰富的microrna的结合位点(研究硕士)地区构建一个龙头、管理网络(11]。当mrna竞争性结合microrna,翻译过程被中断,microrna的稳定性被破坏(12- - - - - -14]。然而,circRNAs保持稳定和抵制核糖核酸外切酶降解11]。
有趣的是,电抗器,监管网络提供的发生和发展是密切相关的不同类型的癌症,包括LUAD [11,15- - - - - -17]。例如,先前的研究显示,circRNA-ENO1起到了至关重要的作用在糖酵解和肿瘤恶化的LUAD通过促进宿主基因的表达三(18]。此外,circ_EPB41L2起到了保护作用,抑制增殖,迁移,并通过调节CDH4入侵和mir - 211 - 5 - p LUAD细胞(19]。此外,体内研究表明,过度circ_EPB41L2抑制肿瘤生长的调节mir - 211 - 5 - p和CDH4 [19]。此外,生物信息学分析,依赖于高通量测序技术的崛起,已广泛应用于研究癌症的病因和底层机制。探讨肿瘤标志物具有预后意义,研究人员需要建立一个全面的电抗器,监管网络通过深入分析公共数据库。尽管许多生物信息学的研究一直在进行,电抗器,小说circRNA分子和电抗器,网络值得进一步调查(20.- - - - - -22]。进一步研究电抗器,网络将有助于探索小说LUAD的诊断和治疗方法。
在目前的研究中,我们收集的表达谱circRNAs (GSE101586和GSE101684), microrna (GSE135918和TCGA-LUAD),和LUAD mrna (TCGA-LUAD)。七个差异表达和癌症特异性circRNAs LUAD被确定的生物信息学分析。circRNA-miRNA-mRNA监管网络。此外,我们进行功能富集分析揭示circRNAs潜在的生物功能和机制,这可能提供新的见解LUAD的诊断和治疗。
2。方法
2.1。研究过程设计
实验研究的设计和具体实现方案如图所示1。
2.2。从公共数据库收集的数据
基因表达综合(地理,https://www.ncbi.nlm.nih.gov/geo/)是一个数据库广泛应用于许多领域。它涉及到非编码RNA分析、比较基因组分析、蛋白质组学分析,基因组单核苷酸多态性分析,DNA甲基化状态分析。我们寻找微阵列数据的地理数据集输入“肺腺癌”和“circRNA”关键词。包含和排除标准(1)人类LUAD组织和邻近的正常的人类肺组织,(2)circRNA微阵列表达分析,和(3)数据注释平台和原始数据矩阵。两个数据集(GSE101586和GSE101684)满足筛选条件的获得和下载。
2.3。数据处理
基地2对数(日志2)变换被用来变换的表达式值circRNAs和R软件被用来解释原始微阵列数据。circRNAs相似的矩阵表达式,我们平均表达式的值复制。circRNAs的探针上的信息注释从GPL19978和GPL21825平台下载文件。调查的详细注解,样本,从GEO数据库获得的平台。我们原始日志表达数据的标准化2改变了。我们使用了一个R包的差异化分析微阵列数据和设置|日志的阈值2(叠化)| > 1和< 0.05确定DEcircRNAs在每个数据集。然后,我们保留了DEcircRNAs和删除的circRNAs没有差异表达。
2.4。识别DEcircRNAs
当多个探针被映射到一个特定的安捷伦ID,对应的值被选中。Perl脚本使用安捷伦ID转换为基因的名字。标准化矩阵之间的基因差异表达信息和分析模型,我们使用了limma包规范化原始的微阵列数据。随后,叠化和值被用来确定差异表达基因在两个数据集,筛选标准|日志2(叠化)| > 1和值< 0.05。我们使用了CircBase数据库获取宿主基因相关circRNAs [23]。
2.5。CircRNA-MicroRNA-Target基因网络的预测
CircBase数据库(circbase.org/)和癌症特异性circRNAs数据库(CSCD),https://gb.whu.edu.cn/CSCD/)被用来预测研究硕士circRNAs circRNAs提供信息从多个视角,包括染色体circRNAs的位置、长度变化的circRNAs circRNAs之间的交互和microrna。特定的MicroRNA的目标是预测基于微目标预测数据库(miRDB,http://mirdb.org/)和TargetScan (http://www.targetscan.org/vert_71/)。重叠基因的三个数据库被选为宿主的基因。宿主基因研究的预后价值kaplan meier绘图仪。
2.6。去富集分析
为了理解circRNAs的势函数,我们进行了富集分析目标基因的大卫(https://david.ncifcrf.gov/home.jsp)。去分析包括分析蜂窝组件(CC),分子功能(MF)和生物过程(BP)。每个类别的去分析解释了不同生物功能的基因。我们使用Sangerbox (http://www.sangerbox.com/可视化的结果去富集分析。
3所示。结果
3.1。识别DEcircRNAs
我们下载和分析了GSE101586 GSE101684 GEO2R微阵列数据的工具来识别DEcircRNAs配对NSCLC组织和相邻nontumor组织之间。这两个数据集的基本信息见表1。我们获得68 DEcircRNAs包括47个调节和21下调circRNAs GSE101586数据集的基础上和305年DEcircRNAs,包括168年调节和137年下调circRNAs GSE101684数据集的基础上(数据2(一个)和2 (b),值< 0.05和叠化的绝对值> 1)。我们提供了两个火山地块DEcircRNAs形象化(数据2 (c)和2 (d))。维恩图如图2 (e)显示10重叠DEcircRNAs之间的两个数据集。
(一)
(b)
(c)
(d)
(e)
(f)
特异的circRNA数据库(CSCDhttp://gb.whu.edu.cn/CSCD)是一个有用的circRNA数据库来推断是否特定circRNAs癌症特异性(24]。7差异表达和癌症特异性circRNAs LUAD呈现在图2 (f)。
3.2。表征DEcircRNAs
如数据所示3(一个)和3 (b)3 circRNAs (hsa_circ_0072088 hsa_circ_0003528, hsa_circ_0008274)是调节和4 circRNAs (hsa_circ_0003162, hsa_circ_0029426、hsa_circ_0049271 hsa_circ_0043256)表达下调。在这项研究中,我们使用了CircBase数据库来确定位置,基因组长度、链,基因7 DEcircRNAs的象征。列出了DEcircRNAs表的基本特征2。
(一)
(b)
(c)
此外,结构模式的7 circRNAs CSCD数据库如图3 (c)。294研究硕士被预测为癌症特异性DEcircRNA候选人。具体来说,我们发现hsa_circ_0072088存在32研究硕士,hsa_circ_0003528拥有57研究硕士,hsa_circ_0008274存在51研究硕士,hsa_circ_0049271拥有38研究硕士,hsa_circ_0003162拥有42研究硕士,hsa_circ_0029426拥有28研究硕士,hsa_circ_0043256拥有48研究硕士。这些发现表明DEcircRNAs是潜在的microrna的海绵(图3 (c))。
DEcircRNAs是由宿主基因部分片段转录。接下来,我们检查了宿主基因的表达和诊断和预后意义的7种癌症相关的DEcircRNAs。hsa_circ_0049271的宿主基因,hsa_circ_0029426, hsa_circ_0072088(补充图诊断和预后意义S1)。
3.3。差异表达microrna的决心和差异表达mrna
GSE135918数据集的基础上,我们确定了624个差异表达microrna在LUAD (DEmiRNAs)。CircInteractome数据库是用来预测的microrna 7 DEcircRNAs,和114年microrna被发现。图4(一)说明GSE135918数据集包含2693个microrna, 624 DEmiRNAs。另一方面,TCGA-LUAD数据集包含2197 microrna和362 DEmiRNAs(图4 (b))。33 DEmiRNAs DEcircRNAs被发现相关的维恩(图分析4 (c))。然后,miRDB和TargetScan数据库,我们寻找的目标mrna DEmiRNAs 7 DEcircRNAs的目标。总共有7622个目标基因绑定到33 DEmiRNAs。TCGA-LUAD数据库的基础上,2007年的7622个信使rna被发现差异表达(图4 (d))。
(一)
(b)
(c)
(d)
3.4。一个龙头、网络建设
在前面的章节中,我们获得了7 DEcircRNAs 33 DEmiRNAs,和2007年DEmRNAs阐明DEcircRNAs之间的交互,DEmiRNAs, DEmRNAs。接下来,我们使用Cytoscape 3.8.2 circRNA-miRNA-mRNA形象化监管网络数据5(一个)和5 (b)和补充表1)。
(一)
(b)
3.5。功能富集分析
circRNAs的潜在生物角色和监管机制研究使用浓缩去分析和京都基因和基因组的百科全书(KEGG)分析。mrna的丰富的生物功能和信息粘附,对缺氧的反应,和干细胞分化(图6(一)和补充图S2 (a))。此外,信使rna参与PI3K-Akt信号,HIF-1信号,信号通路(图6 (b)和补充图S2 (b))。
(一)
(b)
4所示。讨论
的高死亡率和LUAD的存活率极低,测定特定的生物标志物的诊断和治疗LUAD[仍然至关重要4,25]。先前的研究发现,非编码rna,尤其是circRNAs,导致恶性进展(转移、扩散和肿瘤生长)的多种类型的癌症26- - - - - -30.]。CircRNAs有高稳定性由于独特的共价闭环结构,允许CircRNAs抵制R核糖核酸酶降解[31日]。许多研究报道,电抗器,监管网络,是由circRNAs包含大量的诊断和预后价值。在我们的研究中,全面分析了电抗器网络可靠的诊断标志物。同样,李et al。32)选择的组合GSE101586、GSE101684 GSE112214和确定了DEcircRNAs早期非小细胞肺癌患者。利用CSCD,我们确定差异表达和癌症特异性cirRNAs在LUAD潜在首次microrna的海绵。
随后,信使rna的功能富集分析提出相关的生物功能和LUAD通路。我们的研究显示,选择目标mrna电抗器,网络丰富的信息粘附的生物功能,对缺氧的反应,和干细胞分化。此外,目标mrna参与PI3K-Akt信号,HIF-1信号,信号通路。然后,我们应用生物信息学分析探索circRNAs的结构和使用CircBase和CSCD数据库找出位置,基因组长度、链,基因circRNAs的象征。展出的特异的circRNAs绝笔,RNA结合蛋白(RBP)和开放阅读框(ORF)测定,电抗器。研究硕士都在观察lncRNAs circRNAs,蛋白质编码mrna, microrna能竞争,形成一个龙头、监管网络,和吸收RBPs [12]。大量的证据确认,非编码rna扮演了一个角色在调节基因表达在转录和转录后的水平与RBPs物理交互或其他非编码rna (33]。另一方面,RBPs有助于circRNA生物起源的外显子环化通过缩小供体和受体之间的距离站点绑定到侧面上的内含子区域(34]。此外,开放进步的翻译工程circRNAs [35]。
出7 DEcircRNAs在这项研究中,确定3 DEcircRNAs已经在先前的研究报告(36,37]。Hsa_circ_0072088被认定为龙头、mir - 377 - 5 - p通过上调NOVA2加快扩散和转移的非小细胞肺癌(36]。此外,hsa_circ_0008274和hsa_circ_0043256来自龙头、网络被报道参与癌症恶化[37]。Bioinformatics-related分析建议的意义理解的潜在机制circRNAs-miRNAs-target基因网络(10,38- - - - - -40]。
虽然我们已经描述了电抗器的意义网络LUAD的临床诊断、预后价值的调查和临床参数迫切需要验证我们的发现在患者临床LUAD样本。此外,分子实验需要进行验证的生物功能和分子机制LUAD确定基因的细胞系。
5。结论
总之,通过生物信息学分析,我们确定了3显著调节circRNAs和4显著下调circRNAs从公共数据库,这表明潜在的非侵入性的DEcircRNAs LUAD诊断生物标记。在未来的研究中,生物功能的分子调节机制DEcircRNAs需要实验验证。
数据可用性
所有生成的数据或分析在本研究中包括发表的这篇文章及其补充信息文件。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
Yuechao刘、王鑫和露露Bi的贡献同样这项工作。
确认
作者承认TopEdit LLC的语言编辑和校对在准备这个手稿。这个项目是国家自然科学基金支持的部分中国(LC 81772474, 81772474, 81803023 y),海岩重要基金从哈尔滨医科大学肿瘤医院(JJZD2020-14 XL和JJZD2021-07 YX),中国,黑龙江省博士后科学基金会(2017 m621307和LBH-Z17182 YX),和一流的青年基金从哈尔滨医科大学肿瘤医院(BJQN2019-07 YX)。
补充材料
补充图S1:宿主基因的诊断和预后意义。(一)hsa_circ_0049271宿主基因的表达,hsa_circ_0029426, hsa_circ_0072088癌症基因组图谱,TCGA -LUAD数据集。(b)生存分析的宿主基因三个circRNAs LUAD病人都使用kaplan meier绘图仪。< 0.05;< 0.01;< 0.001。补充图S2: (a)去富集分析和(b) KEGG通路富集分析DEmRNAs hsa_circ_0003162, hsa_circ_0003528 hsa_circ_0008274, hsa_circ_0043256。补充表1:circRNA-miRNA-mRNA监管网络的建设。(补充材料)