肿瘤学杂志 1687 - 8469 1687 - 8450 Hindawi 10.1155 / 2021/9977695 9977695 研究文章 综合分析差异表达长非编码RNA-mRNA Adenoma-Carcinoma序列的DNA错配修复精通结肠癌 Wenkun 1 1 通用电气 1 2 南山 1 老挝 Yueqiong 2 雅丹 1 Kuiliang 1 纯美少女 1 1 Guojun 1 1 Canghai 1 在香港 1 https://orcid.org/0000 - 0003 - 3009 - 4434 1 3 Chatterjee Sumanta 1 美国胃肠病学 北京Shijitan医院 首都医科大学 北京100038年 中国 ccmu.edu.cn 2 美国胃肠病学 北京大学临床医学院的第九位 北京100038年 中国 pku.edu.cn 3 美国胃肠病学 北京友谊医院 首都医科大学 国家临床研究中心对消化系统的疾病 北京,100050 中国 bfh.com.cn 2021年 9 6 2021年 2021年 14 3 2021年 8 5 2021年 9 6 2021年 2021年 版权©2021李Wenkun et al。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

精通DNA错配修复结肠癌(pMMR CC)是最常见的零星的CC亚型。我们旨在调查长非编码rna的作用(lncRNAs) pMMR CC致癌作用。在目前的研究中,我们进行了转录组分析五个低级lncRNAs-mRNAs上皮内瘤(LGIN),五个高档上皮内瘤(HGIN),四个pMMR CC,五个正常控制(NC)组织。基因本体论(去),京都基因和基因组百科全书(KEGG)浓缩通路,和coexpression网络分析功能的阐明lncRNAs mrna和他们的相互作用。定量实时聚合酶链反应(存在)是用于验证五lncRNAs特异表达在一个大组结肠组织。接受者操作特征(ROC)曲线是用来评估候选人lncRNAs的性能。一组5783个差异表达lncRNAs和4483年发现了差异表达mrna在登录,HGIN, pMMR CC,数控样本。这些差异表达lncRNAs和mrna被分配到275年显著条款和179显著KEGG丰富通路。存在确认5的表达选择lncRNAs (ENST00000521815, ENST00000603052, ENST00000609220 NR_026543, ENST00000545920)与微阵列数据是一致的。ROC分析显示四个lncRNAs (ENST00000521815, ENST00000603052、ENST00000609220 NR_026543)有较大的ROC曲线下面积(AUC)值相比,血清癌胚抗原,从而区分数控和pMMR CC。总之,几个lncRNAs adenoma-carcinoma序列中扮演不同的角色,可以作为早期诊断的潜在生物标志物pMMR CC。

北京消化医学协调发展中心医院权威 XXZ015 北京医疗卫生基础 ywjkjjhkyjj - b17262 - 067 中国国家铁路集团科技开发项目 N2019Z004
1。介绍

结直肠癌(CRC)是第三个全球最常见的癌症诊断,包括对2018年180万例新病例( 1]。超过70%的CRC情况下位于结肠,也称结肠癌(CC) [ 2]。根据最新的数据,CRC排名第五的中国癌症发病率和死亡率( 3]。

CRC是一种异构的疾病逐步积累的遗传和表观遗传变化( 4- - - - - - 6]。大约三分之二的CRC病例出现未知的贡献从生殖系因素或重要的癌症和炎症性肠病家族史,定义为零星的CRC。三个主要的遗传机制构成零星的CRC的发病机制( 7),即染色体不稳定(CIN)、微卫星不稳定性(MSI),外遗传性CpG岛methylator表型(CIMP)。CIN,第一个描述和最常见的途径,占-85%的零星的CRC (80% 8]。与DNA nonhypermutated CIN crc精通错配修复(pMMR)函数( 7]。负责CIN的机制不同,MSI和CIMP负责。理解CRC的分子机制是至关重要的临床预后和治疗反应。63合格的荟萃分析研究CRC患者(10126)显示一个糟糕的预后CRC CIN患者/ pMMR [ 9]。此外,II期CRC患者错配修复缺陷(dMMR)或高级MSI (MSI-H)有更好的预后,但没有受益于氟尿嘧啶化疗( 10, 11]。

超过90%的结直肠肿瘤发生情况下遵循adenoma-carcinoma序列(ACS),与多个基因突变和异常激活的信号通路 12, 13]。腺瘤息肉病杆菌(APC)基因的突变发生在结直肠肿瘤发生早期,其次是KRAS基因的激活和失活的TP53基因,通常与CIN ( 14]。

长非编码rna (lncRNAs)是一类非编码rna有超过200个核苷酸不翻译成蛋白质。LncRNAs可以调节基因的表达在不同层次,包括epigenetically,转录和转录后的 15]。减少表达lncRNA SATB2-AS1促进转移和CRC通过调节SATB2影响肿瘤微环境,从而导致贫穷的生存( 16]。过度的lncRNA UCA1有助于肿瘤细胞的免疫逃逸和保护PDL1表达在胃癌microrna的镇压,小说作为一种潜在的目标免疫疗法( 17]。然而,微分表达式和在ACS lncRNAs CRC的作用仍有待阐明。

先前的研究CC lncRNA表达谱的一般表现在所有癌症包括直肠癌结肠在一起,从而忽视了CC的异质性分子亚型。尽管经常联系在一起,CC和直肠癌治疗时不同。迄今为止,微分表达谱在正常结肠lncRNAs mucosa-pMMR adenoma-pMMR零星的CC序列尚未报道。在目前的研究中,我们旨在描述的表达谱lncRNAs pMMR零星的恶性演化过程的CC使用转录组微阵列技术。研究结果提供有用的候选人CC的诊断和治疗。

2。材料和方法 2.1。临床样本

共有244个零星的结肠组织,其中包括63腺瘤低度上皮内瘤(LGIN), 32个腺瘤高级别上皮内瘤(HGIN), 66 pMMR CC, 8 dMMR CC, 75正常控制(NC)相邻样本(≥10厘米)增生性或炎性息肉采样在北京Shijitan医院(中国,北京)从2018年到2019年。样本立即放置在RNAlater解决方案(猫。76104号,试剂盒有限公司GmBH,德国)24小时在4°C。新鲜冷冻样本存储在−RNA提取80°C。所有的患者接受有针对性的治疗,化疗,放疗,或干预治疗。本研究通过北京Shijitan医院的伦理委员会(没有。:2018 - 59)和书面知情同意了所有个人参与者包括在这项研究。

2.2。pMMR样本的筛选和总RNA隔离

在我们之前的研究( 18),多重PCR和免疫组织化学是用来确定MMR的地位。pMMR结肠组织被定义为组织样本的低频MSI (MSI-L)或微卫星稳定(海量存储系统(MSS)中,没有标记测试)。从组织中提取总RNA样本使用RNAiso +(代码9109号、豆类、日本)。RNA完整性确认以NanoDrop nd - 2000分光光度计(热费希尔科学、罗切斯特,纽约,美国)和安捷伦生物分析仪2100(美国安捷伦科技,圣克拉拉,CA)和进一步纯化RNeasy迷你包(猫。# 74106,试剂盒,GmBH是一家现代化、德国)和RNase-Free DNase组(猫。# 79254,试剂盒有限公司GmBH,德国)。RNA样本完整≥7.0和28 s: 18岁比≥0.7被用于进一步的实验。

2.3。微阵列分析

lncRNA和mRNA表达谱的多级结肠粘膜组织(5数控五LGIN 5 HGIN,和四个pMMR CC)样品测定与安捷伦定制SBC人类(4 180 K) lncRNA微阵列V6.0(产品号g4862a - 074348;安捷伦科技,圣克拉拉,CA)。总RNA与低输入快速放大,贴上Amp WT标签工具包(猫。安捷伦科技。5190 - 2943年,圣克拉拉,美国CA)制造商的指示。标签cRNAs纯化RNeasy迷你包(猫。74106号,试剂盒,GmBH,德国)。每个幻灯片与1.65杂化 μ使用基因表达g Cy3-labeled cRNA杂交工具包(猫。不。安捷伦科技# 5188 - 5242年,圣克拉拉,CA,我们在杂交炉(猫)。不。G2545,安捷伦科技,圣克拉拉,美国CA) 17 h。幻灯片(Cat在染色洗盘子。热Shandon没有。121年,沃尔瑟姆,妈,我们)基因表达洗缓冲区工具包(猫。安捷伦科技。5188 - 5327年,圣克拉拉,CA,我们遵循制造商的指示,与一个安捷伦芯片扫描仪(Cat扫描。不。G2565CA,安捷伦科技,圣克拉拉、钙、美国)和默认设置(染料频道:绿色,扫描分辨率= 3 μ米,PMT 100%, 20位)。数据提取与特征提取软件10.7(美国安捷伦科技,圣克拉拉,CA)。

2.4。数据处理和识别度 2.4.1。系列测试集群(STC)分析

原始数据标准化与分位数算法GeneSpring软件11.0(美国安捷伦科技,圣克拉拉,CA)。聚类分析进行系统地、直观地显示样本之间的相似度。四组之间的差异基因表达式(度)与F过滤测试随机方差模型(RVM)使用 P 值< 0.05和Benjamini-Hochberg错误发现率(罗斯福)< 0.05为重要的截止条件( 19]。STC)分析是用来确定最可能的组群负责观察ACS系列通过分析时序基因表达的动态特性。数控、LGIN HGIN, pMMR CC被设置为不同的点来确定重大趋势模型与多级结肠粘膜组织及其相关优质度的分析。集群 P 值< 0.05/26被认为是具有统计学意义。

2.4.2。基因本体论和京都基因和基因组途径分析的百科全书

基因本体论(去)分析注释度在三个类别:分子功能,生物过程和细胞组件。京都基因和基因组的百科全书(KEGG)分析识别功能途径和通路分子间的相互作用,反应,和关系网络。统计上显著的阈值被设置为 P 值< 0.01和罗斯福< 0.05。

2.5。建设Coexpression和转录因子(TF)监管网络

识别coexpressed lncRNA-mRNA对中心度,lncRNA-mRNA coexpression网络构建基于基因表达值和皮尔逊相关系数(PCC)之间的差异表达lncRNAs和mrna。| PCC |≥0.8 P 值< 0.01被认为是统计上显著相关。为了区分TF监管网络的逐步过程包括CC进展,预测从一个特遣部队的交互通过搜索守恒的TF结合位点在一个假定的上游启动子区2000个基点和500个基点的下游coexpressed基因的转录起始位点。

2.6。验证的定量实时PCR(存在)

基于类型的lncRNAs异常表达式(褶皱变化),这些变化在coexpression度,和共产党的结果,CNCI,包含,PhyloCSF得分,5 lncRNAs被选来验证芯片结果。的表达水平lncRNAs检查中存在于225年结直肠组织样本。执行中存在QuantStudioTM6 Flex实时PCR系统(热费希尔,罗切斯特,纽约,美国)。引物中列出额外的文件1和3 -磷酸甘油醛脱氢酶(GAPDH)作为内生控制。每个存在反应(10 μL)包含5 μL 2 x SYBR绿色PCR混合(美国ABI), 0.4 μ米的正向和反向引物,和5 ng的模板互补。PCR程序如下:最初在95°C变性5分钟紧随其后40周期在94°C 30年代和60°C 1分钟和荧光采集60°C 1分钟。每个样品进行PCR扩增一式三份。

2.7。统计分析

基于计算机的计算进行了使用SPSS 20.0版(美国SPSS Inc .,芝加哥,IL)和MedCalc 19.1版(MedCalc软件投资兴建,奥斯坦德,比利时)。的表达的差异选择lncRNAs在多个组比较采用方差分析。进一步两两比较进行最少的意义差异(LSD)测试。之间的差异的表达lncRNAs pMMR CC组和dMMR CC组与非参数Mann-Whitney相比 U测试。lncRNAs之间的关系和他们的目标的编码基因被斯皮尔曼相关分析确定。接受者操作特征(ROC)曲线和ROC曲线下的面积(AUC)是用来评估候选人的诊断准确性lncRNAs血清癌胚抗原(CEA)、医院信息系统。给出的数据的平均值和标准偏差(SD)正态分布数据和中位数和四分位范围数据倾斜。|褶皱变化|≥5作为重要的阈值筛选差异表达lncRNA和信使rna。所有 P 计算值是双面的,罗斯福为多个比较。差异与 P < 0.05 被视为具有统计学意义。

3所示。结果 3.1。微阵列数据的基本特征

从pMMR结肠组织样本,提取的总RNA组成的五个数控五LGIN五HGIN,和四个pMMR CC样本,是转录组微阵列杂交。RNA /芯片的质量控制结果总结在附加文件1和附加文件2中,分别。规范化数据的聚类分析表明,样本每组都是分开当度被认为是(图 1),这表明进一步的生物信息学分析的微阵列数据是可靠的。

集群的样本。紫色代表NC组,黄色代表LGIN集团,绿色代表HGIN集团,粉色代表CC组。

3.2。lncRNAs特异表达和结肠Adenoma-Carcinoma信使rna序列

总共有5783 lncRNAs和4483 mrna数控中差异表达,LGIN, HGIN, pMMR CC样本。为了生成动态和重要度的趋势模型与结肠粘膜恶性转变,优质的集群分析被用来进一步识别度与相似的表达模式。如图 2(一个),26个差异表达的差异表达谱由lncRNA集群,其中15集群(档案号0、1、2、3、4、5、9、12、17日,20日,21日,22日,23日,24日和25日)显示显著的表达趋势( P < 0.05 )。此外,lncRNA表达水平集群21日,22日,24日和25是稳定或逐渐升高,而lncRNA表达式在集群中0,1,3,4,9岁和12岁显示一个下降的趋势。集群包含23 207 lncRNAs逐渐从数控增加腺瘤抑制在CC(图 2 (b))。然而,lncRNA表达式在集群3是相反的,在集群23。如图 2(一个),总共九个mRNA表达集群,特别是集群2,4,5,13日,20日,21日,22日,24日和25日,显示显著的表达趋势( P < 0.05 ),其中集群21日,22日,24日和25日显示稳定或渐进的高程。结果表明,腺瘤是一个中间步骤从正常组织到CC,和某些lncRNAs可能在动态过程中扮演了一个重要的角色在结肠粘膜病变突出。

优质的分析度在多级结肠粘膜组织中特异表达。(一)26集群度的表达模式,15 lncRNA表达模式,和九mRNA表达模式显示显著 P 值(彩色盒子, P < 0.05 / 26)。每个框代表一个表达谱模型,较低的数量在概要文件框 P 值,上面的数字是该模型配置数量。(b)集群25 (173 lncRNAs)逐渐增加,集群0 (87 lncRNAs)显示一个下降的趋势,集群包含23 207 lncRNAs逐渐增加从数控腺瘤,然后减少在CC, 25 (146 mrna)和集群逐渐增加。水平轴代表结肠粘膜突出病变的不同阶段和纵轴显示的时间序列lncRNA / mRNA表达水平。 r归一化与对数变换。

3.3。功能和通路富集分析

度从重要的表达趋势受到和KEGG通路分析去确定其潜在功能的动态过程和机制结肠粘膜病变(图突出 3)。

去注释和KEGG浓缩通路的概述。(一)排名前20位的条款为度。(b)通路对应度前20名。 P 值< 0.05和罗斯福< 0.05。

前20名的条款包括多细胞生物的发展,细胞分裂,细胞粘附、细胞周期、细胞分化、细胞有丝分裂,蛋白质水解和血管生成。KEGG富集分析显示,度主要是参与几个信号通路,包括代谢、癌症、细胞周期,PI3K-Akt信号和转录misregulation癌症(图 3 (b))。

3.4。建设lncRNA-mRNA Coexpression网络

发现lncRNAs与肿瘤发生相关的重要分子机制在结肠ACS, lncRNAs从提升集群 20.- - - - - - 23]或减少集群(0、1、3、4、9和12)mrna和重要条款和KEGG浓缩通路被选去构造elevated-lncRNA-mRNA coexpression网络(coexpression网络E)和decreased-lncRNAs-mRNA coexpression网络(coexpression网络D),分别。十大lncRNA / mRNA在表中列出 1 2。Coexpression网络E包含714个节点和1711边缘(图 4(一)),其中最高的中心节点度是新的高度(mRNA,度= 29),INHBA (mRNA,度= 26),TSTA3 (mRNA,度= 29),lnc-NPRL3-1:1 (lncRNA程度= 22),NR_024431 (lncRNA程度= 21),和ENST00000564984 (lncRNA程度= 17)。Coexpression网络D包含598个节点和1908边缘(图 4(b))和度最高的学位是AQP8 (mRNA,度= 47),STRADB (mRNA,度= 47),ENST00000435912 (lncRNA程度= 15),NR_024431 (lncRNA程度= 21),和ENST00000564984 (lncRNA程度= 17)(表 1 3)。

最高的前十名lncRNAs学位coexpression网络E / D

基因 数控 LGIN HGIN CC P 价值 罗斯福 类型 学位
LncRNAs高架的概要文件
Lnc-NPRL3-1:1 1625.59 2834.43 2901.7 2777.36 0.0037928 0.0253 感觉 22
NR_024431 7.42 18.65 19 18.6 0.0035591 0.0242 基因间的 21
ENST00000564984 9.17 18.63 19.15 18.83 0.002729 0.0204 反义 17
Lnc-CLEC3A-9:1 10892.39 20059.59 19686.96 19862.6 0.0007135 0.00894 感觉 13
NR_029374 17.3 41.96 42.92 39.14 0.0064708 0.0358 反义 12
Lnc-MKI67IP-8:1 25.14 43.39 43.53 40.98 0.0044777 0.0282 反义 12
NONHSAT064233 60.28 118.49 113.3 273.65 1.68 e - 005 0.000976 反义 11
Lnc-DLX2-9:1 13.74 32.64 32.78 30.29 0.0038192 0.0254 反义 11
ENST00000545920 202.78 259.09 260.38 421.62 0.0019042 0.0162 双向 10
Lnc-MAP3K9-9:1 406.91 663.73 501年 1392.28 0.0010763 0.0114 反义 10

LncRNAs下行的概要文件
ENST00000435912 35.42 19.61 19.43 19.98 0.0083754 0.0425 反义 15
Lnc-PDZK1-1:1 1838.67 149.47 119.91 220.16 0.0004298 0.00669 反义 14
Lnc-MRPL54-2:1 200.94 123.77 123.05 125.75 0.0106357 0.0495 感觉 14
ENST00000364025 7.73 3.84 3.78 3.92 0.0026283 0.0199 感觉 14
Lnc-CCNB3-2:1 617.57 101.05 95.87 115.2 4.63 e - 005 0.00179 基因间的 14
Lnc-CCDC14-2:2 68.74 7.14 5.92 10.93 5.71 e - 005 0.00201 感觉 13
NR_003064 29637.97 1140.93 703.58 1579.91 6 e - 007 0.000143 基因间的 13
Lnc-SRSF5-1:1 8.49 3.84 3.77 4.14 1.61 e - 005 0.000956 基因间的 13
NR_110552 472.62 9.51 10.64 39.1 0.0001868 0.00406 反义 13
Lnc-ATF6B-1:4 41.99 5.78 5.88 8.03 3.64 e - 005 0.00154 感觉 13

最高的前十名mrna学位coexpression网络。

Coexpression网络E Coexpression网络维 A-coexpression网络E A-coexpression网络维
新的高度 29日 AQP8 47 新的高度 35 CAMK2B 61年
INHBA 26 STRADB 47 MAD2L1 34 STRADB 60
TSTA3 24 GRIA3 46 E2F7 34 LTK 57
RFC3 24 SCN7A 46 CCNE1 32 PDZK1 56
POLR3K 24 AGTR1 46 INHBA 32 FGF18 55
CCNE1 24 EEF2K 46 RNASEH2A 30. SEMA3E 54
ZYX股票 23 支队伍 46 RFC3 29日 SCIN 54
ALYREF 23 CAMK2B 44 CLSPN 29日 风场 53
BRCA2 22 CNTN1 44 NME1 29日 IGF1 53
MAD2L1 21 IGF1 44 ERCC6L 28 BMP3 52

lncRNA-mRNA coexpression网络。(a - b) LncRNAs升高或降低概要文件和mrna的重要术语和KEGG富集分析,分别选择构建coexpression网络D E和结肠ACS。(c - D) LncRNAs显著上升/下降模型资料和angiogenesis-related和KEGG物品,分别选择构建A-coexpression网络D E和结肠ACS。节点代表度lncRNAs mrna(绿色和黄色)。线表示交互和节点大小代表程度值。

最高的前十名lncRNAs学位A-coexpression网络E / D。

基因 数控 LGIN HGIN CC P 价值 罗斯福 类型 学位
LncRNAs高架的概要文件
Lnc-ZBTB20-2:1 32.95 48.38 41.53 94.12 0.0001576 0.00367 感觉 22
Lnc-CENPH-2:1 718.1 1438.07 1182.1 3286.29 0.0003228 0.0056 感觉 20.
Lnc-PAQR4-2:1 450.98 753.46 692.77 1489.34 0.0032726 0.0229 感觉 19
Lnc-SRGN-1:2 3.78 6.76 5.07 16.83 0.0059561 0.034 基因间的 19
NR_045669 94.62 135.86 126.36 246.74 8.6 e - 006 0.000666 反义 18
Lnc-GRASP-2:2 5 13.63 12.86 40.9 0.0012449 0.0125 感觉 18
NR_036480 90.08 160.88 152.83 351.49 0.0001743 0.00391 反义 18
Lnc-BDKRB1-3:1 1199.21 1623.17 1474.82 2825.3 0.0005168 0.00739 感觉 18
Lnc-TXNDC3-1:1 146.23 288.55 263.33 624.69 0.001605 0.0146 基因间的 17
ENST00000455309 140.37 210.07 197.67 369.84 0.0093281 0.0455 反义 17

LncRNAs下行的概要文件
ENST00000513255 193.19 58.84 55.95 67.08 < 1 e-07 5.34 e - 005 反义 12
NONHSAT057082 28.11 6.37 6.24 7.91 2.31 e - 005 0.00117 感觉 11
Lnc-SRSF5-1:1 8.49 3.84 3.77 4.14 1.61 e - 005 0.000956 基因间的 11
Lnc-CCDC14-2:2 68.74 7.14 5.92 10.93 5.71 e - 005 0.00201 感觉 11
ENST00000617921 173.45 13.12 9.11 22.58 1.7 e - 006 0.00027 基因间的 11
Lnc-RAG1-5:1 427.82 137.02 132.72 154.63 0.000499 0.00724 感觉 10
Lnc-TMTC3-5:4 84.52 4.05 4.46 8.36 < 1 e-07 < 1 e-07 基因间的 10
Lnc-SLC10A6-5:1 32.91 12.69 12.13 13.98 0.0044594 0.0281 感觉 10
Lnc-GCNT1-6:1 24.59 4.32 4.44 5.47 < 1 e-07 < 1 e-07 感觉 10
NR_126337 101.45 35.03 33.64 38.33 0.0048936 0.0299 基因间的 10

血管生成是肿瘤生长和发展的一个至关重要的一步。血管生成开关已经观察到腺瘤阶段ACS ( 24]。我们建造angiogenesis-related lncRNA-mRNA coexpression网络(A-coexpression网络E和D)与度大大提升/降低集群以及去条款和KEGG通路与血管生成有关。A-coexpression网络E包含649个节点和2299边缘(图 4(c))和顶部中心基因新的高度(mRNA,度= 35),MAD2L1 (mRNA,度= 34),E2F7 (mRNA,度= 34),lnc-ZBTB20-2:1 (lncRNA程度= 22),lnc-CENPH-2:1 (lncRNA程度= 20),和lnc-PAQR4-2:1 (lncRNA程度= 19)(表 2 3)。顶部中心基因A-coexpression网络D(图 4(d)) CAMK2B (mRNA,度= 61),STRADB (mRNA,度= 60),LTK (mRNA,程度= 57),ENST00000513255 (lncRNA程度= 12),NR_024605 (lncRNA程度= 11),和NONHSAT057082 (lncRNA程度= 11)(表 2 3)。所有的度主要参与血管生成的关键基因在每个网络。

3.5。TF监管网络的建设

探讨转录水平的基因调控机制,我们构造两个交互网络(TF-DEG网络(图 5(一个)(图)和TF-angiogenesis-DEG网络 5 (b)TFs之间)和度,起源于coexpression网络或A-coexpression网络。TF-DEG网络包含99监管模型和402节点涉及85 TFs(图 5(一个)),其中三个TFs,即LUN-1 (TF、学位= 218),Tel-2 (TF、学位= 22)和十月一日后(TF、学位= 20),是监管超过20节点(表 4)。LUN-1最高学位,可能扮演更重要的角色在TF监管网络。lncRNAs受最TFs NR_103548, lnc-ARRDC3-1:16, ENST00000513626, ENST00000516496(由六个TFs)。TF-angiogenesis-DEG网络中,由于LUN-1的重要作用(TF,度= 73)和Tel-2 (TF,度= 18)在CC的进展,一个子网构造(图显示其对血管生成的影响函数 5 (b)和表 4)。

转录因子(TF)监管网络。(一)之间的相互作用网络TFs和度,起源于显著模型配置文件。(b)之间的相互作用网络TFs和度,起源于angiogenesis-related模型配置文件。黄色的节点代表TFs,红色节点代表lncRNAs,才节点代表mrna。

关键转录因子(TFs)监管网络。

TFs 学位 TFs 学位
TF-DEGs网络 TF-angiogenesis-DEGs网络
LUN-1 218年 LUN-1 73年
Tel-2 22 Tel-2 18
十月一日后 22 MEF-2 13
RSRFC4 20. POU3F2 9
POU3F2 20. 十月一日后 9
MEF-2 20. RSRFC4 7
STE11 19 PPAR-alpha 5
Evi-1 18 MADS-A 4
STAT5B 16 Brachyury 4
IRF-1 12 STAT5A 3
3.6。存在验证候选基因

根据探针的信号值,类型,度褶皱变化,学位的价值,和蛋白质的编码能力,五LncRNAs选择从上面的网络扩大临床样本的验证(62年70数控,58所栽,27日高,pMMR CC,和8 dMMRCC样本)。LncRNAs ENST00000545920、ENST00000521815 ENST00000609220, ENST00000603052顺序提出了一个增加的趋势在表达与肿瘤恶化(数字 6(一)- - - - - - 6 (d)),而NR_026543顺序显示下降趋势(图 6 (e))。观察没有明显的统计学差异的表情NR_026543和ENST00000521815 LGIN, HGIN,和pMMR CC。然而,每个组的表达水平明显升高或降低与数控样品相比,表明这些基因可以用来区分正常和病变组织。此外,ENST00000603052的表情,ENST00000521815, ENST00000609220明显不同pMMR CC和dMMR CC组织样本(数据 6 (f)- - - - - - 6(j)),表明这三个基因可以从dMMR CC区分pMMR CC。

存在验证候选基因。ENST00000521815 ENST00000545920 (a) (b), ENST00000609220 (c)和ENST00000603052顺序(d)提出了一个上升趋势表达与肿瘤进展,而NR_026543 (e)显示顺序递减的趋势。ENST00000521815的表达(f), ENST00000603052 (h)和ENST00000609220 (i)显示统计学意义差异pMMR CC和dMMR CC。然而,ENST00000609220的表达(g)和NR_026543 (j)两组没有显著差异。

3.7。诊断选择lncRNAs的效果

上述所选五lncRNAs的诊断疗效评估作为潜在生物标志物pMMR CC诊断癌胚抗原(CEA)相比,传统的血清肿瘤生物标志物。ENST00000521815的特异性,ENST00000603052、ENST00000609220 NR_026543, ENST00000545920, CEA和0.981,1,0.962,0.932,0.981,和0.904,敏感性分别为0.931,0.864,0.746,0.846,0.576,和0.593,分别。ROC分析显示显著更高的AUC lncRNAs ENST00000521815, ENST00000603052, ENST00000609220, NR_026543与CEA (0.785) ( P = 0.0001 分别为,0.0002,0.0028,和0.0011)(数据 7(一)- - - - - - 7 (d))。没有统计上的显著差异之间的AUC观察ENST00000545920(0.794)和CEA ( P = 0.8734 )(图 7 (e))。

诊断选择lncRNAs的效果。与东航相比,ENST00000521815 (a), ENST00000603052 (b), ENST00000609220 (c)和(d) NR_026543明显较大的auc (auc 0.957, 0.958, 0.933, 0.949和0.785, P = 0.0001 ,0.0002,0.0028,和0.0011,分别)。然而,没有统计上显著的差异的AUC ENST00000545920(0.794)和CEA ( P = 0.8734 CEA) (e)。中华民国曲线所示蓝色,而中华民国曲线的验证lncRNAs绿色所示。

4所示。讨论

在人类转录组中,超过90%的非编码rna (ncRNAs),包括小分子核糖核酸(microrna) lncRNAs,圆形rna (circRNAs) [ 20.]。作为一个相对较新的领域,积累了研究发现lncRNAs在致肿瘤性的关键角色 21, 25]。在微数组技术的提高和新一代测序技术,大规模的异常表达lncRNAs被发现在多种癌症,包括乳腺癌[ 22),胃癌 23],CRC [ 26),肺癌 27),和胰腺癌 28]。

大部分结肠腺瘤可以通过一个动态的过程转化为腺癌与多个突变的积累和超自然的信号通路的激活 13]。改变lncRNA表达模式microsatellite-stable大肠癌表明一些lncRNAs被不断调节/ adenoma-adenocarcinoma序列中表达下调( 29日]。不同于以往的研究,集中在一个或多个lncRNAs CRC ( 30.- - - - - - 32),我们首先利用基因芯片进行了系统和全面的分析,揭示了差异表达的lncRNAs mrna在恶性pMMR CC的进化过程。成千上万的成绩单在ACS识别特异表达,包括5783 lncRNAs和4483 mrna。随后,STC分析显示,腺瘤是一个中间步骤从正常组织到CC和某些lncRNAs参与这一连续过程。失调可以检测到已经在腺瘤,可以使用这些lncRNAs CC的筛查和早期诊断的生物标志物。

去注释和KEGG通路进行分析来确定函数的差异表达lncRNAs ACS。去注释表明异常记录主要富集在多细胞生物的发展,细胞分裂,细胞粘附、细胞周期、细胞分化、细胞有丝分裂,蛋白质水解和血管生成。KEGG富集分析显示,提供成绩单主要参与代谢途径,途径在癌症、细胞周期,PI3K-Akt信号通路,嘌呤代谢。参与细胞周期分析被确认。不受控制的肿瘤癌症和细胞周期是一个重要的特点是造成异常的细胞周期蛋白包括细胞周期蛋白依赖性激酶,极光激酶,Polo-like激酶。利用细胞周期的关键分子可能为癌症治疗提供一个新的视角 33]。

进一步探索底层函数ACS的lncRNAs coexpression lncRNAs与它们相关的编码基因进行基于关联的程度。前十名的升高和降低lncRNAs学位,NR_029374与12度调节,获得的结果一致通过太阳et al。 34)报道,NR_029374是调节在CC和相关总体存活率较差。NR_029374促进迁移、入侵和转移的CC通过miR-30-5p / SOX9轴,这一发现是由以前的结果 35]。NR_029374调节在肝细胞癌(HCC),明显促进肝细胞增殖、迁移和血管生成 35]。

血管生成在肿瘤发生和发展中扮演着重要角色,提供营养和排泄代谢废物( 36]。最近,几个lncRNAs和mrna被证明参与肿瘤血管生成。的Upregulation lncRNA FLANC移植促进血管生成,延长半衰期的磷酸化STAT3 / VEGFA CRC ( 37]。在目前的研究中,我们发现新的高度(mRNA,度= 35),切口的跨膜受体家族的一员,最高学位。吴等人报道过表达协会新的高度与CRC生存( 38]。新的高度表达水平尤其是在非小细胞肺癌组织中高于数控组织,与肿瘤大小和TNM阶段( 39]。活跃的新的高度可能抑制内皮体外和体内发芽 40]。进一步的研究需要确定新的高度的表达水平在一个大的人口pMMR CC患者和底层交互lncRNAs血管生成。几个lncRNAs已经证明与TFs在肿瘤发生和发展的互动。例如,lncRNA SNHG15阻塞蛞蝓的泛素化和退化,流转很快TF的关键控制癌细胞浸润和转移,从而促进CC进展( 41]。的转录lncRNA LINC01503被TF TP63激活,导致食管鳞状细胞癌患者生存时间短( 42]。在目前的研究中,lncRNA-TF网络分析表明LUN-1最高学位TF-DEG网络和TF-angiogenesis-DEG网络。

存在分析显示的upregulation ENST00000545920、ENST00000521815 ENST00000609220, ENST00000603052 NR_026543的差别,对这些肿瘤的进展。此外,ENST00000603052 ENST00000521815, ENST00000609220可以用来识别pMMR CC和dMMR CC。先前的研究揭示了upregulation ENST00000545920,也称为lnc-SNHG1,在CRC ( 41),非小细胞肺癌( 43),胃癌 44),和神经胶质瘤 45)与EZH2互动促进癌细胞生长的细胞核和mir - 154 - 5 - p在细胞质中 46]。观察到类似的结果在其他肿瘤,包括ENST00000521815,也称为CASC19,具有致癌作用通过针对mir - 140 - 5 - p / CEMIP CRC进展( 47]。NR_026543的差别,对这些基因与肝转移和预后不良相关绑定mir - 203 CC的启动子( 48]。ENST00000609220被发现CRC组织中高度表达,促进CRC增长和转移通过mir - 206 / YAP1轴( 49]。到目前为止,几乎没有知识ENST00000603052癌症的功能。

最终确定的诊断效力lncRNAs是血清CEA值。大多数选择lncRNAs实现稍高的AUC CC与正常组织区分开来。需要进一步的研究来验证这些lncRNAs作为早期诊断的生物标志物的CC通过测量血清样本的表达来评估组织样本的一致性。监控这些基因的表达变化可能也提供了一个新的策略来评估疾病进展。

本研究有一定的局限性。首先,样本容量相对较小,从而限制了结果的可靠性。我们增加了一些临床样本确认lncRNAs的功能。第二,我们只对结肠组织构建的表达谱。需要更多的研究来评估组织与其他肿瘤。最后,与高通量测序相比,微阵列是lncRNAs无法识别小说。

5。结论

总之,我们验证了一系列差异表达lncRNAs和mrna在正常mucosa-adenoma-pMMR CC序列在当前的研究中。这些rna的潜在角色通过生物信息学分析预测。这些结果可能为诊断和治疗提供新的见解pMMR CC的策略。还需要进一步的研究来提供健壮的验证功能的证据lncRNAs CC。

数据可用性

期间产生的所有数据或分析本研究包括在发表的这篇文章及其补充信息文件。

信息披露

这手稿被送到研究广场作为预印(https://www.researchsquare.com/article/rs-47627/v1.pdf);然而,它没有被发表在其他地方全部或部分。资助机构没有参与研究设计、数据收集、数据解释,或写的手稿。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

Wenkun李和李钱同样贡献了这个工作。

确认

这项工作得到了消化下的北京医院权威医学协调发展中心批准号XXZ015,医疗卫生公共基础下的北京批准号ywjkjjhkyjj b17262——067年,中国国家铁路集团科技开发项目批准号下N2019Z004。

补充材料

额外的文件1。质量控制样品RNA的结果。额外的文件2。质量控制芯片的结果。

布雷 F。 Ferlay J。 Soerjomataram 我。 西格尔 r . L。 托瑞 l。 Jemal 一个。 2018年全球癌症统计数据:GLOBOCAN估计36癌症的发病率和死亡率全球185个国家 CA:临床医生的癌症杂志》上 2018年 68年 6 394年 424年 10.3322 / caac.21492 2 - s2.0 - 85053395052 贝利 c, E。 彭译葶。 y . N。 增加差异在结肠癌和直肠癌的发病率与年龄相关的在美国,1975 - 2010 JAMA手术 2015年 150年 1 17 22 10.1001 / jamasurg.2014.1756 2 - s2.0 - 84921666566 W。 R。 Baade p D。 在2015年,中国癌症统计数据 CA:临床医生的癌症杂志》上 2016年 66年 2 115年 132年 10.3322 / caac.21338 2 - s2.0 - 84960796740 Dienstmann R。 Vermeulen l Guinney J。 Kopetz 年代。 Tejpar 年代。 Tabernero J。 共识分子亚型和精密医学结直肠癌的进化 自然评论癌症 2017年 17 2 79年 92年 10.1038 / nrc.2016.126 2 - s2.0 - 85008339326 Fearon e·R。 结直肠癌的分子遗传学 年度回顾病理:疾病的机制 2011年 6 1 479年 507年 10.1146 / annurev -中草药- 011110 - 130235 2 - s2.0 - 79751489596 Fearon e·R。 福格斯坦 B。 结直肠肿瘤发生的遗传模型 细胞 1990年 61年 5 759年 767年 10.1016 / 0092 - 8674 (90)90186 - i 2 - s2.0 - 0025312728 Carethers j . M。 荣格 b . H。 遗传学和基因生物标记在零星的结肠直肠癌 胃肠病学 2015年 149年 5 1177年 1190年 e1173 10.1053 / j.gastro.2015.06.047 2 - s2.0 - 84943234285 格雷迪 w·M。 Carethers j . M。 基因组和表观遗传不稳定在结直肠癌发病机制 胃肠病学 2008年 135年 4 1079年 1099年 10.1053 / j.gastro.2008.07.076 2 - s2.0 - 53049087109 沃尔特 一个。 Houlston R。 汤姆林森 我。 协会之间的染色体不稳定和结肠直肠癌的预后:一个荟萃分析 肠道 2008年 57 7 941年 950年 10.1136 / gut.2007.135004 2 - s2.0 - 46349086833 本森 答:B。 3日 Venook 答:P。 暴饮暴食 l 结肠癌,1.2017版本,会发现在肿瘤临床实践指南 美国国家综合癌症网络杂志:JNCCN 2017年 15 3 370年 398年 10.6004 / jnccn.2017.0036 2 - s2.0 - 85016215716 萨金特 d . J。 Marsoni 年代。 孟淑娟 G。 错配修复缺陷的预测缺乏有效性的标志在结肠癌氟尿嘧啶的辅助治疗 临床肿瘤学杂志 2010年 28 20. 3219年 3226年 10.1200 / jco.2009.27.1825 2 - s2.0 - 77954748953 莱斯利 一个。 凯里 f。 普拉特 n R。 斯蒂尔 r . j . C。 结直肠adenoma-carcinoma序列 英国外科杂志》 2002年 89年 7 845年 860年 10.1046 / j.1365-2168.2002.02120.x 2 - s2.0 - 0036063069 Z。 Z。 通用电气 W。 分析潜在的与大肠癌相关基因和通路正常mucosa-adenoma-carcinoma序列 癌症医学 2018年 7 6 2555年 2566年 10.1002 / cam4.1484 2 - s2.0 - 85045737511 布伦纳 H。 Kloor M。 c·P。 结肠直肠癌 《柳叶刀》 2014年 383年 9927年 1490年 1502年 10.1016 / s0140 - 6736 (13) 61649 - 9 2 - s2.0 - 84899628178 Z。 l J。 N。 Y。 P。 综合分析长非编码rna和信使rna表达谱marjolin溃疡患者 医学科学箴言报:国际医学杂志的实验和临床研究 2018年 24 7828年 7840年 10.12659 / msm.911177 2 - s2.0 - 85055907739 M。 X。 B。 LncRNA SATB2-AS1抑制肿瘤转移,影响结直肠癌的肿瘤免疫细胞微环境调节SATB2 分子癌症 2019年 18 1 135年 10.1186 / s12943 - 019 - 1063 - 6 2 - s2.0 - 85071980744 c·J。 C . C。 J。 的lncRNA UCA1促进增殖、迁移、免疫逃避和抑制细胞凋亡在胃癌寄食于抗肿瘤microrna 分子癌症 2019年 18 1 115年 10.1186 / s12943 - 019 - 1059 - 2 2 - s2.0 - 85071625470 Q。 N。 老挝 Y。 可变长非编码RNA表达DNA水平不匹配repair-proficient早期结肠癌 消化道疾病与科学 2017年 62年 5 1235年 1245年 10.1007 / s10620 - 017 - 4465 - 6 2 - s2.0 - 85011636527 Yoav B。 Yosef H。 控制错误发现率:一种实用和强大的多个测试方法 皇家统计学会杂志》:系列B(方法论) 1995年 57 289年 300年 10.1111 / j.2517-6161.1995.tb02031.x X。 H。 谢霆锋 G。 m . T。 w·K。 在黑素瘤长非编码rna 细胞增殖 2018年 51 4 e12457 10.1111 / cpr.12457 2 - s2.0 - 85050029587 Y。 Fullwood m·J。 角色、功能和机制的非编码rna在癌症 基因组学、蛋白质组学和生物信息学 2016年 14 1 42 54 10.1016 / j.gpb.2015.09.006 2 - s2.0 - 84960115390 Y.-Z。 Y.-R。 X.-E。 三阴性乳腺癌的转录组分析揭示了一个集成mRNA-lncRNA签名与预测和预后价值 癌症研究 2016年 76年 8 2105年 2114年 10.1158 / 0008 - 5472. - 15 - 3284 2 - s2.0 - 84965029321 K。 H。 H。 全基因组lncRNA微阵列分析识别小说流传lncRNAs检测胃癌 开展 2017年 7 1 213年 227年 10.7150 / thno.16044 2 - s2.0 - 84999861030 Staton c。 Chetwood 答:美国。 卡梅隆 i . C。 交叉 美国年代。 布朗 n . J。 里德 m·w·R。 腺瘤的血管生成开关发生阶段的腺瘤癌序列在结肠直肠癌 肠道 2007年 56 10 1426年 1432年 10.1136 / gut.2007.125286 2 - s2.0 - 34948861008 桑切斯Calle 一个。 河村建夫 Y。 山本 Y。 Takeshita F。 Ochiya T。 新兴的角色长非编码RNA在癌症 癌症科学 2018年 109年 7 2093年 2100年 10.1111 / cas.13642 2 - s2.0 - 85049328919 山田 一个。 P。 W。 Okugawa Y。 博兰 c·R。 戈埃尔 一个。 RNA-Sequencing方法识别的小说在结直肠癌长非编码RNA生物标志物 科学报告 2018年 8 1 575年 10.1038 / s41598 - 017 - 18407 - 6 2 - s2.0 - 85043523638 Z。 J。 B。 全基因组分析长非编码RNA表达谱在肺腺癌 科学报告 2017年 7 1 15331年 10.1038 / s41598 - 017 - 15712 - y 2 - s2.0 - 85033564627 穆勒 年代。 Raulefs 年代。 布鲁斯 P。 下一代测序揭示小说不同监管mrna, lncRNAs microrna, sdRNAs和piRNA胰腺癌 分子癌症 2015年 14 94年 10.1186 / s12943 - 015 - 0358 - 5 2 - s2.0 - 84928818841 Bartley a . N。 H。 Barkoh b。 复杂的改变微rna表达模式在adenoma-adenocarcinoma序列microsatellite-stable结肠直肠癌 临床癌症研究 2011年 17 23 7283年 7293年 10.1158 / 1078 - 0432. - ccr - 11 - 1452 2 - s2.0 - 82555189387 局域网 Z。 X。 太阳 K。 一个。 年代。 X。 之间的交互lncRNA SNHG6 hnRNPA1有助于大肠癌的生长,提高有氧糖酵解PKM的可变剪接的调控 在肿瘤领域 2020年 10 363年 10.3389 / fonc.2020.00363 H。 M。 X。 lncRNA PVT1促进肿瘤发生结直肠癌的稳定miR-16-5p和交互VEGFA VEGFR1 / AKT轴 分子Therapy-Nucleic酸 2020年 20. 438年 450年 10.1016 / j.omtn.2020.03.006 X。 局域网 Z。 Q。 一个。 年代。 X。 在结直肠癌LncRNA SNHG6具有致癌作用,可以作为实体肿瘤的预后的生物标志物 细胞生理学杂志 2020年 235年 7620年 7634年 奥托 T。 Sicinski P。 细胞周期蛋白作为有前途的癌症治疗的目标 自然评论癌症 2017年 17 2 93年 115年 10.1038 / nrc.2016.138 2 - s2.0 - 85010843462 太阳 T。 Z。 R。 长非编码RNA LEF1-AS1促进迁移,结肠癌细胞侵袭转移通过miR-30-5p / SOX9轴 OncoTargets和治疗 2020年 13 2957年 2972年 10.2147 / ott.s232839 越南盾 H。 江ydF4y2Ba P。 M。 l 沉默的长非编码RNA LEF1-AS1防止肝细胞癌的进展通过相声微RNA - 136 - 5 - p / WNK1 细胞生理学杂志 2020年 235年 10.1002 / jcp.29503 福克曼 J。 血管生成在肿瘤的生长和转移的作用 在肿瘤学研讨会 2002年 29日 6 15 18 10.1016 / s0093 - 7754 (02) 70065 - 1 Pichler M。 Rodriguez-Aguayo C。 不结盟运动 s Y。 治疗的潜力FLANC,小说primate-specific长非编码RNA在结肠直肠癌 肠道 2020年 69年 1818年 1831年 G。 Z。 J。 新的高度是一种新型的预后标记与结直肠癌相关进展和预后 癌症杂志》 2018年 9 13 2374年 2379年 10.7150 / jca.26359 2 - s2.0 - 85049209923 Y。 R。 X。 评价的相关性vasculogenic模仿,新的高度DLL4和KAI1 / CD82在预测非小细胞肺癌的转移和预后 医学 2018年 97年 52 e13817 10.1097 / md.0000000000013817 2 - s2.0 - 85059241772 k·G。 X。 l 激活新的高度抑制血管生成:角色 β1-integrin激活 分子和细胞生物学 2002年 22 8 2830年 2841年 10.1128 / mcb.22.8.2830 - 2841.2002 2 - s2.0 - 0036198525 H。 T。 Y。 长非编码RNA SNHG15与稳定转录因子蛞蝓和促进结肠癌进展 癌症的信 2018年 425年 78年 87年 10.1016 / j.canlet.2018.03.038 2 - s2.0 - 85044955734 j j。 y y。 Y。 Super-enhancer-driven长非编码RNA LINC01503,由TP63监管过度和鳞状细胞癌的致癌 胃肠病学 2018年 154年 8 2137年 2151年 e2131 10.1053 / j.gastro.2018.02.018 2 - s2.0 - 85047738465 Q。 年代。 Y。 D。 京ydF4y2Ba W。 T。 长非编码RNASNHG1promotes非小细胞肺癌进展了应承担的必经regulatingMTDH viasponging米尔145 - 5 - p 美国实验生物学学会联合会杂志 2018年 32 7 3957年 3967年 10.1096 / fj.201701237rr 2 - s2.0 - 85049363858 W。 J。 Lei P。 l X。 LncRNA SNHG1提升HGC-27通过mir - 140细胞生长和迁移/ ADAM10轴 国际期刊的生物大分子 2019年 122年 817年 823年 10.1016 / j.ijbiomac.2018.10.214 2 - s2.0 - 85056151159 H。 Y。 J。 SNHG1促进恶性神经胶质瘤细胞的生物学行为通过微rna - 154 - 5 - mir - 376 p / b - 3 - p - FOXP2 KDM5B参与积极的反馈回路 实验和临床癌症研究杂志》:CR 2019年 38 1 59 10.1186 / s13046 - 019 - 1063 - 9 2 - s2.0 - 85061157430 M。 X。 K。 长非编码RNA SNHG1调节大肠癌细胞生长通过交互EZH2和mir - 154 - 5 - p 分子癌症 2018年 17 1 141年 10.1186 / s12943 - 018 - 0894 - x 2 - s2.0 - 85054053009 X.-D。 J。 Y.-S。 C。 F。 长非编码RNA的功能角色CASC19 / mir - 140 - 5 - p / CEMIP轴在结直肠癌progressionin体外 世界胃肠病学杂志》上 2019年 25 14 1697年 1714年 10.3748 / wjg.v25.i14.1697 2 - s2.0 - 85064512816 l Z。 K。 长非编码RNA B3GALT5-AS1抑制结肠癌肝转移通过抑制微RNA - 203 老化 2018年 10 12 3662年 3682年 10.18632 / aging.101628 2 - s2.0 - 85059326013 越南盾 X。 Z。 H。 D。 X。 长非编码RNA mir4435-2HG促进结直肠癌扩散和转移通过mir - 206 / YAP1轴 在肿瘤领域 2020年 10 160年 10.3389 / fonc.2020.00160