精通DNA错配修复结肠癌(pMMR CC)是最常见的零星的CC亚型。我们旨在调查长非编码rna的作用(lncRNAs) pMMR CC致癌作用。在目前的研究中,我们进行了转录组分析五个低级lncRNAs-mRNAs上皮内瘤(LGIN),五个高档上皮内瘤(HGIN),四个pMMR CC,五个正常控制(NC)组织。基因本体论(去),京都基因和基因组百科全书(KEGG)浓缩通路,和coexpression网络分析功能的阐明lncRNAs mrna和他们的相互作用。定量实时聚合酶链反应(存在)是用于验证五lncRNAs特异表达在一个大组结肠组织。接受者操作特征(ROC)曲线是用来评估候选人lncRNAs的性能。一组5783个差异表达lncRNAs和4483年发现了差异表达mrna在登录,HGIN, pMMR CC,数控样本。这些差异表达lncRNAs和mrna被分配到275年显著条款和179显著KEGG丰富通路。存在确认5的表达选择lncRNAs (ENST00000521815, ENST00000603052, ENST00000609220 NR_026543, ENST00000545920)与微阵列数据是一致的。ROC分析显示四个lncRNAs (ENST00000521815, ENST00000603052、ENST00000609220 NR_026543)有较大的ROC曲线下面积(AUC)值相比,血清癌胚抗原,从而区分数控和pMMR CC。总之,几个lncRNAs adenoma-carcinoma序列中扮演不同的角色,可以作为早期诊断的潜在生物标志物pMMR CC。
结直肠癌(CRC)是第三个全球最常见的癌症诊断,包括对2018年180万例新病例(
CRC是一种异构的疾病逐步积累的遗传和表观遗传变化(
超过90%的结直肠肿瘤发生情况下遵循adenoma-carcinoma序列(ACS),与多个基因突变和异常激活的信号通路
长非编码rna (lncRNAs)是一类非编码rna有超过200个核苷酸不翻译成蛋白质。LncRNAs可以调节基因的表达在不同层次,包括epigenetically,转录和转录后的
先前的研究CC lncRNA表达谱的一般表现在所有癌症包括直肠癌结肠在一起,从而忽视了CC的异质性分子亚型。尽管经常联系在一起,CC和直肠癌治疗时不同。迄今为止,微分表达谱在正常结肠lncRNAs mucosa-pMMR adenoma-pMMR零星的CC序列尚未报道。在目前的研究中,我们旨在描述的表达谱lncRNAs pMMR零星的恶性演化过程的CC使用转录组微阵列技术。研究结果提供有用的候选人CC的诊断和治疗。
共有244个零星的结肠组织,其中包括63腺瘤低度上皮内瘤(LGIN), 32个腺瘤高级别上皮内瘤(HGIN), 66 pMMR CC, 8 dMMR CC, 75正常控制(NC)相邻样本(≥10厘米)增生性或炎性息肉采样在北京Shijitan医院(中国,北京)从2018年到2019年。样本立即放置在RNAlater解决方案(猫。76104号,试剂盒有限公司GmBH,德国)24小时在4°C。新鲜冷冻样本存储在−RNA提取80°C。所有的患者接受有针对性的治疗,化疗,放疗,或干预治疗。本研究通过北京Shijitan医院的伦理委员会(没有。:2018 - 59)和书面知情同意了所有个人参与者包括在这项研究。
在我们之前的研究(
lncRNA和mRNA表达谱的多级结肠粘膜组织(5数控五LGIN 5 HGIN,和四个pMMR CC)样品测定与安捷伦定制SBC人类(4
原始数据标准化与分位数算法GeneSpring软件11.0(美国安捷伦科技,圣克拉拉,CA)。聚类分析进行系统地、直观地显示样本之间的相似度。四组之间的差异基因表达式(度)与F过滤测试随机方差模型(RVM)使用
基因本体论(去)分析注释度在三个类别:分子功能,生物过程和细胞组件。京都基因和基因组的百科全书(KEGG)分析识别功能途径和通路分子间的相互作用,反应,和关系网络。统计上显著的阈值被设置为
识别coexpressed lncRNA-mRNA对中心度,lncRNA-mRNA coexpression网络构建基于基因表达值和皮尔逊相关系数(PCC)之间的差异表达lncRNAs和mrna。| PCC |≥0.8
基于类型的lncRNAs异常表达式(褶皱变化),这些变化在coexpression度,和共产党的结果,CNCI,包含,PhyloCSF得分,5 lncRNAs被选来验证芯片结果。的表达水平lncRNAs检查中存在于225年结直肠组织样本。执行中存在QuantStudioTM6 Flex实时PCR系统(热费希尔,罗切斯特,纽约,美国)。引物中列出额外的文件1和3 -磷酸甘油醛脱氢酶(GAPDH)作为内生控制。每个存在反应(10
基于计算机的计算进行了使用SPSS 20.0版(美国SPSS Inc .,芝加哥,IL)和MedCalc 19.1版(MedCalc软件投资兴建,奥斯坦德,比利时)。的表达的差异选择lncRNAs在多个组比较采用方差分析。进一步两两比较进行最少的意义差异(LSD)测试。之间的差异的表达lncRNAs pMMR CC组和dMMR CC组与非参数Mann-Whitney相比
从pMMR结肠组织样本,提取的总RNA组成的五个数控五LGIN五HGIN,和四个pMMR CC样本,是转录组微阵列杂交。RNA /芯片的质量控制结果总结在附加文件1和附加文件2中,分别。规范化数据的聚类分析表明,样本每组都是分开当度被认为是(图
集群的样本。紫色代表NC组,黄色代表LGIN集团,绿色代表HGIN集团,粉色代表CC组。
总共有5783 lncRNAs和4483 mrna数控中差异表达,LGIN, HGIN, pMMR CC样本。为了生成动态和重要度的趋势模型与结肠粘膜恶性转变,优质的集群分析被用来进一步识别度与相似的表达模式。如图
优质的分析度在多级结肠粘膜组织中特异表达。(一)26集群度的表达模式,15 lncRNA表达模式,和九mRNA表达模式显示显著
度从重要的表达趋势受到和KEGG通路分析去确定其潜在功能的动态过程和机制结肠粘膜病变(图突出
去注释和KEGG浓缩通路的概述。(一)排名前20位的条款为度。(b)通路对应度前20名。
前20名的条款包括多细胞生物的发展,细胞分裂,细胞粘附、细胞周期、细胞分化、细胞有丝分裂,蛋白质水解和血管生成。KEGG富集分析显示,度主要是参与几个信号通路,包括代谢、癌症、细胞周期,PI3K-Akt信号和转录misregulation癌症(图
发现lncRNAs与肿瘤发生相关的重要分子机制在结肠ACS, lncRNAs从提升集群
最高的前十名lncRNAs学位coexpression网络E / D
| 基因 | 数控 | LGIN | HGIN | CC |
|
罗斯福 | 类型 | 学位 |
|---|---|---|---|---|---|---|---|---|
| LncRNAs高架的概要文件 | ||||||||
| Lnc-NPRL3-1:1 | 1625.59 | 2834.43 | 2901.7 | 2777.36 | 0.0037928 | 0.0253 | 感觉 | 22 |
| NR_024431 | 7.42 | 18.65 | 19 | 18.6 | 0.0035591 | 0.0242 | 基因间的 | 21 |
| ENST00000564984 | 9.17 | 18.63 | 19.15 | 18.83 | 0.002729 | 0.0204 | 反义 | 17 |
| Lnc-CLEC3A-9:1 | 10892.39 | 20059.59 | 19686.96 | 19862.6 | 0.0007135 | 0.00894 | 感觉 | 13 |
| NR_029374 | 17.3 | 41.96 | 42.92 | 39.14 | 0.0064708 | 0.0358 | 反义 | 12 |
| Lnc-MKI67IP-8:1 | 25.14 | 43.39 | 43.53 | 40.98 | 0.0044777 | 0.0282 | 反义 | 12 |
| NONHSAT064233 | 60.28 | 118.49 | 113.3 | 273.65 | 1.68 e - 005 | 0.000976 | 反义 | 11 |
| Lnc-DLX2-9:1 | 13.74 | 32.64 | 32.78 | 30.29 | 0.0038192 | 0.0254 | 反义 | 11 |
| ENST00000545920 | 202.78 | 259.09 | 260.38 | 421.62 | 0.0019042 | 0.0162 | 双向 | 10 |
| Lnc-MAP3K9-9:1 | 406.91 | 663.73 | 501年 | 1392.28 | 0.0010763 | 0.0114 | 反义 | 10 |
|
|
||||||||
| LncRNAs下行的概要文件 | ||||||||
| ENST00000435912 | 35.42 | 19.61 | 19.43 | 19.98 | 0.0083754 | 0.0425 | 反义 | 15 |
| Lnc-PDZK1-1:1 | 1838.67 | 149.47 | 119.91 | 220.16 | 0.0004298 | 0.00669 | 反义 | 14 |
| Lnc-MRPL54-2:1 | 200.94 | 123.77 | 123.05 | 125.75 | 0.0106357 | 0.0495 | 感觉 | 14 |
| ENST00000364025 | 7.73 | 3.84 | 3.78 | 3.92 | 0.0026283 | 0.0199 | 感觉 | 14 |
| Lnc-CCNB3-2:1 | 617.57 | 101.05 | 95.87 | 115.2 | 4.63 e - 005 | 0.00179 | 基因间的 | 14 |
| Lnc-CCDC14-2:2 | 68.74 | 7.14 | 5.92 | 10.93 | 5.71 e - 005 | 0.00201 | 感觉 | 13 |
| NR_003064 | 29637.97 | 1140.93 | 703.58 | 1579.91 | 6 e - 007 | 0.000143 | 基因间的 | 13 |
| Lnc-SRSF5-1:1 | 8.49 | 3.84 | 3.77 | 4.14 | 1.61 e - 005 | 0.000956 | 基因间的 | 13 |
| NR_110552 | 472.62 | 9.51 | 10.64 | 39.1 | 0.0001868 | 0.00406 | 反义 | 13 |
| Lnc-ATF6B-1:4 | 41.99 | 5.78 | 5.88 | 8.03 | 3.64 e - 005 | 0.00154 | 感觉 | 13 |
最高的前十名mrna学位coexpression网络。
| Coexpression网络E | Coexpression网络维 | A-coexpression网络E | A-coexpression网络维 | ||||
|---|---|---|---|---|---|---|---|
| 新的高度 | 29日 | AQP8 | 47 | 新的高度 | 35 | CAMK2B | 61年 |
| INHBA | 26 | STRADB | 47 | MAD2L1 | 34 | STRADB | 60 |
| TSTA3 | 24 | GRIA3 | 46 | E2F7 | 34 | LTK | 57 |
| RFC3 | 24 | SCN7A | 46 | CCNE1 | 32 | PDZK1 | 56 |
| POLR3K | 24 | AGTR1 | 46 | INHBA | 32 | FGF18 | 55 |
| CCNE1 | 24 | EEF2K | 46 | RNASEH2A | 30. | SEMA3E | 54 |
| ZYX股票 | 23 | 支队伍 | 46 | RFC3 | 29日 | SCIN | 54 |
| ALYREF | 23 | CAMK2B | 44 | CLSPN | 29日 | 风场 | 53 |
| BRCA2 | 22 | CNTN1 | 44 | NME1 | 29日 | IGF1 | 53 |
| MAD2L1 | 21 | IGF1 | 44 | ERCC6L | 28 | BMP3 | 52 |
lncRNA-mRNA coexpression网络。(a - b) LncRNAs升高或降低概要文件和mrna的重要术语和KEGG富集分析,分别选择构建coexpression网络D E和结肠ACS。(c - D) LncRNAs显著上升/下降模型资料和angiogenesis-related和KEGG物品,分别选择构建A-coexpression网络D E和结肠ACS。节点代表度lncRNAs mrna(绿色和黄色)。线表示交互和节点大小代表程度值。
最高的前十名lncRNAs学位A-coexpression网络E / D。
| 基因 | 数控 | LGIN | HGIN | CC |
|
罗斯福 | 类型 | 学位 |
|---|---|---|---|---|---|---|---|---|
| LncRNAs高架的概要文件 | ||||||||
| Lnc-ZBTB20-2:1 | 32.95 | 48.38 | 41.53 | 94.12 | 0.0001576 | 0.00367 | 感觉 | 22 |
| Lnc-CENPH-2:1 | 718.1 | 1438.07 | 1182.1 | 3286.29 | 0.0003228 | 0.0056 | 感觉 | 20. |
| Lnc-PAQR4-2:1 | 450.98 | 753.46 | 692.77 | 1489.34 | 0.0032726 | 0.0229 | 感觉 | 19 |
| Lnc-SRGN-1:2 | 3.78 | 6.76 | 5.07 | 16.83 | 0.0059561 | 0.034 | 基因间的 | 19 |
| NR_045669 | 94.62 | 135.86 | 126.36 | 246.74 | 8.6 e - 006 | 0.000666 | 反义 | 18 |
| Lnc-GRASP-2:2 | 5 | 13.63 | 12.86 | 40.9 | 0.0012449 | 0.0125 | 感觉 | 18 |
| NR_036480 | 90.08 | 160.88 | 152.83 | 351.49 | 0.0001743 | 0.00391 | 反义 | 18 |
| Lnc-BDKRB1-3:1 | 1199.21 | 1623.17 | 1474.82 | 2825.3 | 0.0005168 | 0.00739 | 感觉 | 18 |
| Lnc-TXNDC3-1:1 | 146.23 | 288.55 | 263.33 | 624.69 | 0.001605 | 0.0146 | 基因间的 | 17 |
| ENST00000455309 | 140.37 | 210.07 | 197.67 | 369.84 | 0.0093281 | 0.0455 | 反义 | 17 |
|
|
||||||||
| LncRNAs下行的概要文件 | ||||||||
| ENST00000513255 | 193.19 | 58.84 | 55.95 | 67.08 | < 1 e-07 | 5.34 e - 005 | 反义 | 12 |
| NONHSAT057082 | 28.11 | 6.37 | 6.24 | 7.91 | 2.31 e - 005 | 0.00117 | 感觉 | 11 |
| Lnc-SRSF5-1:1 | 8.49 | 3.84 | 3.77 | 4.14 | 1.61 e - 005 | 0.000956 | 基因间的 | 11 |
| Lnc-CCDC14-2:2 | 68.74 | 7.14 | 5.92 | 10.93 | 5.71 e - 005 | 0.00201 | 感觉 | 11 |
| ENST00000617921 | 173.45 | 13.12 | 9.11 | 22.58 | 1.7 e - 006 | 0.00027 | 基因间的 | 11 |
| Lnc-RAG1-5:1 | 427.82 | 137.02 | 132.72 | 154.63 | 0.000499 | 0.00724 | 感觉 | 10 |
| Lnc-TMTC3-5:4 | 84.52 | 4.05 | 4.46 | 8.36 | < 1 e-07 | < 1 e-07 | 基因间的 | 10 |
| Lnc-SLC10A6-5:1 | 32.91 | 12.69 | 12.13 | 13.98 | 0.0044594 | 0.0281 | 感觉 | 10 |
| Lnc-GCNT1-6:1 | 24.59 | 4.32 | 4.44 | 5.47 | < 1 e-07 | < 1 e-07 | 感觉 | 10 |
| NR_126337 | 101.45 | 35.03 | 33.64 | 38.33 | 0.0048936 | 0.0299 | 基因间的 | 10 |
血管生成是肿瘤生长和发展的一个至关重要的一步。血管生成开关已经观察到腺瘤阶段ACS (
探讨转录水平的基因调控机制,我们构造两个交互网络(TF-DEG网络(图
转录因子(TF)监管网络。(一)之间的相互作用网络TFs和度,起源于显著模型配置文件。(b)之间的相互作用网络TFs和度,起源于angiogenesis-related模型配置文件。黄色的节点代表TFs,红色节点代表lncRNAs,才节点代表mrna。
关键转录因子(TFs)监管网络。
| TFs | 学位 | TFs | 学位 |
|---|---|---|---|
| TF-DEGs网络 | TF-angiogenesis-DEGs网络 | ||
| LUN-1 | 218年 | LUN-1 | 73年 |
| Tel-2 | 22 | Tel-2 | 18 |
| 十月一日后 | 22 | MEF-2 | 13 |
| RSRFC4 | 20. | POU3F2 | 9 |
| POU3F2 | 20. | 十月一日后 | 9 |
| MEF-2 | 20. | RSRFC4 | 7 |
| STE11 | 19 | PPAR-alpha | 5 |
| Evi-1 | 18 | MADS-A | 4 |
| STAT5B | 16 | Brachyury | 4 |
| IRF-1 | 12 | STAT5A | 3 |
根据探针的信号值,类型,度褶皱变化,学位的价值,和蛋白质的编码能力,五LncRNAs选择从上面的网络扩大临床样本的验证(62年70数控,58所栽,27日高,pMMR CC,和8 dMMRCC样本)。LncRNAs ENST00000545920、ENST00000521815 ENST00000609220, ENST00000603052顺序提出了一个增加的趋势在表达与肿瘤恶化(数字
存在验证候选基因。ENST00000521815 ENST00000545920 (a) (b), ENST00000609220 (c)和ENST00000603052顺序(d)提出了一个上升趋势表达与肿瘤进展,而NR_026543 (e)显示顺序递减的趋势。ENST00000521815的表达(f), ENST00000603052 (h)和ENST00000609220 (i)显示统计学意义差异pMMR CC和dMMR CC。然而,ENST00000609220的表达(g)和NR_026543 (j)两组没有显著差异。
上述所选五lncRNAs的诊断疗效评估作为潜在生物标志物pMMR CC诊断癌胚抗原(CEA)相比,传统的血清肿瘤生物标志物。ENST00000521815的特异性,ENST00000603052、ENST00000609220 NR_026543, ENST00000545920, CEA和0.981,1,0.962,0.932,0.981,和0.904,敏感性分别为0.931,0.864,0.746,0.846,0.576,和0.593,分别。ROC分析显示显著更高的AUC lncRNAs ENST00000521815, ENST00000603052, ENST00000609220, NR_026543与CEA (0.785) (
诊断选择lncRNAs的效果。与东航相比,ENST00000521815 (a), ENST00000603052 (b), ENST00000609220 (c)和(d) NR_026543明显较大的auc (auc 0.957, 0.958, 0.933, 0.949和0.785,
在人类转录组中,超过90%的非编码rna (ncRNAs),包括小分子核糖核酸(microrna) lncRNAs,圆形rna (circRNAs) [
大部分结肠腺瘤可以通过一个动态的过程转化为腺癌与多个突变的积累和超自然的信号通路的激活
去注释和KEGG通路进行分析来确定函数的差异表达lncRNAs ACS。去注释表明异常记录主要富集在多细胞生物的发展,细胞分裂,细胞粘附、细胞周期、细胞分化、细胞有丝分裂,蛋白质水解和血管生成。KEGG富集分析显示,提供成绩单主要参与代谢途径,途径在癌症、细胞周期,PI3K-Akt信号通路,嘌呤代谢。参与细胞周期分析被确认。不受控制的肿瘤癌症和细胞周期是一个重要的特点是造成异常的细胞周期蛋白包括细胞周期蛋白依赖性激酶,极光激酶,Polo-like激酶。利用细胞周期的关键分子可能为癌症治疗提供一个新的视角
进一步探索底层函数ACS的lncRNAs coexpression lncRNAs与它们相关的编码基因进行基于关联的程度。前十名的升高和降低lncRNAs学位,NR_029374与12度调节,获得的结果一致通过太阳et al。
血管生成在肿瘤发生和发展中扮演着重要角色,提供营养和排泄代谢废物(
存在分析显示的upregulation ENST00000545920、ENST00000521815 ENST00000609220, ENST00000603052 NR_026543的差别,对这些肿瘤的进展。此外,ENST00000603052 ENST00000521815, ENST00000609220可以用来识别pMMR CC和dMMR CC。先前的研究揭示了upregulation ENST00000545920,也称为lnc-SNHG1,在CRC (
最终确定的诊断效力lncRNAs是血清CEA值。大多数选择lncRNAs实现稍高的AUC CC与正常组织区分开来。需要进一步的研究来验证这些lncRNAs作为早期诊断的生物标志物的CC通过测量血清样本的表达来评估组织样本的一致性。监控这些基因的表达变化可能也提供了一个新的策略来评估疾病进展。
本研究有一定的局限性。首先,样本容量相对较小,从而限制了结果的可靠性。我们增加了一些临床样本确认lncRNAs的功能。第二,我们只对结肠组织构建的表达谱。需要更多的研究来评估组织与其他肿瘤。最后,与高通量测序相比,微阵列是lncRNAs无法识别小说。
总之,我们验证了一系列差异表达lncRNAs和mrna在正常mucosa-adenoma-pMMR CC序列在当前的研究中。这些rna的潜在角色通过生物信息学分析预测。这些结果可能为诊断和治疗提供新的见解pMMR CC的策略。还需要进一步的研究来提供健壮的验证功能的证据lncRNAs CC。
期间产生的所有数据或分析本研究包括在发表的这篇文章及其补充信息文件。
这手稿被送到研究广场作为预印(https://www.researchsquare.com/article/rs-47627/v1.pdf);然而,它没有被发表在其他地方全部或部分。资助机构没有参与研究设计、数据收集、数据解释,或写的手稿。
作者宣称没有利益冲突。
Wenkun李和李钱同样贡献了这个工作。
这项工作得到了消化下的北京医院权威医学协调发展中心批准号XXZ015,医疗卫生公共基础下的北京批准号ywjkjjhkyjj b17262——067年,中国国家铁路集团科技开发项目批准号下N2019Z004。
额外的文件1。质量控制样品RNA的结果。额外的文件2。质量控制芯片的结果。