文摘

客观的。食道癌(光电子能谱)是全球最激进的恶性肿瘤之一,和一个不受欢迎的五年生存率。这研究确定特定功能基因与光电子能谱起始和进展。方法。基因表达分析TCGA的能谱策划(包含160光电子能谱和11 nontumor标本)和GSE38129(30成对光电子能谱和nontumor组织)数据集。微分表达式分析光电子能谱和nontumor组织之间进行调整 值< 0.05和| log2fold-change | > 1。加权基因coexpression网络分析(WGCNA)进行确定ESCA-specific coexpression模块和基因。此后,ESCA-specific(度)的差异表达基因有了交集。功能富集分析然后提出clusterProfiler包。蛋白质的相互作用,基因测定和中心。基因与病理分期评估中心,协会和生存分析中提出了光电子能谱的病人。结果。本研究确定91年ESCA-specific度后交叉度和TCGA ESCA-specific基因GSE38129数据集。他们相当与细胞周期进程和致癌途径p53信号通路、细胞衰老和细胞凋亡。十ESCA-specific中心基因测定,含有该模型,小家伙1B,CCNA2,疾病预防控制中心20.CDK1,DLGAP5,麻醉品11日,麻醉品20.一个,2一个,TPX推算2。他们突出与病理分期有关。其中,KIF11 upregulation能谱患者的不良预后有关。结论。集体,我们确定ESCA-specific coexpression模块和中心的基因,为未来的研究提供了基础有关机械的光电子能谱的基础。

1。介绍

食道癌(光电子能谱)排名第八的主要癌症类型以及第六届全球癌症相关死亡的主要原因1]。烟草和酒精消费光电子能谱的主要环境风险因素。五年存活率几乎是15%2]。它主要包含两个组织学亚型:食管鳞状细胞癌(约90%)和食管腺癌(10%左右)3]。病人的先进的临床表现与局部晚期和远处转移,导致不良生存的结果。此外,由于肿瘤的异质性和获得性耐药,固有耐放疗和化疗触发治疗失败和不利的存活率2]。光电子能谱治疗取决于病人和肿瘤的特性,特别是肿瘤,节点,转移TNM分期系统(4]。在早期阶段,患者适合内镜切除,而在高级阶段接受手术切除,化疗,化疗,或它们的组合4]。对于不可切除的患者能谱,全身化疗。此外,免疫疗法已成为晚期或转移患者的治疗选择(5]。尽管治疗选择一直在稳步增加,能谱的分子机制仍然不明朗。

光电子能谱的发病机制是一个多步骤的过程,包括不同阶段直到最终癌症6]。因此,关注的发生和发展的分子机制能谱可以帮助发现潜在的诊断标记或治疗的目标。加权基因coexpression网络分析(WGCNA)是一个可靠的系统生物学算法,这可能强调coexpression基因模块和有效评估coexpression模块之间的交互和临床表型(7]。该算法已被广泛用于发现癌症特异性模块和中心基因像膀胱癌7),肝细胞癌(8),和肺癌9]。有限的研究应用WGCNA方法发现光电子能谱的发病机制。例如,Nangraj等人确定中心基因之间共享巴雷特食管,通过综合分析食管腺癌的蛋白质相互作用(PPI)和WGCNA [10]。通过WGCNA,miR -92年b -3p被确定为致病基因在光电子能谱11]。综合分析WGCNA和网络药理学破译复合Kushen注入能谱治疗的分子机制(12]。在这里,本研究采用了WGCNA算法确定具体的功能模块和基因在光电子能谱,为未来的研究提供基础有关机械的光电子能谱的基础。

2。材料和方法

2.1。数据收集和预处理

光电子能谱的RNA-seq数据从癌症基因组图谱检索(TCGA)环球数码创意应用程序编程接口。基因表达分析数据(读计数)处理和转化为运用基因ID(90年版)。总的来说,160光电子能谱和11个正常组织被包括在内。微阵列表达分析30 ESCC肿瘤与邻近正常组织策划从GSE38129数据集13)的基因表达综合(地理;https://www.ncbi.nlm.nih.gov/gds/)存储库。这个数据集按照GPL571平台(人类基因组(HG-U133 a₂) Affymetrix U133A 2.0数组)。原始表达式分析被分位数background-corrected和规范化利用健壮multiarray平均(RMA)方法。

2.2。差异表达分析

(度)选择利用的差异表达基因微阵列数据的线性模型(limma;版本3.50.0)计划通过比较光电子能谱和正常组织之间的表达分析14]。匹配的 基因符号后的值t -测试计算和调整 值< 0.05和| log2fold-change | > 1被设置为选择标准。的火山和热图度被拉开了。

2.3。WGCNA

TCGA Coexpression网络分别建立和利用WGCNA GSE38129数据集包(1.69版)(15]。基因与第一25%标准偏差被选为输入基因。构造一个无标度网络,最优软阈值功率值(β;从1到20)确定的“pickSoftThreshold”功能通过计算无标度指数。皮尔森的相关矩阵进行两两基因之间的相似性评价利用“心脏”功能。此后,邻接依法确定β和皮尔森相关矩阵利用“TOMsimilarity”功能。与此同时,相应的不同(dissTOM)确定。模块和动态分段切割树算法,和类似的模块被合并成一个。模块eigengenes (MEs),第一主成分的基因表达模式在一个特定的模块被确定为每个模块。

2.4。识别ESCA-Relevant Coexpression模型

在这项研究中,最重要的关键特性是组织类型被指定为光电子能谱肿瘤和正常的标本。皮尔森MEs与临床特征之间的相关性进行了分析。模块具有最强的相关系数测定的ESCA-relevant coexpression模型。模块成员表明任何基因的intramodule连接在一个给定的模块。会员模块的绝对值越高,消极的或积极的相关性越高的基因模块eigengenes。基因的意义是用于将外部信息coexpression网络。基因的绝对值的意义越高,越高的生物意义的基因组织类型。ESCA-relevant基因在ESCA-relevant coexpression模型确定按照模块成员> > 0.5 0.8和基因的意义。

2.5。ESCA-Specific的识别度

实现度和coexpressed基因的十字路口,一个在线的web工具(http://bioinfogp.cnb.csic.es/tools/venny/index.html)是采用策划文氏图。

2.6。功能富集分析

的功能注释ESCA-specific度提出了clusterProfiler包(4.2.0版),包含基因本体论(去)和《京都议定书》百科全书的基因和基因组(KEGG)路径分析16]。去条款组成的生物过程(BP),细胞组件(CC)和分子功能(MF)。

2.7。(PPI)蛋白质间交互作用的分析

ESCA-specific PPI网络的度的基础上进行检索的搜索工具相互作用基因/蛋白质(字符串;11.0版本;https://string-db.org)在线工具17]。CytoHubba插件(18)Cytoscape软件(3.7.2章版)(19选择中心)是采用基因在PPI网络(18]。在此,前10基因基因被确定为中心。

2.8。生存分析

按照最优截断值由生存包,光电子能谱患者分层分为高、低表达组的10 ESCA-specific中心基因。团体之间进行,kaplan - meier总体存活率曲线和log-rank测试被用于比较的生存差异。

2.9。统计分析

本研究中所有的分析利用实现的R软件版本(3.5.1)。学生的t测试或Wilcoxon测试采用对比组。斯皮尔曼相关分析进行了评估10 ESCA-specific中心基因的相互作用与病理分期的光电子能谱的病人。 值< 0.05显示统计学意义。

3所示。结果

3.1。探索度的能谱

为研究基因改变的进程从正常到光电子能谱,我们之间进行差异表达分析能谱肿瘤和正常组织,TCGA和GSE38129数据集。TCGA群,与11个正常组织相比,1221个基因在1169个基因差别呈现显著的对这些著名的160年upregulation能谱显示肿瘤按照调整 值< 0.05和| log2fold-change | > 1(数字1(一)1 (b);补充表1)。同样的选择标准,在GSE38129数据集,我们决定360年调节和376个表达下调基因在30能谱肿瘤相比30 nontumor组织(数字1 (c)1 (d);补充表2)。

3.2。建立Coexpression网络和发现ESCA-Specific Coexpression模块TCGA的数据集

我们第一次策划基因表达矩阵TCGA的光电子能谱的病人群体,选择了前25%的基因差异进行后续分析。没有发现异常样本,我们进行了样本聚类树,如图2(一个)。此后,软阈值功率值设置为10(无标度拓扑R2=对构造一个无标度网络(图0.90)2 (b))。邻接矩阵和拓扑矩阵分别开发了重叠。总共9 coexpression模块是按照平均集群层次聚类和动态切割树(图2 (c))。协会coexpression模块与临床特征进行了分析。在图2 (d),黄色模块显示相关性最强的组织类型,表明这个模块是光电子能谱进展密切相关。符合模块成员> 0.8 > 0.5和基因的意义,我们决定ESCA-specific基因(数字2 (e)2 (f))。

3.3。Coexpression网络的开发和发现ESCA-Specific Coexpression模块GSE38129队列

coexpression网络也是GSE38129开发的数据集。按照mRNA表达矩阵,我们选择前25%的基因差异。如图3(一个),没有异类样本在30光电子能谱肿瘤和nontumors配对。之后,我们建立了一个无标度网络的软阈值功率值= 20(无标度拓扑R2= 0.90;图3 (b))。建设后的邻接矩阵和重叠拓扑矩阵,我们决定7 coexpression模块的基础上平均层次聚类和动态切割树(图3 (c))。在图3 (d),绿松石模块提出了最严重的组织类型,证明这个模块是光电子能谱进展密切相关。以下模块成员> 0.8 > 0.5和基因的意义,ESCA-specific基因测定(数字3 (e)3 (f))。

3.4。识别ESCA-Specific度及其生物学意义

确定ESCA-specific度,我们交叉度和ESCA-specific基因TCGA GSE38129军团。结果,91年ESCA-specific度终于确认(图4(一)和表1)。他们的生物学意义是通过去进一步评估和KEGG富集分析。在图4 (b)和表2,我们注意到,ESCA-specific度是相当与细胞周期进展,如染色体隔离,核分裂,有丝分裂核分裂,姐妹染色单体分离。此外,ESCA-specific度进行与能谱progression-relevant KEGG通路细胞周期、DNA复制、细胞衰老,基本切除修复、错配修复,p53信号通路,同源重组,核苷酸切除修复、细胞凋亡(图4 (c)和表3)。

3.5。建立PPI网络和基因发现ESCA-Specific中心

的揭露的交互ESCA-specific度,我们进行了PPI网络在线工具按照字符串。如图5(一个),有密切的相互作用蛋白质来源于ESCA-specific度。利用CytoHubba插件,我们进一步确定10 ESCA-specific中心基因,包含2一个(得分= 4.45 E + 23),该模型(得分= 4.45 E + 23),CDK1(得分= 4.45 E + 23),疾病预防控制中心20(得分= 4.45 E + 23),CCNA2(得分= 4.45 E + 23),麻醉品20.一个(得分= 4.45 E + 23),麻醉品11(得分= 4.45 E + 23),DLGAP5(得分= 4.45 E + 23),TPX推算2(得分= 4.45 E + 23)小家伙1B(得分= 4.45 E + 23;图5 (b))。这些ESCA-specific中心基因可能在光电子能谱进展发挥至关重要的作用。

3.6。协会的ESCA-Specific中心基因与病理分期的能谱

进一步分析进行评估十ESCA-specific中心的关联基因与不同病理分期的光电子能谱TCGA的患者群。我们的结果表明,该模型,小家伙1B,CCNA2,疾病预防控制中心20.CDK1,DLGAP5,麻醉品11日,麻醉品20.一个,2一个,TPX推算2在不同病理阶段提出了不同的表达式在光电子能谱的病人(数字6(一)- - - - - -6 (j))。这表明,10 ESCA-specific中心基因异常与病理分期的能谱。

3.7。协会ESCA-Specific中心基因与光电子能谱病人的预后

按照最优截断值ESCA-specific中心基因的表达,我们分层能谱TCGA患者分成高表达组该模型,小家伙1B,CCNA2,疾病预防控制中心20.CDK1,DLGAP5,麻醉品11日,麻醉品20.一个,2一个,TPX推算2(数据7(一)- - - - - -7 (j))。其中,我们指出,光电子能谱病人的高表达麻醉品11组提出了更不受欢迎的整体存活率的结果相比,那些低表达麻醉品11组。

4所示。讨论

高通量测序技术改善了我们的理解的异质性和分子基础底层光电子能谱。目前,可用生物标志物预测能谱病人的生存和具体结果仍nonsufficiently敏感。因此,本研究为发现新的有效地预测生物标志物进行能谱病人的预后WGCNA算法,最终降低病人的发病率和死亡率。

结合TCGA的度和ESCA-specific基因和GSE38129军团,我们确定91 ESCA-specific度。我们功能富集分析发现,ESCA-specific度是非常与细胞周期进程和致癌途径p53信号通路、细胞衰老和细胞凋亡。这表明ESCA-specific度在光电子能谱进展发挥至关重要的作用。此外,有著名的蛋白质之间的相互作用来源于ESCA-specific度按照PPI网络。其中,10 ESCA-specific中心基因终于确定,包含该模型,小家伙1B,CCNA2,疾病预防控制中心20.CDK1,DLGAP5,麻醉品11日,麻醉品20.一个,2一个,TPX推算2。

致瘤性的角色该模型提出了在不同癌症类型。例如,该模型具备干细胞引起前列腺癌进展通过提高Wnt-Dvl-3-beta-catenin通路(20.]。不良预后的预测和调节细胞增殖在膀胱癌(21]。通过调节其upregulation加速胶质母细胞瘤增长G1限制点进展以及Wnt-beta-catenin通路(22]。异常表达该模型受转录因子FoxM1触发神经胶质瘤的恶性进展[23]。此外,它与贫穷的生存结果以及诱发致癌作用在弥漫性大B细胞淋巴瘤(24]。异常表达该模型诱发肺鳞状细胞癌的进展通过调制CDK4 (25]。越来越多的证据证明的至关重要的作用该模型在癌症的发展过程中。例如,小家伙1B加速通过转录调节前列腺癌扩散MELK(26]。它通过激活触发肝细胞癌发展mTORC1信号[27]。它可以促进肝外胆管癌的发展物/ c-Jun信号(28]。此外,它参与的致瘤性和抗辐射性胶质母细胞瘤(29日]。为CCNA2,它可以抑制miR -219 - 5 - p,从而影响细胞增殖和细胞周期进展在光电子能谱30.]。一项研究提出了疾病预防控制中心20调节E2F1退化和thymidylate合酶表达,从而引发能谱化学抗性(31日]。此外,CDK1被认为是一个潜在的诊断和癌症进展生物标志物以及药物目标光电子能谱(32]。以前的生物信息学和实验证据已经证明了肿瘤发生的作用DLGAP在光电子能谱(533]。麻醉品11对球体能谱的形成是至关重要的细胞(34]。ScRNA-seq qPCR分析发现麻醉品20.一个具有潜在的诊断和预测能谱病人的预后(35]。为2一个,实验数据表明,它可以影响能谱细胞紫杉醇的耐药性(36]。针对TPX推算2缓解能谱进展通过削弱肿瘤生长和入侵37,38]。此外,由其upregulation林肯00337年和触发器能谱细胞自噬和耐顺铂(39]。以前出版文献和我们的研究结果的基础上,该模型,小家伙1B,CCNA2,疾病预防控制中心20.CDK1,DLGAP5,麻醉品11日,麻醉品20.一个,2一个,TPX推算2在光电子能谱发展中也起到关键作用。

目前,光电子能谱患者预后预测的方法主要取决于传统的TNM分期系统。虽然传统的TNM分期诊断和治疗干预措施是至关重要的,它不能全面揭示内在生物过程和病理发展的高异质性肿瘤微环境和个体差异。我们的研究结果表明,10 ESCA-specific中心基因(该模型,小家伙1B,CCNA2,疾病预防控制中心20.CDK1,DLGAP5,麻醉品11日,麻醉品20.一个,2一个,TPX推算2)提出的关联与病理分期,表明他们的角色在光电子能谱进展。其中,KIF11 upregulation是指示性的不利的光电子能谱病人生存的结果,表明潜在的KIF11作为光电子能谱的预后指标。

然而,有一些缺点在我们的研究中。首先,ESCA-specific中心基因的表达变化的影响在病人的预后仍有待探索。因此,在我们的未来,ESCA-specific中心基因的相互作用与患者的预后将在大规模临床监测和验证数据。此外,它是重要的考虑统计偏差,因为样本量相对较小。此外,深入调查将验证ESCA-specific中心基因的生物学意义通过体外和体内实验。

5。结论

总的来说,本研究确定了10 ESCA-specific小说中心基因标记的光电子能谱WGCNA算法基于不同的数据集,为光电子能谱精密医学提供承诺的目标。然而,需要深入探索验证特定中心基因的生物功能临床军团进入大型规模。

缩写

光电子能谱: 食道癌
TNM: 肿瘤、节点转移
WGCNA: 加权基因coexpression网络分析
TCGA: 癌症基因组图谱
地理: 基因表达综合
度: 差异表达基因
走: 基因本体论
KEGG: 京都基因和基因组的百科全书
英国石油公司: 生物过程
答: 蜂窝组件
MF: 分子功能
PPI: 蛋白质相互作用
字符串: 搜索工具检索的基因/蛋白质相互作用。

数据可用性

使用的数据来支持本研究的结果中包括文件的补充信息。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

徐魏和徐剑同样这项工作。

确认

这项工作是由重庆医学科研项目(重庆卫生委员会和科技合作项目局)(2021 msxm287)和规划决策咨询项目Shapingba科技局(Jcd202018)。

补充材料

补充表1。度的详细信息光电子能谱肿瘤与正常组织之间,TCGA队列。补充表2。度的详细信息GSE38129光电子能谱肿瘤和正常组织之间的数据集。(补充材料)