文摘

背景。肝细胞癌(HCC)的特异性和敏感性的诊断标记有限,阻碍HCC患者的早期诊断和治疗。因此,提高肝癌患者的预后标志物是迫切需要的。方法。HCC-related数据集从公共数据库下载。肝细胞癌之间差异表达基因(度)和相邻nontumor肝组织被识别。此外,在四个数据集度的交集(GSE138178, GSE77509 GSE84006, TCGA)是用于功能性浓缩、和模块获得的基因coexpression网络。考克斯和用于识别总体存活率kaplan - meier分析——(OS)相关基因基因从模块。 OS-related基因是为了执行进行蛋白质交互网络。至少绝对收缩和发现的特征基因选择算子(套索)。此外,中心基因被确定通过单变量Cox模型,之后中心基因和通路之间的相关分析探讨了。最后,渗透在肝癌免疫细胞类型进行了分析。结果。共有2227个调节基因和1501度使之抑制了在所有四个数据集,这主要是参与细胞周期和视黄醇的新陈代谢。因此,998年OS-related基因筛选构建套索模型。最后,8功能基因(BUB1、CCNB1 CCNB2, CCNA2, AURKB, CDC20, OIP5,和TTK)。CDC20展示了作为一个贫穷的预后基因在肝细胞癌和主要参与细胞周期。此外,一个积极的高度之间的相关性是指出渗透Th2和CDC20。结论。高表达的CDC20预测贫穷的生存,作为治疗肝癌的潜在目标。

1。介绍

肝细胞癌(HCC)是一种常见的形式,大约90%的肝癌(1]。它的特点是表型和分子异质性(2),患者通常没有明显临床症状在早期阶段,而不是诊断时已经发展到中、晚期。早期肝癌的诊断有较好的预后,大约占90%的5年生存率手术。如果诊断晚,术后生存率差,和复发率高3]。

生物标志物的microrna基因,lncRNAs曾被报道在肝细胞癌患者。例如,LHX3高度表达的是一个独立的预后因子和作为一个晚期的患者预后的生物标志物在肝细胞癌(4]。mir - 224和mir - 125 b也有价值的预后标志物(5]。lncRNA-D16366被确诊为减少肝细胞癌(6];然而,lncRNA-D16366在肝癌诊断和预后仍不清楚。这些生物标记物可以帮助在研究肝细胞癌的预后clinicopathology发挥互补作用的肝细胞癌(7,8]。然而,这些生物标记没有被详细研究。因此,临床特征密切相关肝细胞癌的发生应该调查更好地预测预后,同时确定潜在的预后标记。

肝脏是一个重要的器官的免疫力,肝癌细胞可以抑制免疫系统,导致肿瘤细胞增殖和免疫缺陷(9,10]。此外,免疫抑制机制有利于包容在免疫力和促进肝癌的进展(11,12]。免疫微环境已经认识到促进肝癌转移和发展(13],它已被证明是在肝细胞癌与不良预后相关。因此,为了更好地理解肿瘤相关的免疫微环境,了解肝癌的免疫景观是相关的。

在这项研究中,肝细胞癌组织和邻近nontumor组织通过生物信息学分析用于分析从公共数据库,包括基因表达数据库综合(GEO)和癌症基因组图谱(TCGA)数据库。本研究的目的是筛选功能基因的套索的特性基于基因风险评分预测肝细胞癌的预后与识别潜在目标治疗的希望。

2。材料和方法

2.1。数据预处理

RNA-sequencing原始数据371年50主要肝细胞癌和正常组织从TCGA-Liver获得肝细胞癌(TCGA-LIHC)数据集(https://portal.gdc.cancer.gov/)[14]。临床资料,包括年龄,性别,年级,肝癌患者的总生存期(OS),收集。公共肿瘤微阵列从GEO数据库获得(http://www.ncbi.nlm.nih.gov/geo/)(加入数字:GSE138178、GSE77509 GSE84006) (15]。GSE138178共98个样本,包括49对肝癌和相邻nontumor肝组织之间匹配的样本,建立了利用GPL21827安捷伦- 079487 Arraystar人类mRNA微阵列V4 (探头名称版本)。28 70名男性和女性,获得的98个样本,平均年龄 (16]。GSE77509共有60个样本,包括肝细胞癌患者中,都有三个配对样本:原发肿瘤,邻近的正常组织,和门户肿瘤血栓形成(PVTT)。本研究只关注20原发肿瘤和20邻近正常组织,选择使用GPL16791 Illumina公司HiSeq 2500 (智人)。40个样本获得34男4女,和平均年龄 (17]。GSE84006共152个样本,包括38肝癌组织和38配对相邻nontumor组织,建立了利用GPL5175 Affymetrix人类外显子1.0位数组(成绩单(基因)版本]。其中,66样品获得男10女,和平均年龄 与此同时,GPL22109样品被移除。

2.2。筛选差异表达基因

异常基因表达(表达水平过高或过低)被过滤获得表达基因和至少75%的值超过0 TCGA的表情。微分表达式之间的基因表达分析肝细胞癌肿瘤组织和邻近nontumor肝脏组织在四个数据集(TCGA, GSE138178、GSE77509 GSE84006)然后使用limma R包执行(18]。差异表达基因(度)被确定通过设置过滤阈值调整 在所有四个数据集。四个数据集的分割的度被ggVennDiagram包(19调节或度使之抑制。最后,累积分布曲线确定分割的相似性吸引度在不同样本的四个数据集。

2.3。富集分析

探索生物过程和途径参与分割的度,我们构建了基因本体论(去)基因和基因组的条款和《京都议定书》百科全书(KEGG)富集分析使用clusterProfiler包(20.在R。 去和KEGG是重要的。基因集富集分析(GSEA)当时做为了进一步探索交叉的浓缩度之间的肝细胞癌组织和邻近nontumor肝脏组织。此外,“fgsea”包R显示结果。

2.4。Coexpression网络建设

加权基因coexpression网络分析(WGCNA)可能是一个工具来识别数据,包括寻找基因有相同或相似的表达模式;模块结构研究模块和基因的关系(21]。在这项研究中,coexpression网络交叉度被用来构造“WGCNA”包21]。样本聚类分析建立了使用“hclust”功能,使用“pickSoftThressholding”功能,同时构建模块,模块之间的连接是评估(minModuleSize 30)。为了进一步研究中心的基因表型的相关性分析和模块化的基因。模块eigengene可能意思表达基因模块的价值。基因与 被称为基因中心模块。

2.5。蛋白质相互作用网络分析

考克斯和用来证实kaplan - meier (km)曲线分析的四个数据集分割的度与总生存期(OS) OS-related密切相关基因在肝细胞癌。OS-related基因 值< 0.05重要基因进行进一步分析。接下来,接受者操作特征(ROC)曲线下的面积TCGA模块的基因被发现和使用pROC GSE138178包(22]。此外, 为了建立使用的模块基因蛋白质交互使用Cytoscape (PPI)网络和可视化软件(23]。分子复杂的检测(MCODE) [24)是利用PPI网络中探索的重要模块

2.6。建设绝对最小的收缩和选择算子(套索)模型和单变量Cox回归模型

拉索是一个收缩模型,可用于减少过度拟合的可能性。前15个基因与一定程度的重要模块的基因在PPI网络被用来构建套索模块glmnet包(25在R,从而获得最简洁的套索模型。具体来说,10倍交叉验证选择惩罚项,被利用的 计算二项式偏见和作为模型的预测能力的一项指标。最后,获得的功能基因在肝细胞癌。

单变量Cox回归分析主要用于探索个体基因的独立预后影响。功能基因与预后相关基因由forestplot包在r、功能基因 被认为是对预后显著。

2.7。评估预后风险评分的功能基因的能力

基因的风险评分被用来评估个人发展肝细胞癌的风险。在这里,每个病人的风险评分计算,预测生存包中使用“coxph”功能(26]。基于风险评分中位数,肝癌患者进一步分为低/高危人群。此外,时间ROC曲线分析是由1 -,3 -,和包括5年生存民国,TCGA的包r .此外,rms包为了构造计算图表,使用常用的工具来估计预后的肿瘤和医药,此外,一致性指数和计算95%置信区间。最后,在多大程度上预测风险与实际风险评估使用校准曲线。

2.8。关键基因的表达

表示关键基因的研究探讨了外部验证使用肿瘤免疫评估资源(时间)(http://timer.cistrome.org/)数据库,其中, 的选择。

2.9。肝细胞癌的免疫细胞渗透水平

免疫细胞的渗透水平高度与肝癌的进展和预后相关,肿瘤和相邻nontumor组织而言,计算免疫细胞渗透使用单一样本基因集富集分析(ssGSEA)标志基因集(27]。此外,免疫细胞的相关探索使用ggradar包和执行相关分析,进一步探索基因和免疫之间的显著相关性。探索免疫细胞类型的差异,我们使用了CIBERSORT算法(https://cibersort.stanford.edu/22)的比例来评估免疫细胞类型(28)在肝癌样本。

2.10。统计分析

本研究使用BioInforCloud参与分析平台(http://www.bioinforcloud.org.cn)。

3所示。结果

关于这项研究的方法流程图如图1

3.1。肝细胞癌的识别度

比较nontumor组织,18101度确定GSE138178 HCC的包括9923年调节和8178个表达下调基因(图2(一个))。列图可视化的重要度的四个HCC数据集(图2 (b))。结果显示以下数据:GSE138178 18101度,11012度的GSE77509, TCGA GSE84006 9914度,12675度。其中,共有3728个交叉度的四个数据集,2227年由调节基因和1501个表达下调基因(图2 (c))。基因表达的相似性分割的度是最高的在不同的样品在HCC GSE138178和GSE84006(图2 (d))。

3.2。生物功能的肝细胞癌

如图3(一个),交叉度被证明是丰富的细胞周期和AMPK信号通路。生物过程的交叉度是主要富集在DNA复制和核糖体生物转化。此外,GSEA结果表明交叉度主要是参与细胞周期、DNA复制,和错配修复,激活的肝细胞癌。同时,propanoate新陈代谢,视黄醇新陈代谢,观察和色氨酸代谢抑制(数字3 (c)3 (d))。激活途径的交叉度是丰富和促进在肝细胞癌中扮演了重要的角色。

3.3。模块由WGCNA基因被确定

交叉度被WGCNA用于识别模块的基因,这表明,软阈值功率5时,独立是大于0.90(图4(一))。然后获得(图9 coexpression模块4 (b)),黄色的模块被发现与肝细胞癌(图显著正相关4 (c))。此外,黄色的中心基因模块与HCC相关显著(图4 (d));重要模块的基因被用于在后续研究中进一步分析。

3.4。筛选与预后相关的功能基因的基因

交叉度是用来识别OS-related TCGA基因和GSE138178考克斯和km曲线分析。TCGA OS-related基因在肝细胞癌的AUC值和GSE138178如图5(一个) OS-related基因被用于执行PPI网络(图5 (b))。最大程度的连通性的15个基因的基因PPI网络被用来构建套索模型,之后8功能基因被确定(数字5 (c)5 (d))。所有8功能基因(BUB1、CCNB1 CCNB2, CCNA2, AURKB, CDC20, OIP5,和TTK)被观察到肝细胞癌预后不良,这表明8功能基因可能是一个有用的生物标记肝癌预后(图5 (e))。建立拉索模型获得8特征与预后相关的基因,考虑到功能基因发挥重要作用使我们的注意力在肝细胞癌。

3.5。功能基因在肝细胞癌预后

高和低风险组肝癌患者基础的中等风险评分功能基因(图6(一))。1 -,3 -和生存率的auc是超过0.65(图6 (b))。诺模图被用来量化风险因素的特征基因的3年期和5年期的生存概率。有趣的是,CDC20被预后最差,这表明CDC20基因在肝细胞癌预后可能是一个中心(图6 (c))。此外,校准块被用来预测计算图表的能力,这被证明(图表现良好6 (d))。最重要的是,我们认为CDC20预后最差,这可能是一个中心的基因在肝细胞癌预后。

3.6。生物过程和CDC20的途径

的AUC CDC20指出高于0.95在所有四个数据集,这表明CDC20 HCC(图具有较高的诊断价值S1A)。比较肝细胞癌和控制四个数据集的样本,CDC20在肝细胞癌(图中印地)。邻近的正常组织比较,CDC20高出密切在HCC计时器数据库(图就是S1C)。BP的富集分析表明CDC20有正相关在细胞周期中,DNA复制起始,和有丝分裂染色体缩合,脂肪酸氧化和megahydroxylase P450通路在肝细胞癌(图负相关7(一))。此外,CDC20 KEGG通路的发现是正相关,与细胞周期和DNA复制,但他们AMPK和PPAR负相关信号通路(图7 (b))。CDC20也作为下游基因在细胞周期(图7 (c))。一般来说,与细胞周期CDC20有正相关,在肝细胞癌中扮演积极的监管。

3.7。中心基因和免疫细胞的渗透

免疫细胞的水平渗透ssGSEA所有四个数据集进行分析,其中2型T辅助(Th2)细胞和T辅助细胞(Th)被发现有一个相当高的程度的渗透,而中性粒细胞,gammadelta T细胞(Tgd)和细胞毒性细胞明显程度低渗透在肝细胞癌(数字8(一个)8 (b))。此外,负相关CDC20和树突细胞(DC)是通过相关分析(图观察到的8 (c))。图8 (d)说明了CDC20和Th2细胞之间的正相关关系。CD4记忆T细胞休息也确定最重要的渗透程度的免疫细胞在肝细胞癌(图8 (e))。结果表明,Th2细胞,Th细胞,T细胞CD4记忆休息肝细胞癌的浸润程度高。了解肿瘤免疫微环境免疫治疗肝癌提供了基础。

4所示。讨论

几项研究已经报道,某些预后基因可以作为预测HCC患者的操作系统,如基于基因签名由cdc 6, CENPE, PIK3R1, KIF11, RACGAP1 [29日),这可能是肝细胞癌的不良预后显著相关。然而,这些生物标记物不足,进一步探索生物标记肝癌是必要的。在这项研究中,一个套索和单变量Cox模型构造,8相关功能基因识别和操作系统。CDC20作为中心发现了基因与预后差根据功能基于基因风险评分。此外,Th2细胞和DCs显示ssGSEA拥有高度的渗透。

度的交集是参与细胞周期和AMPK途径。英国石油(BP)的交叉度在DNA复制和丰富Fanconi贫血通路在肝细胞癌。先前的研究表明,AMPK途径表达下调,减少大量的癌细胞的增殖和海拉,前列腺癌细胞(30.,31日),这表明激活AMPK信号可能促进肝癌的进展。各种研究报道,诱导细胞周期阻滞是为了减弱肿瘤恶化在肝细胞癌(32]。另外,激酶相互作用可以调节DNA复制,修复、细胞周期进展在肝细胞癌(33]。值得注意的是,Fanconi贫血的表达和DNA双链断裂修复基因被发现显著调节肝细胞癌(34]。这些途径可能在肝癌的发展起着重要的作用。

同时,coexpression网络分析表明黄色模块与肝细胞癌显著相关,和模块的基因可以促进肝癌的发展。肝细胞癌的预后并不乐观,998 OS-related基因通过考克斯和kaplan meier曲线分析得到。然后,152 OS-related基因模块的基因 PPI网络和套索执行模型,其中8功能基因,包括BUB1 CCNB1, CCNB2, CCNA2, AURKB, CDC20 OIP5,和TTK确认。这些基因被用来构造一个单变量Cox回归模块,所有功能基因与肝细胞癌的预后有关。其中,BUB1、CCNB2 CDC20表明在肿瘤组织中穷人生存在肝癌,这可能是治疗肝癌的潜在目标(35]。BUB1、CCNB2 CCNA2, TTK被发现与肝细胞癌预后相关,可作为肝癌的潜在生物标记(36]。此外,Cox回归模型包括OIP5和AURKB可能在HCC患者有效地预测操作系统(37]。诺模图是广泛用于癌症预后[38)在评估功能的基因。有趣的是,在功能基因,CDC20发现肝癌根据列线图的预后较差。此外,CDC20被发现的AUC值超过0.95。此外,与控制相比,超表达CDC20是明显的4个数据集。总的来说,CDC20可以作为在肝细胞癌预后的生物标志物。

大约40年前,CDC20主要是发现调节细胞周期进展(39]。最近,各种研究表明,CDC20在不同类型的肿瘤。与正常细胞相比,CDC20是过表达在乳腺癌(40],宫颈癌[41恶性胶质瘤),(42]。在这项研究中,高表达与预后不良的CDC20在HCC指出,呈正相关,细胞周期、DNA复制。细胞周期调控的异常功能导致细胞增殖,和一些蛋白质激酶的细胞周期也可能调节DNA复制(43]。这表明,细胞周期蛋白激酶可能参与了肝癌细胞的细胞增殖周期。最重要的是,CDC20是药物开发的治疗目标治疗人类恶性肿瘤(44]。

肝细胞癌,其中最恶性肝脏疾病,环境因素和肿瘤疾病有密切的关系(45)当比较肝细胞癌和健康样本,免疫细胞类型被证明是减少肝癌样本。相比之下,免疫渗透Th2细胞水平和Th细胞被发现是强烈增加肝细胞癌。CIBERSORT算法计算了免疫细胞的比例,显示CD4记忆T细胞是最大的。以前的研究已经表明T细胞,Th2细胞、NK细胞和巨噬细胞与肝细胞癌患者的预后相关(45]。研究也表明,Th2细胞因子参与了丙型肝炎病毒(HCV)发病机制,促进肝脏疾病的严重程度(46]。此外,一个积极的相关性被发现存在Th2细胞和CDC20之间,这是表示与操作系统在肝细胞癌。因此,免疫细胞和微环境可能是基底所有因素在肿瘤的发生47]。因此,CDC20可以作为一种很有前途的治疗肝癌的目标。

然而,特定的一些局限性在这项研究中应该注意的。数据从公共数据库被用于生物信息学分析。因此,进一步的研究是必要的验证CDC20治疗肝癌的临床益处。

一般来说,在四度数据集的交集建于998年coexpression网络屏幕OS-related基因由考克斯和kaplan meier分析确定。执行PPI网络和套索模型8功能基因的筛选。然后,单变量Cox模型和风险评分证明高表达的CDC20可怜的总生存期,(OS)相关基因在肝细胞癌患者。此外,Th2细胞有高度的渗透与CD20在肝细胞癌。最后,我们发现CDC20与肝癌细胞周期密切相关。因此,我们认为CDC20肝癌预后的重要标志。

5。结论

基因在肝细胞癌中心被确定通过生物信息学分析,过度的CDC20在肿瘤组织中被证明是预测穷人的生存和可能是治疗肝癌的潜在目标。

数据可用性

所使用的数据集和分析在当前研究可从相应的作者以合理的要求。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

Qiliu彭和海黄的设计研究。Chunling朱和肖易导致了文学研究和分析和解释数据。青青侯,魏Shangmou写了初稿的手稿。智张和兴阳光审查和编辑了手稿。所有作者阅读和批准了手稿。Qiliu彭和海黄的贡献同样这项工作。

确认

这项研究得到了南宁优秀的年轻科学家计划(RC20200102号和Z20210456)和中国广西自然科学基金(2018 gxnsfaa281215和2017 jja10583号)。

补充材料

补充图S1: CDC20在肝细胞癌的表达。(补充材料)