文摘

过氧物酶体proliferator-activated受体(PPARs)和目标基因的一部分已报告与肝细胞癌(HCC)的进展。肝细胞癌的预后并不乐观,更准确的预后标记是必要的。这项研究集中在发现潜在预后标记PPAR-related基因集。HCC的mRNA数据和临床信息收集从TCGA和地理平台。单变量Cox和套索Cox回归分析被用来屏幕肝癌预后的基因。三个基因(MMP1,HMGCS2,SLC27A5)参与PPAR信号通路被选为肝细胞癌的预后签名。一个公式建立了基于表达式的值和多变量Cox回归系数的选择基因,, “三基因签名的预后能力评估在TCGA肝癌三地理数据集和验证集(GSE14520, GSE36376, GSE76427)。结果表明,基于我们的签名是一个风险因素风险评分的人力资源(危险比)2.72 ( , )为肝癌生存。签名可以显著( )区分高风险和低风险患者肝细胞癌预后不良。此外,我们进一步探讨了独立和适用性的签名通过多变量Cox分析与其他临床指标( )和列线图分析( )。上述结果表明,组合MMP1,HMGCS2,SLC27一个5从PPAR信号通路中选择可以有效地独立,合用地预测肝癌的预后。我们的研究提供了新的见解,肝细胞癌的预后。

1。介绍

肝癌是常见的恶性肿瘤,其死亡率排名第四癌症相关死亡(1]。大约80%的原发性肝癌患者属于肝细胞癌(HCC)的范畴。肝细胞癌是一种发展迅速的疾病预后不良。目前,只有不到18%的肝癌患者的总生存期(OS)时间5年以上(2]。此外,由于异质性和缺乏有效的肝癌预后标记物,很难准确地预测肝癌患者的预后3,4]。迫在眉睫的是研究肝癌的预后标记,确保患者能够获得更合适和有效的治疗。

对于许多癌症类型,特定的分子标记的鉴定可以解决预后分化肿瘤异质性造成的问题,为患者提供更合适和有效的治疗。例如,喀斯特基因突变表明预测精度高转移性结直肠癌患者的预后(5],积累研究已经建立,启动子的甲基化水平管理可以用来预测temozolomide在神经胶质瘤患者的疗效6]。然而,目前没有可用的分子标记对肝细胞癌在临床应用。

过氧物酶体proliferator-activated受体(PPARs)是核受体转录因子调节生理活动如入侵、免疫耐受、代谢和炎症(7,8]。大量研究表明,肿瘤发生和癌症恶化通常伴随着异常监管的PPAR信号通路9- - - - - -12]。此外,最近的研究在肝细胞癌预后标记,它曾多次报道,PPAR信号通路在高危特异表达肝细胞癌患者预后不良(13- - - - - -15]。虽然PPAR信号通路被报道为HCC预后特点的途径之一,没有人的肝细胞癌的预后标记基因筛选参与这个途径。

在上述的背景下研究,本研究致力于从PPAR-related选择在肝细胞癌预后基因生物标记基因。基于365 TCGA肝癌样本中,我们分析了69年的mRNA水平之间的相关性PPAR-related基因和患者的总体生存。三个基因(MMP1,HMGCS2,SLC27A5)被选为预后标记。接下来,预后标记的性能评估和验证三个验证集的地理数据库。同时,这个标记和其他临床指标的影响肝癌的操作系统进行了分析和比较。最后,计算图表的开发提供预后基因生物标志物的临床应用的可能性。

2。材料和方法

2.1。样品采集和数据预处理

365年的原发性肝癌样本与生存TCGA队列中的信息被选为训练集。mRNA的三级值和相应的肝细胞癌的临床资料收集从齐娜,加州大学圣克鲁斯(加州大学)数据库。基因表达的价值观被RSEM算法获得的计数。使用UCSC齐娜雨果probeMap基因映射到参考基因组。细节的处理方法,请参阅该网站TCGA的基因组特征的北卡罗莱纳大学的中心。此外,删除low-expressed基因没有表达超过75%的患者,平均表达式的值小于1。

验证集三个HCC GEO数据库中的数据集:GSE14520 ( ),GSE36376 ( ),和GSE76427 ( )( 代表样本的数量)。我们选择了规范化mRNA数据。详情,请参阅“_series_matrix。在GEO txt”文件的三个数据集。基因注释完成根据注释文件提供的芯片测序平台(GSE14520对应GPL3921,和GSE36376 GSE76427对应GPL10558)。当一个基因匹配多个探测器,平均表达式值的多个探针被选为表达式值的基因。

此外,69年PPAR信号pathway-related基因从基因和基因组的京都百科全书(KEGG)数据库(KEGG通路ko03320)。

2.2。筛查和评估预后的基因

找到一个有效的肝细胞癌的预后基因组合PPAR信号通路相关的69个基因,首先,基于这些69个基因的表达值,我们使用了单变量Cox回归算法来分析肝细胞癌患者的操作系统。的基因 被认为是基因与肝癌的操作系统有关。随后,根据选定的候选基因,在前面的步骤中,使用套索Cox回归算法,并应用十倍交叉验证选择最好的惩罚系数、肝细胞癌预后基因的最佳组合可以获得(16]。

评估预后基因组合的有效性我们选择,我们使用方程(1)建立预测模型:

在哪里 表明基因的表达值 ;与此同时 意味着基因的系数 产生的多变量Cox回归分析。每个肝癌样本的风险评分计算根据方程(1),样品被分成高和低风险组根据风险评分的中值。评估两组生存区别显示预后基因的效率,生存率较分析。此外,我们评估基因标记的特异性和敏感性预测1 -,3 -,和肝细胞癌的5年生存率比较其他临床指标如年龄,性别,法新社,TNM分期,方法是时间接受者操作特征曲线(ROC)。基因标记的预测效果最终验证了GSE14520, GSE36376, GSE76427数据集。

2.3。检测基因签名的独立性

发现这个基因标记是否可以独立于其它临床常用的肝细胞癌的预后指标,我们应用单变量和多变量Cox回归分析方法来分析肝细胞癌患者的生存。对于可能影响肝癌预后的临床因素,我们选择了六个指标:年龄、性别、法新社、TNM分期、组织学分级、血管肿瘤入侵。风险评分和年龄被视为连续变量,而其余变量分类变量。临床指标与生存相关最初确定;然后,风险评分之间的关系和其他survival-associated生存率较临床指标进行评估。使用这些变量建立了计算图表,确定为独立的预测因素,预测1 -,3 -,5年生存率被纠正纠正的真实值和预测值之间的一致性。

2.4。统计方法

3.6.1 R软件(版本)是用于所有在本研究分析。微阵列数据分析与“GEOquery”包中,而“刨边机”包采用差异基因筛选。“生存::coxph”功能被用来进行单变量和多变量Cox分析,虽然套索Cox回归分析与基于web的工具(ESurv) [17]。“生存”的“survdiff”功能包是用于log-rank测试,和时间ROC分析也进行了“timeROC”包。热图准备“ggplot::热图”功能,而“forestplot”包是用于生成森林土地,建立了计算图表和实现“rms”包。

3所示。结果

3.1。PPAR-Related HCC预后基因

我们的研究是通过过程如图所示1。确定OS PPAR的肝癌相关基因信号通路,我们分析了365原发性肝癌样本TCGA的转录组数据,用单变量cox回归分析。25 PPAR-related基因被确定为与HCC的操作系统( )。最后,三个预后基因(包括MMP1,HMGCS2,SLC27A5)获得的套索Cox回归分析从候选人预后基因(图2)。

3.2。预后模型建立和评价

预后模型下建立评估的相关性MMP1,HMGCS2,SLC27A5肝癌病人预后的预测基于这三个基因的表达。回归系数为每个基因是通过多变量Cox回归分析,产生以下模型: 这个模型的预测效果被分配风险评估分数365 TCGA的HCC患者样本数据库(补充文件1)。在这一分析,病人在高危人群表现出明显预后差相对于低风险病人组( ;3(一个))。具体来说,高风险患者的OS中值为17.8个月,而低风险患者的OS中值为22.0个月。时间ROC分析另外执行评估1 -,3 -,和5年操作系统,产生相应的曲线下面积(AUC)值为0.702,0.694,和0.652,符合满意的模型性能( ;3 (b))。此外,高风险的分数与病人的早些时候发生的死亡事件,与更高MMP1表达和低HMGCS2SLC27A5表达式(图3 (c))。这些数据表明MMP1为肝细胞癌的预后并不有利,而HMGCS2SLC27A5是。比较我们的风险分数的预后疗效其他临床因素,另外时间ROC分析执行基于患者1年操作系统。分析风险因素,风险的得分表现出最好的预后效果,产生一个AUC值为0.702(图3 (d))。因此,这些数据表明,我们能够成功地建立一个PPAR-related HCC预后模型MMP1,HMGCS2,SLC27A5作为有效的肝癌病人预后预测指标。

3.3。验证基因签名的预后效果

多基因签名,以确保这不是预后结果过度拟合的数据,我们使用三个独立数据集GSE14520验证这个签名,GSE36376, GSE76427。高危组患者的平均操作系统(32.8个月GSE14520(图4(一)),63.7个月GSE36376(图4 (d)),11.8个月GSE76427(图4 (g))明显下降( , , )相对于低风险的患者组(GSE36376 GSE14520 53.7个月,82.7个月,在GSE76427 16.6个月),结果符合我们的训练数据集。三个数据集,AUC值1 -,3 -,和5年的操作系统是0.693,0.696,0.640(图4 (b));(图0.784、0.693和0.6524 (e));和0.566、0.632和0.784,分别(图4 (h))。此外,符合TCGA队列的结果,风险更高分数一致与早些时候发生病人的死亡事件和更高MMP1和更低的HMGCS2SLC27A5表达式(数据4 (c),4 (f),4(我))。这些结果表明,这种PPAR-related风险模型健壮的跨平台。

3.4。预后的独立基因签名

基因签名确认的独立的预测价值,我们接下来探讨肝癌患者临床特征之间的关系,风险评分,结果TCGA的队列。在单变量Cox回归分析,TNM阶段和风险评分均显著与病人相关的操作系统( )。血管肿瘤入侵和操作系统之间的相关性接近但没有达到意义( )。这三个因素被合并不多变量Cox回归分析,揭示风险评分( , , )和TNM阶段( , , )是肝癌患者生存的独立预后因素OS(图5(一个))。此外,我们发现患者是否表现出早期(I +第二阶段,图5 (b))或高级(III期+ 4,图5 (c))阶段疾病和他们是否表现出血管侵犯(数字5 (d)5 (e))预测病人的生存,突显出独立的预后价值的基因签名。

3.5。列线图建立和评价

评估我们的模型能够准确预测肝癌的临床预后,我们下一个建立了一个计算图表合并TNM阶段和风险分数作为两个独立的预后因素与HCC患者1 - 3 - 5年操作系统(图6(一))。这列线图c指数的值为0.709。校准块以上三种生存时间点另外表示,诺模图(图表现出良好的预测能力6 (b))。因此,我们能够成功地证实基因签名的可靠性和潜在的临床应用价值。

4所示。讨论

PPARs的作用在癌症的发展包括肝癌已经被越来越多的研究揭示了文献[18]。在肝癌,目前的研究对化疗的敏感性PPARs [19)和PPARs的目标基因之间的相关性和肝细胞癌患者的生存20.)表明,发现从PPAR-related预后标记基因更有临床意义。因此,在这项研究中,发现肝癌的PPAR-related预后标记,我们使用TCGA的HCC患者数据收集分析69个基因参与了PPAR信号通路。最后,结合MMP1,HMGCS2,SLC27A5就会被筛选出来作为肝癌的预后的基因标记。预后标记我们选择的性能很好,和地理验证的验证集显示没有样本偏差。

在这项研究中,三PPAR-related预后基因筛选,MMP1不宜对肝细胞癌的预后,而HMGCS2SLC27A优惠(图3 (c))。这些结果证实使用人类蛋白质图谱(HPA)的病理学图谱数据库(https://www.proteinatlas.org/)。MMP1基质金属蛋白酶家族的一员,据报道作为癌症发展的风险因素(21- - - - - -23]。此外,廖等人探索的预后价值MMP1在肝细胞癌(24],本文结果是一致的。关于HMGCS2,它是由研究人员证实癌症抑制器(25]。在肝细胞癌,减少HMGCS2伴随着不良预后,促进癌细胞迁移(26]。SLC27A是一种同工酶的长链酰coa合成酶(vlc)表示在肝脏。在当前的研究中,的影响SLC27A在肝细胞癌或其他任何癌症还没有报道。总之,有关MMP1HMGCS2选择在这篇文章中,研究报告了他们可能在肝细胞癌的预后中的作用。从当前的报告,我们选定的预后基因是相对可靠的。至于SLC27A尚未公布它的角色在肝细胞癌或其他癌症一样,我们的研究提供了新的可能性。

5。结论

总之,我们发现基因签名PPAR-associated选择在这个研究能够可靠地作为肝细胞癌预后的独立预测因子。这个签名是健壮由于跨平台和cross-batch预测进行。总体而言,我们的研究突出了新的潜在的临床前研究方向和实施个性化medicine-based方法评估肝细胞癌患者预后和治疗。

数据可用性

信使rna和相应的表型数据取自UCSC齐娜(https://tcga.xenahubs.net/download/TCGA.LIHC.sampleMap/HiSeqV2.gz;https://tcga.xenahubs.net/download/TCGA.LIHC.sampleMap/LIHC_clinicalMatrix)、地理(GSE14520_GPL3921、GSE36376_GPL10558 GSE76427_GPL10558)。

的利益冲突

作者宣称没有利益存在竞争。

作者的贡献

Wenfang徐和甄陈了同样工作和被认为是co-first作者。

确认

这项研究得到了国家重点研究和发展项目的中国(2018号yfc0910700),上海科学技术委员会(zr1427000 17号),和中国国家自然科学基金(81772591)。

补充材料

补充文件1:风险分数和分组,TCGA的365份肝癌样本。(补充材料)