很少有报告基因的作用与mRNA相关表达式的具备干细胞指数(mRNAsi)预后和免疫调节肝细胞癌(HCC)。本研究旨在分析的表达谱和预后意义mRNAsi-based three-gene签名在肝细胞癌。这个three-gene签名确认通过分析mRNAsi癌症基因组图谱的数据(TCGA)肝癌的数据集。的预后价值风险评分基于“三基因签名被Cox回归和kaplan meier分析评估,然后验证国际癌症基因组协会(ICGC)数据库。与此同时,风险评分之间的相关性和免疫细胞渗透模式、微卫星不稳定性(MSI),肿瘤突变负担(三甲),免疫分子,检查站hypoxia-related基因、免疫疗法的反应,和化合物目标基因签名进行了探讨,分别。结果表明,与正常肝组织相比,肝癌组织的mRNAsi得分显著增加。PTDSS2、MRPL9和soc mRNAsi最相关的基因在肝细胞癌组织。生存分析结果表明,基于“三基因签名是一个独立的风险评分预测肝癌患者的预后。列线图结合风险评分和病理阶段表现出良好的预测能力对肝癌患者的总体生存病人。与此同时,风险评分显著相关免疫细胞渗透模式、MSI,三甲,几个免疫分子,检查站和hypoxia-related基因。 In addition, the risk score was associated with the immunotherapy response, and fifteen potential therapeutic drugs targeting the three-gene signature were identified. Therefore, we propose to use this three-gene signature including PTDSS2, MRPL9, and SOCS as a potential prognostic biomarker for HCC.
肝细胞癌(HCC), -90%的肝癌占80%,是世界上第五个最常见的癌症和第三所有癌症相关死亡的主要原因。HCC的转移和复发的疾病很难治愈。尽管化疗是一种常见的方法除了手术切除,局部切除,肝移植患者的肝细胞癌,癌细胞的耐药性高限制了治疗效果。最近,癌症干细胞的概念(CSC)有助于解释转移,复发和耐药肝癌。有一些二者在肿瘤,强烈的生存,发展,自我更新,和抵抗能力,从而促进肿瘤的发展和传播
二者通常被等相关生物标志物CD133, cd44, CD90、上皮细胞粘附分子(EpCAM)。我们已经知道,CD133(+)肝癌细胞能促进化疗耐药,并增加CD133表达对肝癌病人是一个独立的预后因子。此外,据报道,细胞质CD133的表达是显著相关的肝细胞癌患者的生存
在这项研究中,我们提取的肝癌组癌症基因组图谱(TCGA),识别最重要的预后mRNAsi相关的基因,并建立了一个基因签名对肝癌生存预测。关键基因的表达,验证基因表达的综合(GEO)和基因表达分析交互式分析(GEPIA)数据库。风险评分基于基因签名成立于TCGA数据库,随后ICGC数据库中验证。风险评分之间的相关性和免疫细胞渗透模式、微卫星不稳定性(MSI),肿瘤突变负担(三甲),免疫分子,检查站hypoxia-related基因,分别和免疫治疗反应进行了探讨。此外,我们使用连接地图分析来识别潜在的治疗目标化合物的基因签名。最后,我们建立了一个计算图表结合临床实践的预后基因签名和病理阶段,然后验证了预测精度的诺模图校准情节,接受者操作特征(ROC)曲线,时间和决策曲线分析。总之,在目前的研究中,我们全面分析新stemness-related的预后和免疫学意义在肝细胞癌基因签名。这个基因签名可以作为潜在的肝细胞癌预后的生物标志物。
训练数据集与HCC-mRNA TCGA的表达谱和临床信息数据库包括370名肝癌组织和邻近non-HCC组织(ANTTs)。验证数据集HCC-mRNA表达谱和临床信息用于验证基因签名从ICGC下载数据库包括232肝癌组织和ANTTs。此外,十HCC军团的mRNA表达谱从GEO数据库下载检查确认关键基因的mRNA表达谱与预后的意义。与此同时,基因在GEPIA验证数据库(
二者是肿瘤细胞具有自我更新能力和发挥重要作用在肿瘤生存、扩散、转移和复发。具备干细胞指数指标可以描述肿瘤细胞和干细胞之间的相似性。所以具备干细胞指标可以被视为CSC的量化特征,包括mRNAsi索引计算基于表达数据,和EREG-mRNAsi表达指数计算基于干细胞基因明显的规章制度。这些指标的范围从0到1,接近一个显示较低的细胞分化程度和CSC的更强的特征。调查mRNAsi分数和临床预后的价值,我们比较mRNAsi分数之间的匹配肝癌样本和正常肝组织,观察值mRNAsi分数不同的肿瘤的成绩,并比较患者预后之间高mRNAsi和低mRNAsi分数。
我们下载的原始测序数据HCC mRNA TCGA的数据库并获取度(<我nline-formula>
上一步中我们选择度确定和执行WGCNA构建基因coexpression网络(
接下来,我们将邻接矩阵转换成一个拓扑矩阵。拓扑重叠测量(汤姆)是用于描述基因之间的联系的程度:
汤姆表明基因之间的差异程度<我nline-formula>
在这里,<我nline-formula>
在这里,我代表的表达谱<我nline-formula>
在这项研究中,单变量,至少绝对收缩和选择算子(套索)和多个Cox回归分析被用来探索基因表达水平之间的相关性和总生存期(OS)。我们首先使用单变量Cox回归分析来确定OS-related基因,然后应用套索Cox回归HCC预后基因的进一步缩小范围,并使用多个Cox回归分析评估预后的基因是否可以作为独立的预后因素。接下来,我们建立了一个预测基因签名乘以系数的表达式的多变量Cox回归模型(<我talic>
β)的表达水平。也就是说,<我nline-formula>
我们用单变量和多变量Cox回归分析评估是否“三基因签名可以作为一个风险因素独立于其它临床病理变量如年龄、性别、肿瘤分级,对肝癌病人和病理阶段。我们临床特点为独立变量,操作系统为因变量,计算出风险比(人力资源)(95%置信区间,两面<我nline-formula>
TCGA肝癌样本被分成高和低风险组表达水平的基础上“三基因签名。然后,集富集分析(GSEA)是使用GSEA执行软件(
我们验证了“三基因签名的预后价值在一个独立的HCC从ICGC数据库数据集。所有肝癌患者的平均风险评分在验证数据集作为截断值,我们HCC患者随访信息分为高和低风险组,比较两组之间的操作系统(两面<我nline-formula>
时间是肿瘤细胞的免疫细胞复杂的环境中生存和发展。为了评估风险评分之间的交互和时间,我们分析了风险评分之间的相关性和免疫细胞渗透模式、MSI,三甲,免疫检查点,分别和hypoxia-related基因。随后,我们分析了肝癌患者的生存率从以上方面(双因素分析)。免疫浸润细胞包含在本研究CD8 T细胞、B细胞、树突状细胞、CD4 T细胞,中性粒细胞和巨噬细胞。免疫分子包含在分析PDCD1检查站,CTLA4, CD80、CD86, CD274, PDCD1LG2,小鼠,VTCN1。hypoxia-related基因包含在分析了从以前的文献,包括SLC2A1 LDHA, ALDOA,三,VEGFA, ACOT7, TPI1, CDKN3, MRPS17, MIF、NDRG1, TUBB6, ADM, PGAM1, PGAM1 [
Immunophenoscore (IPS),它是基于主要组织相容性复数相关分子,检查点/免疫调制剂,效应细胞,抑制细胞,可用于肿瘤免疫原性的因素进行量化和描述intratumor免疫antigenomes景观和癌症。加权平均的总和<我nline-formula>
使用连接图分析,我们确定了目标化合物“三基因签名,可能导致小说治疗引发具备干细胞分化和排气潜在肿瘤(
列线图是一种简化的操作系统评估图,将统计预测模型转换成图适合临床使用。在这项研究中,我们结合基于“三基因签名的风险评分和病理阶段构建一个列线图可以评估1 -,3 -,肝癌患者的5年生存概率和预测的概率的计算图表相比实际观察到的生存概率的校准曲线来验证计算图表的准确性。线的重叠表明模型是准确的。此外,中华民国曲线是用来评估预测精度的诺模图。
图
本研究的总体流程图。
病人的信息,TCGA和ICGC同志们。
| 临床特点 | 总 | % | |
|---|---|---|---|
| ,TCGA | 370年 | ||
| 生存状态 | 生存 | 244年 | 65.95 |
| 死亡 | 126年 | 34.05 | |
| 年龄 | ≤65年 | 232年 | 62.70 |
| > 65年 | 138年 | 37.30 | |
| 性别 | 男性 | 249年 | 67.30 |
| 女 | 121年 | 32.70 | |
| 组织学分级 | G1 | 55 | 14.86 |
| G2 | 177年 | 47.84 | |
| G3 | 121年 | 32.70 | |
| G4 | 12 | 3.24 | |
| 阶段 | 我 | 171年 | 46.22 |
| 二世 | 85年 | 22.97 | |
| 三世 | 85年 | 22.97 | |
| 四世 | 5 | 1.35 | |
| T分类 | T1 | 181年 | 48.92 |
| T2 | 93年 | 25.14 | |
| T3 | 80年 | 21.62 | |
| T4 | 13 | 3.51 | |
| TX | 1 | 0.27 | |
| M分类 | M0 | 266年 | 71.89 |
| M1 | 4 | 1.08 | |
| MX | One hundred. | 27.03 | |
| N分类 | N0 | 252年 | 68.11 |
| N1 | 4 | 1.08 | |
| NX | 113年 | 30.54 | |
| ICGC | 232年 | ||
| 生存状态 | 生存 | 189年 | 81.47 |
| 死亡 | 43 | 18.53 | |
| 年龄 | ≤65年 | 90年 | 38.79 |
| > 65年 | 142年 | 61.21 | |
| 性别 | 男性 | 171年 | 73.71 |
| 女 | 61年 | 26.29 | |
| 阶段 | 我 | 36 | 15.52 |
| 二世 | 106年 | 45.69 | |
| 三世 | 71年 | 30.60 | |
| 四世 | 19 | 8.19 | |
| 之前的恶性肿瘤 | 没有 | 202年 | 87.07 |
| 是的 | 30. | 12.93 |
癌细胞具备干细胞的临床重要性,mRNAsi是CSC的定量表达式。在这项研究中,TCGA HCC数据集从数据库下载分析mRNAsi分数在肝癌组织中。如图
Stemness-characteristic指数及其在肝癌预后的意义。(一)差异mRNAsi TCGA HCC和匹配的正常肝组织之间的数据集。(b)肝癌子组之间比较mRNAsi除以病理成绩。(c) kaplan meier曲线的病人分配到高和低风险组基于TCGA mRNAsi值的数据集。high-mRNAsi组的预后差比low-mRNAsi组。(d)火山情节展示度在肝癌样本。绿色表示基因表达下调,红色代表调节的基因。
在这项研究中,重要基因模块具备干细胞相关的肿瘤细胞被WGCNA确认。我们选择6779个差异基因对于WGCNA处理,构建基因coexpression模块和分配这些基因在不同模块通过聚类树形图(图
在WGCNA基因数量的每个模块。
| 模块 | 基因数量 |
|---|---|
| 黑色的 | 94年 |
| 蓝色的 | 421年 |
| 布朗 | 250年 |
| 绿色 | 119年 |
| 凯利 | 60 |
| 灰色 | 3062年 |
| 品红色的 | 74年 |
| 粉红色的 | 89年 |
| 紫色的 | 71年 |
| 红色的 | 108年 |
| 唐ydF4y2Ba | 55 |
| 绿松石 | 2206年 |
| 黄色的 | 170年 |
为了建立一个基于CSC临床肝癌生存预测模型,我们使用一个肝癌TCGA的数据库作为训练数据集和应用套索Cox回归分析来确定稳定标记从259年survival-related候选人。我们减少一些系数为零,迫使回归系数的绝对值之和小于一个固定值。接下来,我们使用相对回归系数来确定最稳定的预后指标,进行交叉验证,避免过度拟合套索Cox模型(图
然后,我们应用上述3基因基因签名构造一个基于最低标准的生存预测肝癌。我们使用系数从Cox回归分析计算获得每个HCC患者的风险评分在训练集。为了测试之间的关系“三基因签名和肝细胞癌患者的预后,我们建立了一个预测模型基于“三基因签名:<我nline-formula>
接下来,我们验证了“三基因签名的生存预测能力在一个独立的HCC队列从ICGC数据库。我们提取的mRNA表达谱数据和随访信息从这个验证组232名肝癌患者,然后计算每个HCC患者的风险评分使用相同的公式作为训练集,以风险评分的中位数为截止值,我们将232名肝癌患者分为高危组(<我nline-formula>
随后,我们使用风险评分中位数作为截断值将肝细胞癌患者分为高和低风险组,比较两组的总体生存使用kaplan meier生存曲线。此外,我们使用时间ROC曲线评价“三基因签名的预测能力。更高的AUC ROC曲线意味着更好的预测模型的性能。如图
生存分析与培训“三基因签名和验证数据集。(a和b) kaplan meier TCGA HCC患者的总体生存分析(a)和ICGC (b)数据集分配给高位低风险组基于风险评分。患者更高的风险评分差总体生存训练和验证军团。(c和d) ROC曲线显示的预测效率风险签名TCGA的肝癌患者(c)和ICGC存活率(d)的数据集。
单变量和多变量Cox回归分析用于评估风险评分基于“三基因签名是否可以作为一个独立的预后指标系统预测肝癌患者。TCGA的数据集,单变量和多个Cox回归分析的结果表明,风险评分和病理阶段显著相关的操作系统,而年龄、性别、组织学分级与操作系统无关(数字
Cox回归分析的临床病理特征之间的关系和肝细胞癌患者的总生存期。单变量和多变量Cox回归分析的临床病理因素之间的关系(包括风险评分)和总生存期的患者,TCGA (a和b)和ICGC (c和d)数据集。
如图
我们进一步验证的预后价值风险得分基于“三基因签名在一个独立的HCC队列从地理数据库。我们提取的mRNA表达谱数据和209名肝癌患者的随访信息从这个验证队列,然后计算每个HCC患者的风险评分使用相同的公式作为训练集,同样,中等风险作为截断值。肝细胞癌患者分为高危组(<我nline-formula>
为了评估PTDSS2的性能,MRPL9,和SOCS2预后的生物标记,首先,我们验证了微分表达谱的三个发现基因在肝细胞癌组织和正常肝组织在多个肝癌一系列地理数据库。结果表明,PTDSS2的表达水平有显著差异,MRPL9, SOCS2之间肝细胞癌组织和正常肝组织(表匹配
此外,我们把TCGA肝癌样本数据库分为高,风险和低风险组的分数计算基于“三基因的表达谱GSEA探索使用签名和高危人群的基因丰富的途径。结果表明,调节基因主要参与剪接体的途径,细胞周期,膀胱癌,DNA复制,RNA降解,蛋白酶体(图
热量地图和执行kaplan - meier分析检测风险评分之间的相关性,与临床表现免疫细胞浸润。结果表明,风险评分相关免疫细胞浸润,MSI和三甲(图
肝细胞癌患者的生存分析基于风险评分,免疫细胞渗透模式、MSI和三甲。(一)风险评分之间的相关性分析和免疫细胞,三甲,MSI。(我)双重生存分析的风险评分和免疫细胞渗透指标包括CD8 T细胞(b), b细胞(c),树突(d), CD4 T细胞(e),中性粒细胞(f)、巨噬细胞(g), MSI (h)和三甲(i)。MSI:微卫星不稳定;三甲:肿瘤突变的负担。
免疫检查点是指一系列的分子表达的免疫细胞能够调节免疫激活的程度,在预防自身免疫的发生起着重要的作用。因此,热量地图和执行kaplan - meier分析检测风险评分之间的相关性和免疫分子检查站(包括PDCD1 CTLA4, CD80、CD86 CD274, PDCD1LG2,小鼠,和VTCN1)与临床表现。结果表明,风险评分与这些免疫分子检查站(图的表达
肝细胞癌患者的生存分析基于风险评分和一些免疫分子检查站。(一)风险评分之间的相关性分析和几个关键的几种分子。(我)双重生存风险评分的分析和免疫分子包括PDCD1检查站(b), CTLA4 (c), CD80 (d), CD86 (e), CD274 (f), PDCD1LG2 (g),小鼠(h)和VTCN1(我)。
缺氧时间的形成是一个重要的因素。我们获得15个基因与缺氧时间从以前的文献和分析这些15基因的表达在高和低风险组。结果表明,SLC2A1的表情,LDHA, ALDOA,三,VEGFA, ACOT7, TPI1, CDKN3, MRPS17, MIF,和NDRG1高危人群明显高于低风险组,虽然TUBB6的表情,ADM, PGAM1, PGAM1没有显著不同于低风险组(图
肝细胞癌患者的生存分析基于风险评分和几个hypoxia-related基因。(a)表达谱的几个hypoxia-related基因在高风险和低风险组。(bl)双重生存风险评分的分析和免疫分子包括SLC2A1检查站(b), LDHA (c), ALDOA (d),三、(e), VEGFA (f), ACOT7 (g), TPI1 (h), CDKN3(我),MRPS17 (j), MIF (k)、NDRG1 (l)。
这里的治疗由CTLA-4 / PD-1抑制剂在抗肿瘤治疗方面取得了重要进展。预测如TML, PD-L1和IPS被广泛用于评估免疫反应(
连接映射城市规划机构(CMap)是一种数据驱动的方法,发现基因之间的相关性,化学物质和生物条件。因此,我们使用了提出搜索目标标识候选化合物stemness-related基因签名。结果表明,15个化合物具备干细胞相关明显丰富(表
为了建立一个临床适用的方法预测肝癌患者的生存率,我们建立了一个计算图表结合风险评分和病理阶段预测1 -,3 -,肝癌患者的5年存活率(图
构建一个基于“三基因签名为生存预测列线图。(一)列线图结合“三基因签名与临床病理的特点。(b)校准情节表明nomogram-predicted生存概率大致接近实际观察到的比例。(c) ROC曲线显示的预测效率阶段模型,风险评分模型,并结合模型1年,3年,5年生存预测验证HCC队列。(d)决策曲线分析显示,净收益之间的关系和阈值概率为1年,3年,5年生存率的预测。
然后,基于时间的ROC曲线是用来评估列线图的预测精度。固体黄线表示该组合模型。如图
二者发挥重要作用在HCC的转移和复发
在这项研究中,我们专注于肝细胞癌的预后模型基于建设“三基因签名与癌细胞具备干细胞有关。首先,生存分析的结果表明,肝细胞癌患者更高的mRNAsi分数比肝癌患者预后差mRNAsi的得分越低。然后,三个模块采用WGCNA确定mRNAsi显著相关。蓝色、黄绿色模块与mRNAsi呈正相关,而黑色模块与mRNAsi负相关。接下来,所有的基因在上面的三个模块由单变量分析,套索和多元回归分析,进一步筛选出关键基因与预后价值。PTDSS2、MRPL9 SOCS2随后被确认。值得一提的是,使用地理和GEPIA数据库交互验证的结果表明PTDSS2和MRPL9在肝癌组织中,而SOCS2减少在肝细胞癌组织。和较高的表达水平PTDSS2和MRPL9 SOCS2以及表达水平较低,肝细胞癌患者的预后较差。随后,生存分析的结果使用TCGA和ICGC数据库确认风险评分基于“三基因签名在肝细胞癌预后的独立预测指标。与此同时,风险评分显著相关免疫细胞渗透模式、MSI,三甲,几个免疫分子,检查站和hypoxia-related基因。 Besides, the risk score was related to immunotherapy response and fifteen compounds targeting the three-gene signature were identified. Finally, we combined the risk score and pathological stage to construct a nomogram for clinical practice. The calibration plot, ROC curve, and decision curve analysis showed that the nomogram had a good ability to predict the OS of HCC patients.
病理分期是一种常用的方法来评估肝细胞癌患者的预后,但其精度容易受肝细胞癌的临床异质性。肝细胞癌生存预测模型的预测能力优于基于prognosis-related生物标志物病理阶段。prognostic-related生物标记的识别是建立multigenic生物标记的基础。由于肿瘤干细胞在肿瘤进展的重要作用,基于癌症干细胞的基因生物标志物特征可能有更好的预测能力。事实上,几个stemness-related生物标志物已报告直到现在。这些生物标志物包括mrna和非编码rna,例如,Artemin缺氧反应因素,起着重要的作用在低氧诱导CSC放大(
尽管许多单个基因可以被认为是肝细胞癌预后标志物,许多专家认为,临床医生应该小心使用单个生物标记作为一个预后参数(
我们的研究结果表明,“三基因签名包括PTDSS2 MRPL9, soc是良好的预后价值。PTDSS2蛋白质编码基因参与glycerophospholipids的生物合成和代谢途径。MRPL9是线粒体的蛋白编码基因翻译和病毒mRNA翻译途径。和SOCS2 IL10信号转导通路中的蛋白编码基因。先前的研究表明,沉默SOCS2能促进肝癌的进展,虽然PTDSS2和MRPL9 HCC的角色尚未完全理解(
近年来,肿瘤免疫治疗已成为肿瘤治疗领域的一个热点,和时间起着重要的作用在抑制或增强免疫反应。因此,基因签名相关的时间和免疫治疗的反应不仅是重要的生物标志物探索肿瘤发生和发展的机制也将提供新的方法来改善当前免疫疗法的治疗效果。据我们所知,这个新的three-gene与癌细胞具备干细胞相关的签名,时间,和免疫反应可以作为一个新的生物标志物,丰富了对肝癌病人生存预测的评价方法。然而,需要进一步的研究来阐明这个three-gene签名所涉及的分子机制。
总之,我们发现了一个新的three-gene签名包括PTDSS2 MRPL9, soc,可以作为潜在的肝细胞癌预后的生物标志物。此外,基于“三基因签名的诺模图是一个可靠的工具,可以帮助临床医生开发更多个性化治疗肝癌患者。
当前的研究的数据集分析TCGA可用的存储库(
作者声明,这项研究是在没有进行任何商业或财务关系,可以视为一个潜在的利益冲突。
李设计的研究和修订后的手稿。刘骏收集和分析数据。陆Jianjun解释数据并起草了手稿。阅读和批准所有的作者都最后的手稿。刘骏和陆Jianjun同样这个工作和co-first作者。
看到数字S1基因coexpression加权网络的补充材料与肝癌之间的度和匹配的正常组织。参见图S2辅料的风险评分基于“三基因签名是一种预后生物标志物。参见图S3的辅料不同子组的生存分析除以临床病理的因素。参见图S4补充材料中一个独立的HCC队列从GEO数据库用于验证的预后价值风险评分基于“三基因签名。参见图S5的辅料与mRNA表达PTDSS2 kaplan meier生存分析,MRPL9, SOCS2。参见图S6补充材料丰富通路的调节基因被GSEA肝癌。参见图S7补充材料的免疫疗法的好处与风险评分有关。见表S1-S3 PTDSS2补充材料比较,MRPL9,和SOCS2表达水平之间的肝细胞癌和匹配相邻nontumor组织在地理数据库,分别。见表S4补充材料丰富通路的调节基因在肝细胞癌中使用GSEA。见表S5的补充材料中提出的潜在治疗化合物为高危人群。