文摘
肺腺癌(LUAD)是一种常见的肺癌亚型与一个令人沮丧的存活率。肿瘤代谢的改变被确认为一种新的癌症肿瘤微环境的标志(时差),和我们做了一个全面的探索,揭示了预后metabolic-related基因的作用。LUAD的转录组分析数据,分别从癌症基因组图谱下载(TCGA)和基因表达数据库综合(GEO)。基于提取的metabolic-related基因,小说5-gene代谢预后签名(包括GNPNAT1 LPGAT1, TYMS LDHA, ptg)是由单变量Cox回归和最小绝对收缩和选择算子(套索)回归。这个签名确认其鲁棒性和准确性的外部验证多个数据库。LUAD可以是一个独立的危险因素,和诺模图拥有适度准确性能与c指数为0.755(95%置信区间:0.706 - -0.804)和0.691(95%置信区间:0.636—-0.746)在训练集和测试集。这个签名可以揭示代谢功能根据基因集富集分析的结果(GSEA)同时监测时间通过的状态估计分数和免疫细胞的渗透水平。总之,这个基因签名是一种高效的工具可以显示状态的时间提供更多线索探索新的诊断和治疗策略。
1。介绍
肺癌已成为其中一个最经常与主要诊断恶性肿瘤死亡率(1]。肺癌的主要组织学亚型非小细胞肺癌(NSCLC)占大约85%2,3]。肺腺癌(LUAD)是最常见的亚型的非小细胞肺癌5年生存率约15% (4,5]。等司机致癌基因研究表皮生长因子受体(EGFR)和间变性淋巴瘤激酶(碱性)方面取得了巨大的成绩6]。然而,靶向治疗的耐药性与这些基因通常是不可避免的限制病人和新颖的治疗机制迫切需要探索临床实践(7]。
肿瘤代谢的改变被确认为一种新的标志的癌症肿瘤微环境(时间)8]。在后台的时间,肿瘤代谢的紊乱可能深深影响恶性肿瘤细胞的多种功能(9]。先前的报道已经确定代谢签名在肺癌预后预测基于multiomics分析(10- - - - - -12]。然而,时间是一个复杂的交互网络,代谢特征的综合研究角色身上仍然缺乏。
在当前的研究中,我们构建了一个新的metabolic-related基因签名,以反映开心的状态。基于差异表达的代谢基因TCGA的队列,我们证实了这个签名的潜在的预后价值。它可以反映LUAD的代谢特性,进一步监控基质的内容和免疫细胞。我们旨在为进一步的研究提供了新的线索和方向上的基因参与时间。
2。材料和方法
2.1。数据收集
LUAD的规范化mRNA转录组分析数据下载的癌症基因组图谱(TCGA)数据库(https://portal.gdc.cancer.gov/)和GSE72094从基因表达数据集综合(GEO)数据库(https://www.ncbi.nlm.nih.gov/geo/)[13]。TCGA队列包含535 LUAD样品和59控制样品和442 LUAD GSE72094队列包含样本。相应的临床特征也获得并提取。基因参与代谢通路被选为代谢基因和基因组的基因根据《京都议定书》百科全书(KEGG)通路基因集从MSigDB下载数据库(http://software.broadinstitute.org/gsea/msigdb)。基因在这三个数据集的交集是准备作为后续metabolic-related基因分析。
2.2。识别差异表达的代谢基因
首先,TCGA的mRNA表达矩阵和地理组规范化,分别。然后,TCGA代谢基因表达的不同群体选择的阈值|日志2[褶皱变化(FC)] |≥1和错误发现率(罗斯福)< 0.05通过limma包(14]。
2.3。建设和评估代谢基因签名
survival-related代谢的基因是由单变量Cox回归分析提取的阈值 通过生存的包(15]。样品的存活时间小于30天内和不完整的临床资料被排除在分析之外。然后,至少绝对收缩和选择算子(套索)回归了构建这个模型的预后签名,避免过度拟合glmnet包(16]。代谢基因签名构造基于Cox回归系数(β)和代谢mrna的表达水平,计算每个样本的风险分数按照下列公式:Σ(ExpmRNAn×βmRNAn)。基于风险评分的中值,样本分为高危组和低风险组。kaplan meier (km)生存曲线绘制比较两组之间的预测存活时间。这个签名被评估的性能曲线下的面积(auc)接收操作符的特征(ROC)曲线。风险评分也测试作为一个独立的危险因素与其他临床特征的单变量Cox回归和多变量Cox回归,分别。在分析期间,TCGA队列被用作训练集和GSE72094队列作为外部测试队列。
2.4。建设和验证预后的诺模图
预后列线图包括临床特征和风险得分了,TCGA及地理的同伴。校准阴谋画评估代谢特征的预测概率和健身。最后,病人的净效益曲线绘制,以反映潜在的实用程序和评估这个模型的临床价值决策曲线分析(DCA)。
2.5。预后的外部验证签名
的基因包含在签名验证他们的意义Oncomine数据库(https://www.oncomine.org/),它提供了荟萃分析表达式的每个基因在多个研究排名。cBioportal数据库(https://www.cbioportal.org/)是用于调查的概述小说的改变,发生在LUAD metabolic-related基因。此外,我们验证了蛋白质表达水平在人类蛋白质图谱数据库(https://www.proteinatlas.org/比较肿瘤之间的分化和控制组织视觉。
2.6。基因集富集分析
调查潜在的分子机制的基因签名,我们执行KEGG通路分析通过基因集富集分析TCGA (GSEA)队列。罗斯福的重要途径是确定一个阈值< 0.05。
2.7。临床应用在肿瘤微环境
我们计算每个样本的估计分数比较高,低风险组(17]。估计分数包含免疫得分,基质得分,纯度和肿瘤,分别反映了免疫细胞的渗透程度,基质的内容,估计肿瘤的纯度。此外,我们计算具体渗透水平22亚型的免疫细胞通过CIBERSORT系统扩展的效用代谢签名(18]。
2.8。统计分析
所有的统计分析软件(版本3.5.3)进行了R。考克斯和套索survival-related变量回归了屏幕。生存曲线比较生存率较。独立样本的差异分析Wilcoxon rank-sum测试。相关系数是由皮尔森相关分析计算。 被认为是具有统计学意义。
3所示。结果
3.1。识别差异表达的代谢基因
我们画流程图来描述我们的研究更俱视觉(图1(一))。875代谢信使rna提取的交叉基因列表从三个不同的数据库(图1 (b))。然后,104个差异表达的代谢mrna(79调节和表达下调25日)被证实LUAD样本和控制(数字1 (c)和1 (d))。
(一)
(b)
(c)
(d)
3.2。建设和评估代谢基因签名
我们确定了9 survival-related代谢mrna通过单变量Cox回归分析。此外,通过套索回归,构建最优模型参数λ时最少的最低(图2)。五个选择基因如下:葡萄糖胺6-phosphate N-acetyltransferase 1 (GNPNAT1) lysophosphatidylglycerol酰基转移酶1 (LPGAT1) thymidylate合成酶(TYMS),乳酸脱氢酶(LDHA)和前列腺素E合成酶(ptg)。签名是由以下公式:Exp (GNPNAT1)×0.0276 + Exp (LPGAT1)×0.0102 + Exp (TYMS)×0.0140 + Exp (LDHA) + Exp (ptg)×0.0010×0.0034。
(一)
(b)
根据风险评分,样本分为高危组和低风险组。中华民国的AUC的风险评分是最好的训练集和测试集,和为生存分析显示两组之间的生存时间明显不同(图3)。在单变量和多变量Cox回归,风险评分的风险比是最大相对于其他临床特征。单变量Cox回归集中在个体变量但可能的混杂因素的影响。多变量Cox回归避免此限制。这些分析相互补充,表明风险评分可以是一个绝对独立的危险因素的预后LUAD(图4)。
(一)
(b)
(一)
(b)
(c)
(d)
3.3。建设和验证预后列线图
诺模图是由临床特征和风险分数(图5)。c指数为0.755(95%置信区间:0.706 - -0.804)和0.691(95%置信区间:0.636—-0.746),TCGA及地理的同伴。模型的校正曲线显示协议相对于参考线(图S1)。DCA的净收益曲线的潜力临床应用证实,该模型可以提供满意的福利(图S2)。一般来说,我们的模型大约有一个温和的准确性,TCGA和地理军团和可能增加预后预测的敏感性和特异性LUAD在某种程度上。
(一)
(b)
3.4。预后的外部验证签名
所有的五个基因被证实Oncomine数据库(图中表达明显不同6(一)),这与我们的结果是相一致的。对蛋白质的水平,他们也LUAD之间的显著差异表达和控制组织(图6 (b))。基因的改变阿特拉斯,LPGAT1拥有最发生的突变中有7%的样本和其他基因也显示改变;它可能澄清LUAD之间的异常表达和控制样品(图6 (c))。LUAD和五个基因之间的相关性是通过验证进一步证实了在多个数据库。
(一)
(b)
(c)
3.5。基因集富集分析
我们执行GSEA和确定了丰富KEGG通路(图7)。对高危人群,与细胞增殖相关的途径主要是和五大途径RNA降解,细胞周期,ubiquitin-mediated蛋白质水解,卵母细胞减数分裂和嘧啶代谢。对低风险组相关联的途径主要是脂质代谢和前5是花生四烯酸代谢,亚油酸的新陈代谢,α亚麻酸代谢、血管平滑肌收缩,和初级胆汁酸合成。结果显示不同的代谢功能风险组。
3.6。相关性与肿瘤微环境
低风险组的样品具有较高的基质得分,免疫分数,和总分与高危人群;同时,肿瘤纯度也有两组(图之间的显著差异8)。通过CIBERSORT系统,我们计算之间的关系这预后签名和渗透程度的免疫细胞(图9)。共有11个亚型的免疫细胞(记忆B细胞,树突状细胞,巨噬细胞M1,激活肥大细胞,肥大细胞,单核细胞,激活NK细胞,memory-activated CD4 T细胞,memory-resting CD4 T细胞,γδT细胞,和调节性T细胞)有明显的渗透水平和风险分数之间的关系。
(一)
(b)
4所示。讨论
虽然伟大成就新的治疗策略在过去的几十年中,已报告的整体存活率LUAD仍不满意(1,19]。的pathological subtypes presented limitations in the prediction of prognosis. Patients could have totally different final outcomes although they might possess similar clinical and pathological types [20.]。下一代测序技术的发展促进了生物信息学的临床应用(21,22),全面结合基因分析与临床参数。相比tumor-node-metastasis (TNM)系统,它已被证实在各种类型的癌症的预后签名可以提高预测的准确性(23- - - - - -25]。
LUAD领域的,有几个之前的研究已经成功地从不同的角度构造预后签名(26- - - - - -28]。与这些研究相比,我们提取的相关基因,开发了一种代谢预后签名。我们分别证实了它的准确性和鲁棒性的训练集和测试集。我们的签名可以有效地识别不同高危人群的总体生存时间和不同层次的进一步验证多个数据库。此外,我们探讨了签名和时间之间的相关性,以扩大临床应用,为治疗策略的选择提供更多的线索。
以往的研究对非小细胞肺癌已报告的生物功能和基因表达模式的模型。GNPNAT1,也称为GNA1,核心成员参与生物合成对乙酰氨基葡萄糖,证实的underexpression GNPNAT1可能导致渗透和粘附的抑制肺癌细胞(29日]。LDHA是一个重要的酶,参与细胞能量代谢,促进了恶性行为和预测不良生存状况在LUAD [30.,31日]。ptg是一种酶,这种酶主要参与炎症反应。也报道,异常表达在非小细胞肺癌细胞株和ptg击倒可以显著抑制肺癌细胞的迁移32,33]。TYMS扮演了一个至关重要的角色,在DNA合成,TYMS的变更可能会增加肺癌的风险,和TYMS确认相关的表达EGFR突变LUAD患者(34,35]。LPGAT1报道作为一种新型基因主要参与脂质代谢和确认影响BMI和体脂肪的作用36]。先前的研究显示,LPGAT1正常和肿瘤组织之间的差异表达,可能是潜在的目标至关重要的小分子核糖核酸LUAD [37,38]。我们的研究表明,LPGAT1 metabolic-related基因与一个潜在的预后价值,它可能是一个小说LUAD诊断和治疗目标。在观察LPGAT1放大的重要改变,不同的蛋白质表达水平也证实了肿瘤组织和控制。
丰富的差异之间的通路高和低风险组被GSEA透露。结果表明,两个风险组具有明显不同的代谢功能。途径的高危人群主要是与细胞增殖、和低风险组中,他们与脂质代谢相关。通过与他们的不同,我们可以一定程度上获得不同的代谢特性通过风险识别分数和底层的分子机制。它可能是一个具有成本效益的补充工具,说明代谢微环境和预后。
除了不同的代谢特征,预后签名也可以揭示相应变化的时间,这是显示估计的分数和CIBERSORT分数。在身上,随着肿瘤发生和进展,肿瘤代谢的异常可能涉及到免疫抑制,肿瘤细胞逃避免疫应答[39]。通过反射来的复合时间这个签名,我们可以方便地监测免疫细胞的渗透,进一步减少免疫反应的程度。这个签名可以从不同方面反映这些变化的时间和有潜力是一个适当的援助为理性的诊断和个性化的治疗。同时,证实针对肿瘤的治疗代谢和肿瘤免疫检查时间有一定抗肿瘤作用[40]。它可能是一个新的耐药性的挑战未来的方向和可能提供互补的线索在免疫治疗中的应用。
当前的局限性TNM系统近年来逐渐认识到。改善临床应用,immunoscore系统推荐的一种新方法领域的国际共识结肠癌(41]。这个immunoscore源自CD3 +和CD8 + t细胞的密度效应物和被验证是满意的性能的预测复发和预后。它被认为是一个互补的风险因素与肿瘤的TNM系统分类和被称为TNM-I系统。领域的非小细胞肺癌,类似的研究进展和已经初步成果(42]。我们计算我们的签名和渗透的关系水平的22个亚型的免疫细胞在身上,半显著相关。通过这个签名,我们可能与免疫细胞的分布与患者的预后。我们的签名提供了创新的视角从肿瘤代谢的角度。综合反映了时间,尤其是这个预后之间的相关性特征和免疫细胞的渗透,可以丰富TNM-I系统研究,预后预测中的作用可以提供更多细节的研究新的immunoscore系统。
我们的研究仍有一些局限性。首先,很难反映整个景观肿瘤代谢的转录组数据的基础上,我们分析只是集中在特定的方面。第二,在多个数据库中,虽然我们的签名验证过实验探索仍需要进一步确认的准确性和临床实用程序。第三,TCGA群体的组成和地理数据库主要是白人和黑人;其他种族的扩展是仍需验证。
5。结论
总之,我们成功开发一个健壮的metabolic-related预后预测的基因签名LUAD TCGA的基础上和地理数据库。我们的签名可以反映LUAD代谢特性和开心的状态。
缩写
| 筛选: | 间变性淋巴瘤激酶 |
| AUC: | 曲线下的面积 |
| DCA: | 决策曲线分析 |
| 表皮生长因子受体: | 表皮生长因子受体 |
| 舰队指挥官: | 褶皱变化 |
| 罗斯福: | 错误发现率 |
| 地理: | 基因表达综合 |
| GNPNAT1: | 葡萄糖胺6-phosphate N-acetyltransferase 1 |
| GSEA: | 基因集富集分析 |
| KEGG: | 京都基因和基因组的百科全书 |
| 为: | kaplan meier |
| 套索: | 至少绝对收缩和选择算子 |
| LDHA: | 乳酸脱氢酶的 |
| LPGAT1: | Lysophosphatidylglycerol酰基转移酶1 |
| LUAD: | 肺腺癌 |
| 非小细胞肺癌: | 非小细胞肺癌 |
| ptg: | 前列腺素E合酶 |
| 中华民国: | 接收机算子的特点 |
| TCGA: | 癌症基因组图谱 |
| 时差: | 肿瘤微环境 |
| TYMS: | Thymidylate合成酶。 |
数据可用性
和/或使用的数据集分析在当前研究可从相应的作者在合理的请求。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项研究是由中国国家自然科学基金(81603577)。
补充材料
图S1:列线图的校准曲线。的X轴代表了生存概率和预测Y轴代表实际的生存概率。(一)三年,TCGA队列的校准曲线。(B) 5年,TCGA队列的校准曲线。(C) 3年地理群的校准曲线。(D) 5年地理群的校准曲线。图S2:列线图的DCA曲线。当虚线的价值不仅仅是灰色的曲线,此模型的应用增加了病人的利益。(一)三年DCA曲线TCGA的队列。(B) 5年DCA曲线TCGA的队列。(C) 3年DCA地理群的曲线。 (D) 5-year DCA curve of the GEO cohort.(补充材料)