文摘

目的。肿瘤免疫是一个重要的角色在甲状腺癌的发生和发展(THCA)。本研究的目的是建立一个相关的几种THCA患者预后模型通过使用免疫相关基因(irg)。方法。Wilcox测试被用来屏幕免疫相关基因表达的差异(DEIRGs) THCA和正常组织,然后与预后相关的DEIRGs被确定使用单变量Cox回归分析。根据癌症基因组图谱(TCGA)队列,我们开发了一个绝对最小收缩和选择算子(套索)回归预测模型和执行验证分析模型的预测价值方面的内部(TCGA)和外部(国际癌症基因组协会)分别军团。最后,我们分析了预后之间的相关性模型,临床变量,和免疫细胞浸润。结果。八十二2498年的伊斯兰革命卫队是THCA之间差异表达和正常组织,和18与预后相关。套索Cox回归分析确定了七个DEIRGs最大的预后价值构建预测模型。风险模型显示高预测价值THCA在两个独立的群体的生存。根据风险风险评分模型与穷人生存和渗透水平呈正相关的免疫细胞,它可以评估THCA病人的预后独立于任何其它临床病理的特性。七个风险基因的预后价值和基因变异还分别进行了评估。结论。我们的研究建立和验证THCA与免疫相关可靠的预后模型,确定了伊斯兰革命卫队和几种风险模型是临床上重要的,这有利于促进对THCA个性化的免疫疗法。

1。介绍

甲状腺癌的发病率(THCA)展示了一个快速增长在过去的十年里(1- - - - - -3]。美国癌症协会曾预计超过44280新病例的THCA和2200多名相关的死亡在美国20214]。第八版的美国癌症联合委员会肿瘤,节点,转移(TNM分类系统)列出了一些与THCA患者的预后相关的因素,如年龄、肿瘤大小、出现远处转移,存在extrathyroidal总值的扩展,等等(5,6]。然而,THCA的分段模型仍然是更新自生存数据的积累和更大的理解肿瘤行为和临床结果。在这项研究中,我们试图完善THCA的预后风险模型,通过融合预后分子标记预测系统提高预后的临床结果的准确性预测和靶向治疗。

免疫系统起着关键作用在THCA预防、起始和发展(7]。的主要策略肿瘤逃避免疫抑制的发展环境,增加阻力,和免疫识别(8]。许多研究证明THCA细胞逃避免疫应答通过提高一个免疫抑制微环境(9- - - - - -11]。精确分层THCA患者根据预后评估和改进管理的结果,除了组织学分类,应该考虑其他参数如免疫分子的特性。因此,探索几种预后的生物标志物THCA仪器识别新的分子靶点,预测预后,实施个性化的免疫治疗精度,和生存率的改善。

它已经被科学证明,免疫相关基因(irg)在系统性免疫反应中扮演关键角色。我们的研究旨在研究伊斯兰革命卫队的可能的临床可用性,在肿瘤微环境预测THCA预后,以及它们的潜在价值作为靶向治疗的分子生物标志物。我们建立了一个IRG-based预后风险模型通过剖析一个伊斯兰革命卫队TCGA数据集的数据库。随后,进行了内部和外部的预后模型的验证评估模型的可行性,与临床特征和预后之间的关联模型,THCA患者的免疫状态进一步研究。在我们的研究中,有前景的结果可以提供的信息对THCA预后评估和个性化的免疫疗法。

2。材料和方法

2.1。数据收集和预处理

我们获得的信息从ImmPort数据库(2498年伊斯兰革命卫队https://www.ImmPort.org/home)。剖析FPKM记录数据和相应的临床病理的信息487 THCA患者和58 nontumor组织从癌症基因组图谱(TCGA,下载https://portal.gdc.cancer.gov)数据库。微阵列数据转录组分析数据和生存信息的495 THCA患者获得国际癌症基因组协会(ICGC)数据库(https://dcc.icgc.org/风险模型的验证。

2.2。识别和DEIRGs功能富集分析

我们执行的差别分析R包“limma”根据TCGA的表达数据队列。Wilcoxon等级和测试应用于识别差异表达伊斯兰革命卫队(DEIRGs) THCA和控制组织与阈值的错误发现率< 0.05和| log2FoldChange | (| log2FC |) > 2。我们执行《京都议定书》百科全书基因和基因组的通路富集分析本体和基因功能注释使用“clusterProfiler”在所有DEIRGs R包。我们也分析了蛋白质交互(PPI)为所有使用字符串DEIRGs数据库(https://string-db.org/)。

2.3。TCGA DEIRG-Based预后风险模型与群体的建设

THCA TCGA的病人队列采用作为训练集构造预测模型。DEIRGs都使用单变量Cox回归模型来评估个体风险影响因素的生存状态THCA病人TCGA培训组, 是阈值。确定的预后DEIRGs通过单变量Cox的前一步分析至少包括下列步骤构建绝对收缩和选择算子(套索)Cox回归模型排除了DEIRGs可能与其他DEIRGs高度相关。风险评分模型建立了基于表达式的值筛选独立预后DEIRGs和回归系数(β从套索回归分析)。风险评分= 风险评分是THCA患者的预后的评价方法。患者分层分为两组根据临界值(风险评分中位数)。患者在低风险评分小组进行评估和预后比高危人群。

我们跟着范描述的方法在论文中et al。12)和霍et al。13]。

2.4。预后风险评估模型

的值的几种风险模型作为一个独立的预后指标验证TCGA训练集的队列,并分别从ICGC数据库独立的队列。kaplan meier生存曲线的病人在不同风险组由“survminer”R包。采用生存率较比较生存风险这两个组之间的差异。估计风险评分模型的预测能力,接受者操作特征(ROC)曲线绘制使用“survivalROC”R包。曲线下的面积(AUC)值的范围从0.5到1.0的ROC曲线是一个歧视标准风险模型的准确性,它们是正相关的。

2.5。建立THCA生存预测的诺模图

我们进一步构建基于七个独立的列线图预后DEIRGs预测病人的存活率,1,3,5年通过R包“rms”。

2.6。独立和预后之间的相关性分析模型和临床特征

评估的几种预测模型是否可能是一个独立的预后因子,不依赖于其他临床病理的变量(包括年龄、性别、病理阶段,T分类),风险评分,所有临床病理的特性是评估通过单变量和多变量Cox分析培训组患者和测试组患者分别。风险评分和临床病理的所有功能都作为独立变量,总生存期(OS)为因变量,风险比(人力资源)、95%置信区间p值计算。我们也评估预后之间的相关性模型和临床病理的特点。

2.7。预后风险之间的相关分析模型和免疫细胞浸润

免疫水平渗透THCA患者来自计时器数据库(肿瘤免疫算法,评估资源https://cistrome.shinyapps.io/timer/)和预后之间的相关性模型子集和六个肿瘤浸润免疫细胞(CD4 + T细胞、B细胞、树突状细胞、CD8 + T细胞,中性粒细胞,巨噬细胞)分析了R。

2.8。评估的预后价值七个THCA患者的风险基因

澄清在THCA七风险基因的功能,我们分别评估之间的关系表达式的七个THCA患者预后DEARGs和操作系统使用分析工具称为GEPIA (http://gepia.cancer-pku.cn/index.html),包含了从TCGA genotype-tissue表达和临床数据的数据库。我们使用cBioPortal (http://www.cbioportal.org)来检测基因改变如放大、删除,以及各种THCA患者的基因突变的七个风险;肿瘤突变负担的同时,相应的消息(三甲)和蛋白质丰度数据THCA病人也展出。七个基因的表达之间的临床意义及其甲基化状态使用cBioPortal浏览器也进行了分析。

此外,流程图的数据收集和风险模型建设和验证如图S1

3所示。结果

3.1。识别DEIRGs

总共有878个基因(676调节和202下调)视为THCA组织样本中差异表达基因与相邻正常组织样本(数据1(一)1 (b))。我们从这组基因提取82年伊斯兰革命卫队,其中包括19个表达下调(数据和63年调节基因1 (c)1 (d))。

3.2。PPI网络建设和功能注释DEIRGs的筛选

我们分析了所有DEIRGs和可视化的交互图2(一个)。在所有DEIRGs基因进行功能富集。基因功能富集分析表明,“白细胞迁移”是最相关的生物学过程,在细胞组件DEIRGs构成大多数是“外部的质膜”和“受体配体活动”是最重要的分子功能,DEIRGs参与(图2 (b))。丰富通路的分析DEIRGs表明“cytokine-cytokine受体相互作用”是最常见的强化途径(图2 (c))。

3.3。识别DEIRGs THCA预后价值

487年THCA TCGA > 90天的患者随访队列采用诸如训练队列。单变量Cox回归分析对所有DEIRGs评估所有DEIRGs THCA病人的预后价值TCGA的训练队列。有18个DEIRGs被确定为预后DEIRGs THCA患者显著相关的操作系统( ),12人预后危险因素(人力资源> 1),其余六人预后保护性因素(人力资源< 1;图3(一个))。

3.4。建立相关的几种风险签名得分和生存风险预测

避免过度拟合,提高鲁棒性,18预后DEIRGs从单变量Cox筛选分析中进一步后续套索回归分析。最后,七DEIRGs (NOD1, CXCL5、AZU1 APOD BMP8A, TGFA,和RXRG)作为独立的预后DEIRGs筛选出来,应用构造的几种风险模型(数据3 (b)3 (c))。七个风险基因的列表和计算系数如表所示1。我们计算每个病人的风险评分的几种风险模型在两个不同的组:TCGA的队列训练,从ICGC独立队列。

3.5。验证的预后价值风险的签名,TCGA队列和ICGC群组,分别

风险评分中位数分层TCGA 487 THCA患者队列为高风险(n= 243)和低风险组(n= 244)。根据存活曲线,低风险组患者存活率高于高危组患者( ;4(a))。的AUC值风险模型预测系统在3、5和10年是0.904,0.806,和0.860,分别(图4(b))。我们分类的风险分数患者训练队列和分析他们的分布,死亡人数增加的风险分数增加(数据4(c)和4(d))。七个风险基因的表达模式描述的热图参与风险模型在不同风险组(图4(e))。主成分分析(PCA)和结果t分布式随机邻居嵌入(tTCGA sne)分析组表明,低风险患者和高危人群分布在不同的方向(图4(f)),它指示,我们的风险模型可以准确TCGA的危险分层患者根据不同免疫状态的病人。

ICGC队列,训练队列的平均风险评分仍作为临界值,和495年THCA患者分为低风险组(n= 105)和高危人群(n= 390)。高危组和低风险组的生存概率进行了比较,结果是一致的,TCGA人群,高危组患者的存活率显著降低在ICGC队列(图4(g))。的AUC值预测的风险评分模型OS ICGC THCA患者的队列在3、5和10年是0.892,0.791,和0.874,分别(图4(h))。图4(我)4(k)显示THCA患者的死亡人数增加的风险评分增加。主成分分析的结果t新力分析ICGC队列TCGA按照队列,病人在不同风险组ICGC队列也分布在离散方向(图4(左))。

内部和外部验证的结果证明的普遍适用性和高稳定性的几种预测模型预测THCA患者的预后。

3.6。列线图和临床预后的风险模型的相关分析

临床使用的列线图预后模型根据TCGA队列(图说明5(一个))。风险评估的临床相关性和意义模型,分析风险之间的相关性分数和临床特点,TCGA队列和ICGC单独队列。TCGA的队列,预后模型与年龄显著相关,病理阶段,和T分类(图5 (b))。ICGC队列,THCA患者的临床信息有限,预后模型也随着年龄显著相关(图5 (c))。

然后,单变量和多变量Cox回归分析进行风险评分和临床病理的指标来评估风险评分模型是一个独立的预后指标是否独立于其他临床参数THCA病人。根据单变量Cox的结果分析,TCGA群体,年龄之间有显著的正相关,病理阶段,风险评分,THCA患者的预后(图5 (d))。多变量Cox的结果分析提示年龄和风险评分THCA患者的独立预后指标(图5 (e))。在ICGC人群中,年龄和风险评分明显与生存相关的数据5 (f)5 (g))。所有的结果证实了几种风险模型可以应用独立的预后预测THCA病人。

3.7。免疫细胞浸润预后预测的潜在作用

判断预后风险模型可以反映THCA患者的肿瘤免疫微环境的状况,我们做了相关分析。之间的联系的CD4 + T细胞,巨噬细胞、树突细胞,中性粒细胞,和风险评分是重要的和积极的,建议增加渗透和风险评分之间的关联(图6)。

3.8。七风险基因功能分析

以前的生物信息学分析表明,无足的,BMP8A, CXCL5,和AZU1高危基因和RXRG NOD1, TGFA低风险基因。调查协会7 THCA患者的预后风险基因表达式,绘制生存曲线。如图7(一)高风险的基因是与不良预后相关,低风险的基因相关不再生存。在图7 (b)、mRNA表达之间的相关性和甲基化水平的七个基因被展出。我们也分析和可视化基因改变的筛选DEIRGs风险,和相应的三甲,蛋白质丰富,甲基化在不同THCA集群情况下(图7 (c))。

4所示。讨论

THCA高发恶性肿瘤内分泌癌症[14),虽然THCA的疾病死亡率相对较低,值得注意的是,许多病人遭受重复治疗由于THCA复发,同时临床负担增加15,16]。因此,识别更激进的THCA和有效预测THCA的复发,危险分层系统提出了由美国甲状腺协会(ATA) 2016年指南[17]。TNM分期系统的一个主要玩家在ATA风险等级分类。

TNM分期系统是THCA预后预测的参考标准(18,19),分期系统的一个重要功能是帮助使最佳治疗方法在诊所(20.),因此它是有用的,推荐给所有THCA患者17]。生存数据的积累和更深入的理解肿瘤行为和临床结果的分段模型THCA总是更新。事实上,一些临床病理的指标和分子的发现,并不包含在ATA的TNM分期系统被认为是风险分类21]。在当前的研究中,我们想要探索可能的预后分子标记,可以纳入风险分类系统。

免疫系统在THCA进展中起着重要作用[22]。有越来越多的证据证实免疫细胞的渗透THCA可以预测预后[23,24]。一些研究人员认为,免疫表型应考虑作为一个参数改善THCA管理病人和试图定义一个新的分类根据免疫THCA签名利用基因组和转录组分析(25]。Thorsson et al。26)确定六个免疫亚型超过10000 33个不同类型的癌症通过一个巨大的2019年TCGA immunogenomic分析使用数据。一些研究认为Immunoscore是利用在甲状腺,发现Immunoscore与甲状腺分化分数负相关(27]。因此,增加免疫功能的变化的意识参与的发展THCA对预后的预测和精确的个性化治疗。在这项研究中,我们试图完善THCA的预后风险模型结合的几种预后分子标记预测系统,加强临床结果预测的预测精度,有利于有针对性的治疗。

近年来,精密基因组医学是主流。筛选出特定的和稳定的生存预后的预测因素从大量的医学数据集完成临床结果是精密基因组医学的首要任务28]。我们研究了几种预后因素使用生物信息学分析基于精确基因医学研究在当前的研究中。我们的研究构建了一个新颖的几种THCA患者预后风险模型和验证它,TCGA队列和ICGC群组,风险模型具有普遍适用性和高稳定性预测THCA患者的预后。当然,我们的研究也有一些局限性。一方面,缺乏信息的预后信息在本地THCA病人群的进一步测试了我们的结果。另一方面,我们的发现是通过纯生物信息学分析,所以中心基因的功能和潜在的药物需要进一步证实了科学研究在体外和体内,进一步研究七DEIRGs组成的预后模型是必要的。

5。结论

我们THCA的免疫机制进行了探讨,建立了一个可靠的预后评估系统使用七DEIRGs作为风险基因,根据我们计算的风险评分模型可以作为一个独立的预后指标。我们的研究有利于丰富THCA的治疗靶点。此外,我们的风险模型可以反映THCA患者的免疫细胞的渗透,将有利于预测免疫疗法的患者的敏感性。

缩写

AUC: 曲线下的面积
DEIRGs: 免疫相关基因的异常表达
走: 基因本体论
ICGC: 国际癌症基因组协会
尾声: 免疫相关基因
KEGG: 京都基因和基因组的百科全书
公里绘图机: kaplan meier绘图仪
套索: 至少绝对收缩和选择算子
日志2舰队指挥官: 对数的折叠/ Log2Fold改变
操作系统: 总生存期
PPI: 蛋白质相互作用
TCGA: 癌症基因组图谱
THCA: 甲状腺癌。

数据可用性

原始数据支持这个手稿的结论将会提供相应的作者,没有过度的预订,任何合格的研究人员。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

高频设计本研究和起草。高频和YLW参与数据收集,数据和统计分析。高频和西尔维搜索和阅读参考,修订后的手稿,监督所有的工作。所有作者阅读和批准最终的手稿。

确认

这项研究是临床研究的支持特别项目从上海市健康委员会(No.20204Y0230)。

补充材料

补充图1是流程图开发完全描述我们的研究。图S1:这项研究的总体流程图。(补充材料)