文摘
背景。神经母细胞瘤是一种常见的固体肿瘤起源于交感神经系统,通常存在于儿童,儿童肿瘤死亡的主要原因之一。除了病理特性,分子水平上的特性,如存在多基因表达和突变,可能提供有用的信息的精确治疗神经母细胞瘤。转录因子(TFs)发挥重要的监管作用在细胞生命活动的各个方面。但目前没有研究转录的因素神经母细胞瘤预后的生物标志物,这研究是必要的。方法。我们下载的RNA转录组数据和临床数据从目标数据库构建预测模型。使用单变量预测模型是由考克斯分析,套索,多变量Cox回归。我们将病人分成低风险和高风险组使用风险评分的中值作为截止。然后,我们验证了GSE49710预后模型与数据集。结果。我们建造了一个预后模型组成的八个基因(SATB1、ZNF564 SOX14, EN1, IKZF2, SLC2A4RG, FOXJ2,和ZNF521)。高危组患者有较低的存活率比低风险组。三年的ROC曲线下的面积达到0.825的模型,提出一个好的预测效果。我们执行目标基因预测的8个转录因子在模型中使用六个在线数据库,发现TUT1可能目标基因转录因子EN1和与免疫相关的渗透。结论。预后模型组成的八个基因转录factor-associated证明可靠的预测效力。这个预测模型可以提供新的潜在目标治疗神经母细胞瘤和个性化的神经母细胞瘤患者高和低风险的监控。
1。介绍
神经母细胞瘤是最常见的颅外的实体瘤的童年,占所有的8%儿童小儿肿瘤以及肿瘤死亡人数的15% (1]。神经母细胞瘤起源于神经嵴前体细胞的增殖失控由于受损的分化2]。神经母细胞瘤的临床多样性反映了其异构的特点。在一些患者中,肿瘤病情的反复,而其他进展迅速,了抗药性。尽管已经取得了显著的进展在神经母细胞瘤的治疗中近年来,最近的研究已经确定了几个分子,如MYCN、碱性,ARID1B,参与神经母细胞瘤的发展(3),神经母细胞瘤患者的预后仍然很差,尤其是在先进的情况下或复发性肿瘤。因此,目前迫切需要发现小说标记与预后和预测能力,以目标和个性化的治疗神经母细胞瘤患者。
转录因子(TFs)的蛋白质,能具体地结合DNA序列和转录调节4]。TFs发挥重要作用在肿瘤发生、进展、入侵、转移、耐药(5]。据统计,大约20%的致癌基因TFs (6]。另一方面,损失函数的TFs致瘤的抑制作用会导致不受控制的细胞分裂和癌症发展和进展(7]。然而,很少有研究在TFs预后价值。
在这项研究中,我们构建了一个基于神经母细胞瘤患者的预后模型TF-related基因通过下载从适用的治疗研究转录组数据生成有效的治疗方法(目标)数据库,并验证它使用基因表达数据库综合(GEO)。我们的研究发现,我们的风险评分神经母细胞瘤的可能是一个独立的预后因素。总之,我们的研究表明,预测模型具有很高的预测价值为神经母细胞瘤患者,提供了一个新的潜在的神经母细胞瘤患者的治疗目标。
2。材料和方法
2.1。数据收集
2018年,兰伯特等人发表了一篇评论,发现超过1600 TFs可能参与人类生理和疾病过程(8]。我们收集了1639 TFs文学的分析(表S1)。图1显示了本研究的流程图。我们下载的转录组数据从目标数据库和临床信息和地理数据库。数据来自148名患者在目标数据库被用于模型建设。数据从498年神经母细胞瘤患者的地理数据集(GSE49710)被用于模型验证。
2.2。建设预后TF-Based签名
屏幕TFs的预后价值,我们进行了单变量Cox回归分析1639 TFs评估TFs之间的相关性和总生存期(OS)在目标数据集。我们定义了一个考克斯的筛选标准 为以后分析。施工期间避免变量之间的过度拟合模型,我们使用最绝对的收缩和选择算子(套索)回归算法来提取最佳子集。最后,我们获得了在模型中每个合并TF的系数。风险评分计算根据以下方程:
Expi代表每个TF的表达式,Coei是相应的多变量Cox回归系数结果。
进一步验证TF-based预后模型的预测性能,我们评估时间的AUC ROC曲线评价风险的预测价值时间得分结果。
2.3。基因集富集分析(GSEA)
我们使用GSEA分析潜在的不同的生物机制之间的高收入和低风险组。GSEA是注释中使用“clusterProfiler”包R软件。
2.4。免疫渗滤分析
我们计算的22个肿瘤浸润免疫细胞CIBERSORT算法(9),一个方法来计算一个特定的细胞组成的组织的基因表达谱。在目前的研究中,我们使用CIBERSORT算法来计算水平的免疫细胞浸润肿瘤样本中目标和地理数据库。
2.5。统计分析
我们用R软件(版本3.8.2)完成所有数据分析。学生的t以及采用检查团体之间的显著差异,而单向方差分析被用于比较组之间的差异。采用卡方检验比较两组的临床特征。神经母细胞瘤患者进行了分析使用kaplan meier技术和生存率较确定它们的总生存期(OS)。风险评分及临床特征的预测价值评估采用单向和Cox回归分析。斯皮尔曼分析是用来分析两个变量之间的相关性 。
3所示。结果
3.1。识别潜在的预后转录因子
我们获得了1639个人类TFs的列表从公众文献[8,10]。相应的目标数据库后,共有1375 TFs基因表达数据包含在后续研究。神经母细胞瘤患者的临床特点的信息在这两个数据集是在表S2。
单变量Cox回归分析的基因表达,我们寻找TFs 1375 TFs的预后意义。65 TFs 得到接下来的分析(表吗S3)。
3.2。构建TF-Based预测模型
施工期间避免变量之间的过度拟合模型,我们使用套索回归算法(图中提取的最佳子集2)。然后,我们得到每个TF预后模型的系数由多变量Cox回归分析(表1包含8个基因构成的),这预后模型。ZNF564的系数,SOX14、EN1和SLC2A4RG是积极和预后不良的危险基因。相比之下,SATB1的系数,IKZF2 FOXJ2, ZNF521消极的保护性因素。
(一)
(b)
我们将病人分成高和低风险组的平均风险评分(图3 (c))。高危患者死亡率高于低风险病人(图3 (b))。从热点图,我们发现,ZNF564 SOX14, EN1和SLC2A4RG增加了表达在高危人群,而SATB1 IKZF2 FOXJ2, ZNF521增加表达在低风险组(图3 (e))。图3(一个)显示了两组kaplan meier曲线,再操作系统在低风险的患者比另一组。敏感性和特异性评估模型是由时间ROC分析。三年ROC曲线,AUC为0.825,表明预测模型的预测性能好三年操作系统(图3 (d))。
(一)
(b)
(c)
(d)
(e)
3.3。TF-Based签名的验证
我们构建的预测模型是在另一个数据集GSE49710验证。我们使用相同的预后模型得到的目标数据集来计算风险得分GSE49710共有498名患者的数据集。相同的部门为低收入和高危人群是根据中等风险评分。在GSE49710 TF-based预后模型的敏感性和特异性(图3年操作系统被评估为0.7784 (c))。其他的发现,包括热图和kaplan meier分析,也与目标群体的结果一致,表明我们TF-based神经母细胞瘤患者的预后模型具有良好的稳定性(数字4(一),4 (b),4 (d),4 (e))。
(一)
(b)
(c)
(d)
(e)
3.4。TF-Based签名识别的独立的预测活动
进一步调查是否TF-based独立预后模型可以预测神经母细胞瘤患者的预后。单变量Cox回归分析TF-based预后模型是否可以独立预测其他临床病理的特点表明,倍性,组织学,齿轮风险,风险评分与操作系统相关的目标数据集(图5(a))。然后我们包括变量的多变量Cox回归分析显示,倍性和风险评分系统(图的独立预测指标5(b))。在GSE49710,年龄和风险评分与操作系统(图5(c)),年龄和风险评分后保持独立预后指标的操作系统多变量Cox回归(图5(d))。
3.5。GSEA识别生物学途径
进一步研究相关信号通路在高危人群,我们执行GSEA高风险和低风险组之间的分析。在目标数据库的高危人群,一个碳池叶酸,基本切除修复、DNA复制是丰富(数字6(一)-6(c))。这些都是在地理数据库(数据进一步验证6(d) -6(f))。
3.6。监管机制分析基于六个数据库
来验证这个转录监管关系,我们使用了六个在线数据库,包括JASPAR,编码,农谢先生,MotifMap TRANSFAC, TRRUST。我们八个TFs的靶基因的预测模型(表S4清单的证据),由两个以上数据库(表2)。“√”表示,相应的TF监管与目标基因的关系。
3.7。生存分析TUT1和相关免疫渗透
有趣的是,我们发现TUT1的表达越高,系统越短的病人在两个目标和地理数据集(数据7(一)和7 (b))。通过使用CIBERSORT计算免疫细胞的渗透,我们发现TUT1呈正相关,CD8 T细胞,T细胞监管(亚)、巨噬细胞M0, B细胞幼稚与CD4记忆T细胞呈负相关休息,巨噬细胞平方米,单核细胞、嗜酸性粒细胞、NK细胞休息,树突状细胞激活,和T细胞γδ在目标数据库(图7 (c))。我们还发现TUT1呈正相关,浆细胞和中性粒细胞和嗜酸性粒细胞负相关,树突细胞休息,休息CD4记忆T细胞,单核细胞在GEO数据库(图7 (d))。TUT1可能有作用的神经母细胞瘤的发展,和转录因子EN1也可能TUT1监管与预测目标基因。这需要进一步阐明。
(一)
(b)
(c)
(d)
4所示。讨论
在这项研究中,我们表明,TFs-based预后模型构造可以预测神经母细胞瘤患者。TFs在基因转录作用以及各种其他重要的生物活性(11,12]。三分之一的人类发展疾病与异常的TF表达(13]。东等人发现转录因子可能会提高乳腺癌发展(14]。一个关键的转录因子参与肝母细胞癌由詹和他的同事发现了(15]。TFs也被牵连在几个调查与神经母细胞瘤(16]。然而,很少有研究转录因子的预后方面。作为细胞信号通路的效应分子,TFs发挥重要作用在肿瘤发展,因此,有必要研究其功能在预测患者预后。我们通过生物信息学方法分析了目标和地理数据库的数据构建和验证预测模型的作用并分析其与临床特征和免疫渗透并预测目标基因的转录因子。我们使用的数据模型建设和目标数据集从地理模型验证基于8 TFs使用Cox回归和套索回归方法。这个签名可以预测神经母细胞瘤患者的预后。
在这项研究中,一个预后模型组成的八TFs的角色在肿瘤的部分报告。SATB1能够调节染色质结构和基因表达通过染色质重塑酶。SATB1表达在不同类型的成人祖细胞和胚胎干细胞。这个基因与各种形式的癌症,如喉鳞状细胞癌(17),子宫内膜癌(18),肝细胞癌(19,20.],直肠癌[21],黑色素瘤[22),和胃癌23,24]。SOX14 SOXB2转录因子子群的一员,和李等人报道,通过Wnt /连环蛋白通路(25),SOXQ4可能提高宫颈癌细胞增殖和入侵。EN1扮演了一个角色在EN1在大肠癌是常见的异常表达(26),前列腺癌(27],星形细胞瘤(28]。IKZF2是伊卡洛斯的转录因子家族的成员,已被证明是一个转录因子的调控t细胞功能(29日,30.]。公园等人报道,IKZF2能抑制骨髓分化使白血病干细胞的自我更新31日]。赵等人所示,SLC2A4RG编码核转录因子,帮助激活溶质载体家庭两个成员四个基因,基因可能参与形成的“绿带运动”(32]。除了福克斯家族的一员,FOXJ2是一个新的forkhead因素双重DNA结合特异性。乳腺癌细胞迁移和入侵可能抑制如果FOXJ2表达增加(33]。ZNF521是一个转录因子参与造血的调节,神经,和间充质干细胞,Chiarella等人报道,ZNF521抑制人类脂肪干细胞的分化34]。这些研究表明,这些转录因子与肿瘤密切相关。我们的预后模型可以预测神经母细胞瘤患者的预后。
我们也使用了六个数据库预测八TF目标基因,发现TUT1基因不仅具有预后价值被发现与免疫细胞的CIBERSORT算法,验证在目标数据库和地理数据库。这个基因编码一个nucleotidyltransferase函数作为一个终端uridylyltransferase和核聚聚合酶。编码酶特别添加和删除核苷酸的3′末端小核rna并选择mrna和可能在控制基因表达和细胞增殖功能。这为今后进一步的研究提供了一个方向。虽然我们的模型能够预测神经母细胞瘤患者的预后好,我们的研究仍然有一些缺点。我们的预后模型仍需进一步验证的临床病例,不仅仅使用公共数据数据库。TFs的一些在我们的模型中没有研究神经母细胞瘤与相关机制,这在我们未来的研究需要进一步改善。
5。结论
我们的研究成功地构建了一个包含八个TFs的预后模型(ZNF564、SOX14 EN1 SLC2A4RG, SATB1, IKZF2, FOXJ2,和ZNF521)。我们的神经母细胞瘤患者的预后模型可以帮助医生预测系统,但还需要进一步的研究与临床样本验证预测模型的准确性,提高神经母细胞瘤的管理。
数据可用性
在这项研究中使用的数据都是网上。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
RW设计项目,并参与了数据分析。QW解释数据,写的手稿,并监督项目。所有作者的文章和批准提交的版本。
确认
这项工作是支持的上海交通大学医学工程交叉项目(批准号YG2021QN83)。
补充材料
表S1: 1639 TFs公共文献。表S2:临床和病理因素,在这项研究中使用的数据集。表S3: TFs 65 在单变量Cox回归。表S4:预测的目标基因8 TFs。(补充材料)