文摘
背景。神经母细胞瘤是最常见的颅外的小儿实体肿瘤。高危神经母细胞瘤患儿的预后仍然贫困在过去的十年。一个强大的签名是需要确定与预后相关的因素和改进的治疗选择。在这里,我们发现了一个强大的甲基化签名支持神经母细胞瘤患者的早期诊断。方法。基因甲基化(GM)数据的神经母细胞瘤患者治疗适用研究生成有效的治疗方法(目标)分析了使用多变量Cox回归分析(MCRA)和单变量Cox比例风险回归分析(UCPHRA)。结果。八个基因组成的基因甲基化的签名(NBEA、DDX28 TMED8, LOC151174, EFNB2, GHRHR, MIMT1,和SLC29A3)被选中。签名将患者分为低收入和高风险类别,有统计上显著的存活率(平均存活时间:25.08 vs > 128.80个月,生存率较, )培训组,验证签名的危险分层的能力进行了测试组(生存率较, ,平均存活时间:30.48比> 120.36个月)。甲基化基因的签名被发现被MCRA神经母细胞瘤的一个独立预测因素。功能富集分析认为,这些基因甲基化相关butanoate新陈代谢,beta-alanine新陈代谢,和谷氨酸代谢,能量代谢过程中扮演不同的重要角色在神经母细胞瘤。结论。八甲基化基因的集合可以作为一个新的预测和预后签名INRG高危神经母细胞瘤患者,从而协助治疗,药物开发和预测生存。
1。介绍
神经母细胞瘤是外周交感神经系统胚胎肿瘤起源于胚胎细胞的基本神经嵴。颅外的实体肿瘤是最常见的儿童神经母细胞瘤和高达15%的癌症相关的死亡负责1- - - - - -3]。神经母细胞瘤的临床过程构成了一个复杂的异构疾病的进展。局部神经母细胞瘤(阶段L1和L2)、转移性神经母细胞瘤(M)和转移性神经母细胞瘤与特定的特征在18个月以下的儿童(MS)是国际神经母细胞瘤风险的三种类型的肿瘤分类组(INRG) [4,5]。这些风险指标(组织学、年龄、MYCN INRG阶段,倍性地位,和11问畸变)用于将病人分成四个预处理组风险。有三个级别的困难:低,中等和高(6]。低,中间组显示五年生存率超过90%,而高危人群的生存仍然贫困,约为40%。尽管先进的治疗包括手术、化疗、放疗、免疫疗法可以用于治疗的过程中,所有这些有一个可怜的存活率高危神经母细胞瘤(7]。这种低预后需要新的靶向药物的开发来提高高危神经母细胞瘤患者的存活率。
CpG二核苷酸的DNA甲基化基因启动子区域是一个主要的调控机制参与细胞过程不改变DNA序列(8]。DNA甲基化揭示神经母细胞瘤的发病机理和临床行为(9]。在神经母细胞瘤最描述DNA甲基化改变CASP8和RASSF1A基因(10,11),都是与危险因素,如年龄在诊断、MYCN扩增,肿瘤阶段(12- - - - - -15]。另外,基因的DNA hypomethylation (CCND1 SPRR3, BTC、EGF和FGF6)影响生物功能和神经母细胞瘤的发病机理16]。在转移性神经母细胞瘤,TDGF1的甲基化状态和RB1较短生存有关,和全基因组甲基化分析发现小说甲基化基因(PCDHGA4,叔,DLX6-AS1 DLX5) (17,18]。然而,表观遗传标记神经母细胞瘤仍然非常低。特别是,有更少的甲基化与高危神经母细胞瘤患者相关生物标志物。
在当前的报告中,我们确定了重要的和独立的甲基化在INRG高危神经母细胞瘤预后的生物标志物使用短语从目标数据库的机器学习方法。生物标记物可以用来设计新的高危神经母细胞瘤患者治疗方案,可能改善现有的存活率。
2。材料和方法
2.1。检索的DNA甲基化数据进行分析
Illumina公司HumanMethylation450(美国加州Illumina公司Inc .)平台被用来评价DNA甲基化数据。有482421 CpG网站整个基因组甲基化数组(19),每个基因的整体β值是由probe-level数据。目标数据门户网站为我们提供了3级甲基化数据。我们收到了130份样本目标数据库,它包含DNA甲基化数据以及临床数据,如性别、年龄、战略研究所MYCN状态和阶段。所有的神经母细胞瘤样本通常分为两组:训练(86例)和测试(44例)。
2.2。建设一个甲基化基因签名在训练数据集
胡锦涛等人报道的最好方法构造签名,我们这种方法用于研究[20.]。首先,我们使用一个UCPHR分析看看是否有存活率之间的联系和基因甲基化在训练数据集21]。随机生存forest-variable狩猎(RSFVH)算法被用来过滤甲基化基因,十个被排除(22,23]。预测预后甲基化基因的筛查,MCR分析用于构建一个模型,该模型可以预测预后风险按照以下表达式:
在这里,甲基化的基因签名表示N,签名基因的甲基化的价值是由 ,而单一的CRO用 。风险的多节点加权和分数被称为风险评分(RS)。
2.3。统计分析
风险模型是使用前面提到的甲基化基因签名。截止数量,平均风险评分是用来把训练和测试病人到高风险和低风险组(24]。接下来,ROC分析和用来证实kaplan - meier生存(公里)分析甲基化基因签名的有效预测能力的测试数据集。MCR分析是用来确定签名的独立生存预测,和重要的值小于0.05。使用的所有分析R程序版本(3.5.1)。下载randomForestSRC和pROC生存进行了从Bioconductor (https://bioconductor.org)。
2.4。甲基化的基因功能分析的签名
大卫的生物信息学工具是用于预测的活动签名使用基因甲基化基因本体论(去)分析,涵盖了分子功能、细胞组件,与生物过程以及KEGG通路富集研究(https://david.ncifcrf.gov/, 6.8版本)。的价值 被认为是重要的去和KEGG通路。
3所示。结果
3.1。临床特点的分析目标数据
本调查中使用表达式的所有数据来自神经母细胞瘤患者,临床和病理。我们进行了一项临床数据的统计分析(性别、年龄、MYCN状态和国家战略研究所阶段)在测试组和培训组。结果显示高风险患者只有占领了18个月,包括不超过5% < 97.7%国家战略研究所第四阶段在测试组和培训组。临床和病理特征的细节可以在表中找到1。之后,130名患者被随机分为两组(测试组,n= 44;培训组,n= 86)检查如果发现甲基化基因在神经母细胞瘤患者预后的意义。图1显示了甲基化基因的选择过程的签名。
3.2。建筑生存基因甲基化的签名
培训集团(n= 86)与所有临床数据被用来调查总体存活率之间的关系和甲基化基因的存在。我们首先进行了单变量研究分析甲基化基因的分析数据与生存状态和生存时间相关的因素。我们发现339个甲基化基因,明显与病人的总生存期(值< 0.05,图2)。使用随机森林的339个基因进行分析技术来评估甲基化基因的签名。基于排列重要性评分(PFI)使用RSFVH方法,分析发现十个基因显著与患者总生存期(图S1)。
我们利用一个CMR分析(表S1)开发一套eight-methylation基因模型(NBEA、DDX28 TMED8, LOC151174, EFNB2, GHRHR, MIMT1,和SLC29A3)评估筛选最强大的生存风险,预测预后基因甲基化。风险评分(表S2)的组合由NBEA DDX28 TMED8, LOC151174, EFNB2, GHRHR, MIMT1,和SLC29A3决定如下:
风险评分用RS,而甲基化的值用冰毒。
3.3。确定甲基化基因的签名的生存力量训练和测试数据集
对于每个病人,分析了风险评分确定甲基化基因的签名。使用风险评分中位数,我们培训组分为两组:低风险(n= 43)和高风险(n= 43)。使用kaplan meier生存(公里)分析,这是发现高危组存活率显著低于低风险组平均生存时间:25.08个月比> 128.80个月,生存率较, ;图3(一个))。高危组的5年生存率不到20%,而低风险组的速度超过60%。风险评分基于甲基化基因的签名测试组的患者使用相同的计算预后风险评分方法,确认签名的预测价值。类似地,两个风险组的测试数据集使用kaplan meier曲线(图显示3 (b))。研究中的高危人群平均存活时间明显低于低风险组平均生存时间:30.48个月和> 120.36个月,生存率较, )。高危组存活率不到30%,而低风险组的生存率超过50%。
(一)
(b)
(c)
(d)
3.4。的生存预测能力测试和培训组甲基化基因签名
ROC分析被用来评估甲基化基因签名的预测能力,与更高的ROC曲线下的面积表示为神经母细胞瘤患者的预期生存更好的模型。八甲基化基因签名有很强的预测能力培训组(AUC)签名= 0.87,图3(c)),这表明本研究中的甲基化基因签名是一个高度精确的小说生存生物标志物。也观察到类似的高度准确的结果在测试组(AUC签名= 0.71,图3(d))。每个基因的DNA甲基化水平在训练数据集比较t以及(表S3)。分配每个8基因的DNA甲基化水平的总组(N= 130)(图分析4)。大多数基因除了GHRHR显示显著差异在低收入和高危人群之间的甲基化水平。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
3.5。所选8甲基化基因的签名是一个独立的预后因子
我们使用MCR的分析,其中包括风险得分基于签名以及各种临床特征(如性别、年龄、MYCN地位,和国家战略研究所阶段)。这个分析是用来展示的预后疗效甲基化基因的签名总体生存预测风险评分,这是一个独立的预后因子在所有的数据集(数据集高风险和低风险的数据集,HR = 2.13, 95%置信区间CI: 1.70 - -2.66, ,n= 194,表2)。
3.6。泛函分析甲基化基因的签名
去和KEGG分析被调查这些DNA甲基化基因的潜在参与生物过程与神经母细胞瘤(图发展5、表S4)。结果表明,8个基因甲基化参与butanoate新陈代谢,beta-alanine新陈代谢,propanoate新陈代谢,谷氨酸代谢,和色氨酸代谢,这都与能量代谢有关。据报道,神经母细胞瘤细胞被严格依赖葡萄糖代谢,已被发现是一个非常频繁的功能在肿瘤生物多样性。此外,糖酵解中间产物是细胞生长的关键前体除了生成ATP (25]。因此,调制这些基因的甲基化在能量代谢过程中扮演各种重要角色的神经母细胞瘤。
(一)
(b)
4所示。讨论
神经母细胞瘤是最常见的颅外的小儿实体肿瘤负责不成比例的儿科癌症死亡率。他们出现在发展中交感神经系统(26,27]。尽管有进步在治疗患者中,其中一些包括骨髓化疗和密集的诱导化疗,高危神经母细胞瘤患者总体的结果仍然是无法接受贫穷(28]。三个最近的研究集中在神经母细胞瘤的预后。一个18-gene签名预测临床结果在第四阶段神经母细胞瘤(29日),发现ERCC6L AHCY、STK33 NCAN作为一组基因,可以用来预测神经母细胞瘤患者的预后(30.]。MELK是小说高危神经母细胞瘤的治疗目标31日]。然而,甲基化基因签名及其与神经母细胞瘤生存的关系研究很少,特别是高危个体。我们雇了一个短语的组合机器学习方法和统计方法建立甲基化基因的签名由十个基因在我们的调查。他们发现相关的神经母细胞瘤患者的生存。使用性别、年龄、MYCN状态和国家战略研究所阶段covariables,选择签名的独立性在神经母细胞瘤患者生存的预测评估使用MCR分析。基于签名的风险评分的患者被发现是独立与总体存活率有关。因此,我们发现甲基化基因的签名在患者总生存期独立预测。这些发现表明,甲基化基因的预测价值的资料预测神经母细胞瘤患者的存活期没有响应其他临床因素。
各种分析后,八个重要基因甲基化事件被确定。EFNB属于弗家族的受体酪氨酸激酶,和报告表明,EFNB2监管和可以执行在神经母细胞瘤预后的作用。例如,高层表达转录本编码EPHB6受体(配体结合在EFNB2和EFNB3)预测的神经母细胞瘤(32],EFNB2 WNT信号引起的。因此,EFNB可能会有一个角色在神经系统发育和神经母细胞瘤细胞命运的决定(33]。之前的研究也显示,有许多潜在的疾病和EFNB2之间的关联。这样的一个例子是演示的时候发现,微rna - 137抑制EFNB2表达基因变异影响精神分裂症患者(34]。从midgestation开始,NBEA编码的一员,多元化的锚蛋白激酶是老鼠大脑中表达明显(35,36贩卖,这个表达式影响突触后神经递质受体细胞表面(36,37]。研究已经证明,NBEA不仅是预测签名(38- - - - - -40),但也发挥了重要的监管作用在神经发育41,42]。NBEA已经被证明可以作为基因签名预测胃癌的预后(43]在细胞核转录监管机构,它与NOTCH1交互。本协会发现特别重要的发病机理是NOTCH信号是大脑发育所需44]。GHRHR是生长激素释放激素受体基因。过度的GHRHR已被证明有致癌作用相关的几种类型的癌症,包括神经母细胞瘤(45]。SLC29A3编码一个核苷转运蛋白在细胞中起着重要作用的核苷碱基。之前报道,许多疾病有关RAD51AP1表达式,包括autoinflammatory疾病(46),H综合症(47)、胰岛素依赖型糖尿病(48),色素多毛症,自身免疫性胰岛素依赖型糖尿病49),和硬化性骨发育不良50]。同时,MIMT1 MER1 repeat-containing印成绩单,可进行甲基化在子宫内胎盘growth-restricted胎儿在牛51],截断引起的MIMT1基因外显子3和4的宫内生长受限(52]。此外,跨膜p24贩卖蛋白质家族成员,DDX28,被用来调查pediatric-onset遗传病的数字PCR (53]。然而,这两个基因的生物学作用(tm和LOC151174)在癌症还未知,这在今后的研究中做进一步的研究。这些以前的研究表明,在当前列出的签名可以预测预后结果的工作,为临床治疗。
在神经母细胞瘤方面,本研究有一些缺点。最重要的是,更多的研究在神经母细胞瘤基因甲基化的具体机制是必要的。此外,甲基化基因的签名在临床试验中还有待检验。即使这些限制,连续和重大相关性的甲基化基因的签名与总生存期分为两个不同猩群的暗示,它可能是一个有用的和强大的预测签名为神经母细胞瘤。
短语的使用机器学习使我们能够识别一个甲基化基因的签名提供了更多的临床意义上的预测精度。
数据可用性
所有的数据用于支持本研究的结果都包含在这篇文章,可以在癌症基因组图谱(TCGA)数据库。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
志超刘和长春李收集样本的数据,得到了临床信息。志超刘进行数据分析和设计研究。长春李综合结果和起草了手稿。
补充材料
图S1:随机生存forest-variable狩猎的错误率分析显示数据作为树的函数。表S1:甲基化基因的单变量Cox回归分析 在训练集(n= 86)。表S2:多变量Cox回归分析的8甲基化基因和培训组的神经母细胞瘤患者的生存。表S3:签名风险评分由8个组合的训练和测试数据集。表S4:不同的DNA甲基化的基因之间的高收入和低风险组。表S5:功能性浓缩8甲基化基因的签名。(补充材料)