文摘

背景。提高骨肉瘤(OS)患者的生存一直是一个挑战,尽管这种疾病的治疗是进步的边缘。DNA损伤反应(DDR)历来与致癌作用有关,肿瘤生长,基因组不稳定性。没有研究用DDR基因作为签名识别操作系统的预后。这项工作的目的是找到一个有效可行的DDR基因生物标志物预后预测的操作系统,这可能是有用的在临床诊断和治疗。方法。评估基因甲基化,单变量和多变量cox回归分析进行数据操作系统病人。检索的数据从公共数据库,包括适用的治疗研究生成有效的治疗方法(目标)和基因表达综合(GEO)。结果。DDR基因签名选择,其中包括7个基因(NHEJ1、RMI2 SWI5, ERCC2, CLK2, POLG,和一种)。在目标数据集,患者分为两组:高风险和低风险。一个高风险的患者得分显示更短的OS率(风险比(人力资源):3.15,95%可信区间(CI): 1.38 - -4.34, )相比,目标中的一个低风险的患者得分作为培训组。验证复发的预测准确性进行了签名和验证军团(目标,n= 75;GSE21257,n= 53)。签名是一个独立的操作系统在多变量cox回归分析的预测因素,和诺模图模型是预测一个人的操作系统的风险。DDR基因签名参与Fanconi贫血通路,nonhomologous−加入通路,错配修复,核苷酸切除修复途径。结论。我们的研究表明,发现小说DDR基因可能是一个强大的预测预后的评估工具和一个有价值的工具在预测系统病人的危险因素。

1。介绍

最常见的原发性恶性肿瘤骨是骨肉瘤,这最常发生在青少年和年轻人在青春期的成长(1]。尽管进步化疗、手术和放射治疗,没有转移的骨肉瘤患者5年操作系统78%的速度(2]。操作系统,另一方面,仍有30%的死亡率(3]。虽然很多方面已经建立了骨肉瘤的诊断和治疗,治疗和预防的新方法是需要被开发。骨肉瘤的病理生理学过程仍然是一个谜。因此,寻找有效的诊断标记和骨肉瘤的主要分子病因研究是至关重要的。

在许多实体肿瘤,在DNA修复有缺陷的变化会导致显著增加的频率neoantigens [4]。因此,可怜的DNA修复与更好的临床反应PD-1抑制。削弱错配修复(MMR)给更好的疗效与pembrolizumab大肠癌患者(5- - - - - -7和各种实体肿瘤的研究8]。这些发现导致FDA批准的具有里程碑意义的MMR-deficient PD-1抑制剂的恶性肿瘤,信号基于分子水平的范式转向肿瘤治疗(8]。几种不同的DNA修复机制与neoantigens的积累。在非小细胞肺癌患者的一项研究中,钢管,MSH2,和突变POLD1过度肿瘤中发现了neoantigens负担,这是与增强PD-1治疗反应。此外,聚合酶ε(杆)突变在子宫内膜癌有较高的表达neoantigen负担和PD-L1 [9,这些突变与异常免疫反应者(10]。同源重组的变化装置包括BRCA2和BCRA1突变也会增加neoantigen anti-PD-1治疗后负荷和总生存期(11]。体细胞变化影响DNA损伤修复(DDR)通路和/或细胞周期在骨肉瘤的多个子集,医学和临床试验被用来测试精度方法基于这些畸变。然而,DDR基因的生物标志物在操作系统尚未探索的预后。

在目前的研究中,我们检验和验证候选人DNA损伤修复签名作为预测预后利用地理标志和目标数据库。识别DNA损伤修复的签名将允许患者分为低风险和高风险组。此外,DDR基因的表达模式可以作为一个独立的预后签名对于OS患者,允许新的治疗目标和诊断生物标记的发展。

2。材料和方法

2.1。数据集和数据处理

由操作系统生成的数据项目的目标(https://ocg.cancer.gov/programs/target)被用作训练集。目标骨肉瘤项目是用于重要的骨肉瘤患者的临床资料以及水平三个RNA-Seq数据。作为验证集,GSE21257受雇的地理数据集。地理数据库是用于收集数据集GSE21257和mRNA的生存信息数据。

2.2。Survival-Related DDR基因的筛选

模型是由采用机器学习的方法和统计数据如前所述12]。分析生存时间之间的联系,和雕像,和培训组中的每个DDR基因的表达,采用单变量cox比例风险回归分析的基础上,早期的研究。建立预测模型、多变量cox回归分析用于过滤最强大的和可靠的预测预后甲基化网站。模型的基础上,预测风险计算方程的表达式如下: 的数量表达式的DDR基因签名所示N,DDR创世纪的表达 ,考克斯和多元回归系数表示 风险评分(RS)是风险的多节点加权和分数,计算使用签名系数为每个病人报告。风险评分中位数是利用的截断值划分训练、测试和验证组分为高和低风险组。采用生存率较比较两组之间的预测使用kaplan meier (km)生存分析。甲基化的独立生存预测指纹通过多变量cox回归分析进行了研究。甲基化的基因和周围组织和肿瘤之间的微分表达式使用学生的筛选t以及。

2.3。功能富集分析

的通路富集分析进行了基因的基础上基因本体论(去)数据库(生物过程、细胞成分和分子功能的BP, CC, MF,分别)和京都基因和基因组的百科全书(KEGG)。为多个比较, 值调整使用错误发现率(罗斯福)的方法。R包clusterProfiler被用来进行所有的分析(13]。

2.4。建设的诺模图

一诺模图是将两个独立的临床开发风险因素(转移和年龄)和签名来预测1 -甲基化网站,3 -,5年生存率在临床实践中。规模点,每个变量的列线图得分决定。计算诺模图总得分后,我们计算预期1 -,3 -,和为每个患者5年生存率,正如前面所讨论的那样。

2.5。统计评估

统计评估进行了R 3.5.1 (https://www.r-project.org)。pROC和Bioconductor (https://bioconductor.org)被用于下载所有的幸存者。的双尾t以及与Mann-WhitneyU以及被用来确认统计两组之间的差异。一个阈值 值< 0.05被认为是统计上相当大的不同的分析和相关性。的Wilcoxon rank-sum测试来确定意义的比较,结果显示为的意思 值( ; )。

3所示。结果

3.1。评估预后DDR基因从训练队列

我们第一次获得DDR研究的基因列表Knijnenburg et al ., (2),然后我们集成DDR基因的表达在目标数据库样本。目标数据库的样本作为训练团体,与完整的临床信息,用于收集更多信息协会的预后与276个基因。作为独立变量,雕像的生存和生存时间最初使用单变量cox比例风险进行回归分析的276个基因。18 DDR基因明显与患者预后有关( ;1(一)和表S1)。此外,获得高度预测预后DDR基因,进行了多变量cox回归分析七发现DDR基因集(NHEJ1、RMI2 SWI5, ERCC2, CLK2, POLG,和一种图1 (b))模型来评估患者的预后风险。组合的风险评分由NHEJ1 RMI2, SWI5, ERCC2, CLK2, POLG和一种(表S2)确定如下:

RS和Exp风险评分和表达式的值。

3.2。确认的生存状态DDR目标群体的基因签名

DDR基因签名计算所有病人的风险评分。培训组划分为高(n= 48)和低风险(n= 47)组、中等风险评分被用来作为截止准则。使用km的生存率得到生存分析。得分低风险患者的5年生存率超过75%,相比之下,只有不到25%的高危患者得分(人力资源:3.15,95% CI: 1.38—-4.34, ,2(一个))。接受者操作特征(ROC)曲线是用来识别预测模型的准确性。模型的预测能力的操作系统病人的预后改善随着ROC曲线下的面积增加。预后签名的预测精度是可靠的训练数据集(AUC签名=0.75,图2 (b))。我们的研究结果表明,DDR基因签名可以是一个潜在的小说和强大的准确预测生物标志物。

3.3。确认DDR基因签名复发组中生存的能力

我们整理复发样品和后续数据从目标数据库。复发组分为39(52%)高风险和36(48%)低风险组使用建立预测模型。操作系统测试组,5年超过75%的低风险组和不到25%的高危人群(人力资源:2.65,95% CI: 1.43—-1.79; ,2 (c))。

3.4。健壮的DDR基因资料验证在不同的验证组

签名在GSE21257检查操作系统病人的预后验证发现七DDR基于基因的分类器在各种病人平等的预测价值。采用系数模块的建立,培训组分为LR组(26(49.1%))和人力资源组(27例(50.9%))。相应的5年OS LR组为65%,低于50%的人力资源集团在GSE21257(图2 (d))。验证数据还显示,DDR基因档案在这项研究中的应用是一个可靠的预后指标。

3.5。独立的预后指标,预测患者的预后的诺模图发展

多变量cox回归分析进行了评估临床病理特征之间的关系(转移和年龄)和签名风险评分。在训练数据集,该协会表明签名独立预测病人的存活率(高与低风险组,HR = 0.15, 95%置信区间CI: 0.068 - -0.034, ,3(一个))。诺模图包含两个临床风险变量(转移和年龄)和DDR基因签名是预测开发1 - 2 -,5年生存率在临床实践中。根据点尺度,该工具可以计算诺模图得分为每个变量。我们计算的估计概率1 - 3,并为每一个患者5年生存在计算诺模图总得分。签名的1 -,3 -,5年预测,根据诺模图,其次是年龄和阶段(图3 (b))。

3.6。基因功能预测的DDR签名

DDR签名的可能参与基因在生物过程参与骨肉瘤发展了使用和KEGG分析。这些基因进行功能分析。的研究结果表明,DDR签名基因相关的DNA重组,染色体隔离,双链断裂修复、nonrecombinational修复(图4(一))。我们还发现,DDR签名参与Fanconi贫血的基因通路,NHEJ通路,错配修复,核苷酸切除修复途径(图4 (b)),这是至关重要的在单引号或双股DNA及其修复系统。

4所示。讨论

最常见的恶性肿瘤之一,在骨科领域是骨肉瘤。入侵,转移扩散的速率高,预后不好(14]。对于操作系统患者,没有适当的预后指标一直是主要的问题。体细胞变化影响DDR通路和/或细胞周期在骨肉瘤的多个子集,医学和临床试验被用来测试精度策略基于这些畸变。然而,更精确的DDR基因签名和稳定模块预测预后是必要的,这可以使操作系统患者患者的个性化治疗的决定。所以,我们是第一个研究DDR-related OS患者的预后。

在我们的研究中,我们评估276 DDR基因从之前的研究曾相反微分表达模式。通过应用不同的统计方法,我们确定了七个DDR基因签名。此外,我们验证了DDR基因签名的复发组和外部验证组是一种强大的工具在预测预后,并独立与OS患者的总生存期有关。最后,我们建立了DDR签名基因列线图来预测预后。我们发现DDR签名参加了Fanconi贫血基因通路,NHEJ瀑布,错配修复,核苷酸切除修复途径。我们的研究牵涉到应用精密治疗,最终会导致增强操作系统病人的预后。

我们确定一组七DDR NHEJ1组成的基因,RMI2,和SWI5 ERCC2, CLK2, POLG,一种预测在两组患者预后。

在结直肠癌患者中,一种基因,像其他一些抑制基因,是容易被启动子甲基化沉默15),二期和三期结直肠癌患者,一种表达提供了有用的预后信息(16]。ERCC2是一个关键组成部分核苷酸切除修复过程,以及细胞周期和细胞凋亡控制和转录起始17]。在结肠直肠癌和胃癌症,ERCC2多态性预测oxaliplatin-based化疗的临床结果18]。POLG是唯一的人类线粒体DNA聚合酶中发现的,它需要DNA修复和复制(19]。POLG基因与肝细胞癌患者的预后显著相关剂量依赖性的方式(20.]。在乳腺癌,CLK2激酶磷酸化SR蛋白与拼接,函数作为癌基因(21),和高度表达CLK2显著增强肺癌细胞的增殖,从而促进肺癌的发生和发展22]。

在人类细胞中,nonhomologous结束加入(NHEJ) DNA损伤修复途径是最常见的双链DNA修复途径,及其异常活动与多种癌症治疗耐药性(23]。NHEJ1缺陷可能促进突变的积累在癌症DNA错配修复缺陷的设置(24]。RMI2 BLM-TopoIIIa-RMI1-RMI2复杂是一个重要的组成部分,这有助于保持基因组的稳定(25]。RMI2表达与预后不良和肝细胞癌患者的生存时间短(26),对肺癌转移和增长也很重要27]。SWI5促进Rad51-dependent重组修复级联是一个组件的SWI5-SFR1形成(28]。零星和家族性乳腺癌患者,SWI5蛋白质与DNA损伤反应是表达(29日]。

综上所述,我们成功地获得预后签名可能预测系统病人的存活率。重要的是,我们开发了一个七DDR基因列线图来预测患者的预后。我们的研究结果表明,该签名有潜力成为一个精确和可靠的预测预后的生物标志物和裁剪病人治疗的操作系统。

数据可用性

所有的数据用于支持本研究的结果包括在本文中。

伦理批准

本文的内容是数据挖掘的癌症基因组图谱数据库(目标)。目标数据库是开放和共享。

告知病人同意不是必需的。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

音译)和刘Yan-xia收集获得的样本数据和临床信息。休宁黄和李鹏进行数据分析和设计研究。音译)和李鹏综合结果和起草了手稿。

确认

中国的国家自然科学基金(批准号81673098)。表观遗传调控效果HMGA相关微rna对棉结的激活细胞组织在发展中小脑的神经元再生后放疗。

补充材料

表S1: DDR基因的单变量cox回归分析目标群体。表S2:风险评分的DDR目标群体的基因签名。(补充材料)