计算和数学方法在医学

PDF
计算和数学方法在医学/2020年/文章
特殊的问题

机器学习和网络生物学和医学的方法2020

把这个特殊的问题

研究文章|开放获取

体积 2020年 |文章的ID 8081973 | https://doi.org/10.1155/2020/8081973

郭Junfeng Chen),曾Guangjun Jianhua Liu本赵, 转录组分析确定小说在骨肉瘤预后的基因”,计算和数学方法在医学, 卷。2020年, 文章的ID8081973, 8 页面, 2020年 https://doi.org/10.1155/2020/8081973

转录组分析确定小说在骨肉瘤预后的基因

客座编辑:道黄
收到了 2020年6月25日
接受 2020年7月22日
发表 2020年10月06

文摘

骨肉瘤(OS),恶性原发性骨肿瘤经常会出现在年轻的成年人,是非常积极的。高通量技术的进步加快了各种癌症生存预测预后的生物标志物的鉴定。然而,只有一些研究关注操作系统患者预后的预测使用基因表达数据由于小样本大小和缺乏公共数据集。在目前的研究中,RNA-seq 82操作系统的数据样本,连同他们的临床信息,收集从目标数据库。识别操作系统生存的预后基因预测,我们选择排名前50的基因的贡献作为初始候选基因的预后风险模型,在随机森林模型,并发现五个预测因子包括的预后模型CD180,MYC,PROSER2,DNAI1,FATE1最优多变量Cox回归模型。此外,基于多变量Cox回归模型,我们还开发了一种评分法和分层操作系统患者分成了不同的风险。操作系统病人验证集的分层进一步证明我们的模型有一个健壮的性能。此外,我们还研究了两个风险之间的差异表达基因的生物功能团体和发现这些基因主要参与关于免疫生物学途径和过程。总之,小说预后生物标记的识别操作系统将极大地帮助操作系统的预测分子靶向治疗的生存和发展,进而造福患者的生存。

1。介绍

骨肉瘤(OS),恶性原发性骨肿瘤经常会出现在年轻的成年人,是非常积极的(1]。根据先前的研究,操作系统没有转移性疾病患者存活率为70%,但有证据表明,早期发生转移导致预后差(2]。操作系统可以进一步分为不同的组髓内和表面亚型根据他们的组织学特征和被认为是与多因子的相关原因,遗传和环境影响似乎对这种疾病产生影响(3]。然而,对于大多数OS的病人,其病因仍然含蓄。患者的体质(4- - - - - -6和他们的遗传背景7),以及激素分泌,会影响骨骼发育8),都是操作系统的风险因素。目前,操作系统主要是接受手术和化疗,患者将大幅改善其长期生存,然而准确预测预后仍然需要在治疗决策9]。然而,只有约15 - 17%患者操作系统只有手术才能生存下来(10,11]。在1970年代早期,介绍了辅助化疗和应用治疗操作系统没有转移性疾病的患者(12]。当前组合结合手术切除,化疗可以治愈~ OS病人的70%。然而,转移或复发患者的五年存活率仍只有20% (11,13),表达迫切呼吁新疗法针对这些病人。

测序技术的进步,如微阵列,下一代测序,蛋白质组学质谱,对癌症的生存预后的生物标志物预测提出了几项研究[14- - - - - -16]。突变TP53,RB1,CDKN2A,PTEN,YAP1(17)已确定和广泛观察到使用全基因组测序(WGS)或whole-exome测序(韦斯)操作系统病人,这大大提高了我们对基因组的理解景观的操作系统。下一代测序,新颖的生物标记的识别成为可能,不仅可以扩大我们的见解的致病机制操作系统还提供资源来构建机器学习模型预测系统病人的预后。例如,KRT5,HIPK2,MAP3K5,CD5被确定为骨肉瘤患者的预后因素(18]。此外,风险预测模型基于一个八个基因(19)和一个二基因(20.)(PML- - - - - -EPB41)签名建立预测骨肉瘤患者的总体生存。然而,只有一些研究关注患者预后的预测系统由于小样本大小使用基因表达数据和缺乏公共数据集。在这项研究中,我们收集了82 OS与RNA-seq样本数据和相应的临床治疗应用研究的数据来生成有效的治疗方法(目标)的数据库,选择预后基因,并建立预后风险模型来评估和预测系统的总体存活率。小说预后生物标记的识别操作系统将极大地帮助操作系统生存的预测和分子靶向治疗的发展,进而造福患者的生存。

2。材料和方法

2.1。数据源

我们获得了骨肉瘤RNA-seq数据(TPM)和匹配从目标数据库(OS患者的临床资料https://ocg.cancer.gov/programs/target)。共有82名患者从这个数据集作为训练集构造的预后风险模型。GSE21257的数据集21包括34个骨肉瘤患者)进行进一步的验证。

2.2。筛选的基因对骨肉瘤的预后风险模型

首先,基因产生的列表 在超过一半的总样本特征选择的选择。根据每个病人的临床信息和表达谱基因明显与患者的生存与R是通过执行Cox回归分析获得生存方案。我们进一步缩小这个基因列表基于微分水平的预后结果,和基因的 值小于0.01。随后,这些基因被随机森林算法排名在R包randomForestSRC基于他们的相对贡献。因此,前50名基因的候选基因构建骨肉瘤预后的风险模型。

2.3。模型建设和评价

利用候选预后基因的表达谱和患者的生存数据,我们建立了一个预测风险操作系统使用多变量Cox回归模型描述以前的研究(22),和一个基因列表,极大地推动了这个模型,由我们的最终候选人。我们建立了一个得分公式确定候选基因评估病人和使用操作系统的风险评分中位数将他们分成两个子组,即高风险和低风险组。分别绘制kaplan - meier生存曲线,每组,他们的生存的差异被生存率较进一步的评估。

2.4。验证预后风险模型的一个独立的数据集

验证数据集包括34个骨肉瘤患者从GSE21257获得数据集(21]。预后风险计分公式得到的训练集用于评估每个病人的风险根据每个样本中确定候选基因的表达,因此。这些患者被贴上这些高风险和低风险的基于分数分配给他们,和他们的预后差异进一步分析。

2.5。基因集富集分析

我们的骨肉瘤患者预后风险模型分为两类,称为高和低风险组,然后两组之间的差异表达基因(度)与两个阈值选择 值< 0.05。基于基因本体论(去)的浓缩的这些显著差异表达基因进行了分析与包clusterProfiler R,先前的研究中描述(23- - - - - -25]。

3所示。结果

3.1。操作系统生存预测预后基因的筛选

相对应的基因表达数据和临床数据从目标数据库检索的82名患者。介绍了共16034个基因作为变量预后风险模型的条件下,这些基因表现 在样本总数的一半以上。单变量Cox回归了,绘制相应的kaplan - meier曲线在所有这些基因,其中50显著相关的基因得到了病人的生存( 值< 0.01)。随后,这些基因的贡献被随机森林算法排名,前50名的基因被选为初始候选基因的建设预后风险模型。

使用这些50基因,骨肉瘤的预后风险模型的发展,基于多变量cox回归。其中,五个基因,包括CD180,MYC,PROSER2,DNAI1,FATE1,重大贡献模型被选为候选基因在骨肉瘤的最佳预后风险模型。值得注意的是,低表达CD180和高的表达MYC,PROSER2,DNAI1,FATE1确定导致糟糕的预后结果在操作系统(数据吗1(一)- - - - - -1 (e))。这些结果表明,五个预后基因高度与操作系统相关的预后。

3.2。使用五个建设多变量Cox模型预后的基因

鉴于5基因,建立多变量Cox模型来评估操作系统病人的风险。具体地说,五个基因显示与操作系统总体存活率显著联系单变量和多变量Cox模型(表1)。TARGET-osteosarcoma中的所有82名患者的数据集作为训练集,然后我们估计他们的风险分数根据模型。他们被分为高和低风险组的平均风险评分。一致,高危人群的整体存活率明显短于低风险组(图2(一个))。从这个分层,我们注意到死者的病人发现高危人群更比低风险组(图2 (b), 值< 0.05)。按照Cox回归分析,CD180四个基因表达下调,另一个是调节在高危人群(图2 (b))。这些结果表明,五个基因获得良好的拟合效果总体存活率的操作系统。


特性 单变量cox回归 多变量cox回归
风险比 价值 风险比 价值

CD180 0.43 2.19 - - - - - -03 0.44 4.98 - - - - - -03
MYC 1.01 9.60 - - - - - -05年 1.01 1.18 - - - - - -05年
PROSER2 1.10 6.52 - - - - - -06 1.09 4.60 - - - - - -03
DNAI1 1.53 8.54 - - - - - -06 1.42 2.19 - - - - - -03
FATE1 6.08 2.62 - - - - - -05年 7.05 4.05 - - - - - -06

3.3。验证预后风险模型的操作系统

验证的预后价值five-gene-based Cox模型,我们收集到一个独立的基因表达数据集与34 OS样本基因表达与入世GSE21257综合(GEO)。34 OS样本估计的风险分数使用五个基因的表达水平在每个个体。同样,这些样本也分为高风险和低风险组的平均得分。一致,在高危人群,我们观察到更多的死亡比低风险组病人和更短的总生存期( 值< 0.05,图3(一个))。公里曲线表明高风险的患者表现出明显比低风险组的预后差( 值< 0.05,图3 (b))。这样的显著差异在两个风险组之间的总体生存时间验证设置建议five-gene-signature Cox模型可以有效地预测预后风险操作系统。

3.4。基于Five-Gene-Based Cox风险评分模型操作系统作为一个独立的预后因素

为了评估这个风险评分的独立,我们进行了单变量和多变量Cox回归,使用风险评分和其他三个临床变量。考克斯在单变量和多变量分析,风险评分是唯一的变量与生存时间(表2)。此外,我们发现白色OS患者可能有较低的风险比其他民族多变量Cox模型统计显著性较低( 值< 0.1)。这些结果表明,风险评分可以在操作系统功能作为一个独立的预后指标。


特性 单变量cox回归 多变量cox回归
价值 人力资源 降低95%可信区间 上95%可信区间 价值 人力资源 降低95%可信区间 上95%可信区间

风险评分 4.42 - - - - - -12 19.7 4.64 15.6 4.34 - - - - - -11 12.3 5.85 26.1
性别(女性/男性) 0.30 0.68 0.33 1.41 0.17 0.54 0.23 1.29
种族(白色/其他) 0.23 0.64 0.30 1.34 0.07 0.47 0.21 1.08
年龄 0.82 1 1 1 0.82 1 1 1

3.5。两个风险组之间的生理差异

微分表达式分析病人的目标操作系统数据集,在高和低风险患者贴上的。351显著差异表达基因被确定(阈值: 值< 0.05),其中,与低风险组相比,138年和213年基因表现出增加和减少高危人群(图表达4(一)),分别。

基因本体论(去)基因富集分析显示的几种条件,包括白细胞粘附和信息和T细胞激活和监管,积极调节白细胞粘附和信息,和积极的调节T细胞激活,被这些度(图高纯度4 (b)),这表明不同免疫微环境在高风险和低风险组的患者可能负责他们的预后结果的差异。进一步分析显示,主要组织相容性复合体(MHC)二类基因表达下调的高危人群(图4(c)),这表明缺乏抗原处理和表示对肿瘤细胞可能会降低免疫力,从而导致更糟糕的预后的操作系统。总的来说,结果表明,骨肉瘤患者的免疫微环境中扮演着重要的角色在操作系统病人的预后。

4所示。讨论

背后的分子基础操作系统肿瘤发生、进展、转移已经吸引了越来越多的关注。尽管广泛的研究了某些基因的生物功能操作系统,目前仍缺乏有效的生物标记操作系统生存的预测。与此同时,操作系统的预测和比较患者不同的临床结果可以帮助临床医生做出诊断或治疗的改善策略。

在目前研究中,82位操作系统和样品RNA-seq匹配数据和临床数据收集从目标数据库。识别操作系统生存的预后基因预测,我们选择排名前50的基因的贡献作为初始候选基因预测风险模型,根据随机森林模型。多变量Cox回归分析表明,五个预测因子包括CD180的预后模型,MYC, PROSER2, DNAI1, FATE1最优多变量Cox回归模型。在五个预后的基因,只有CD180,这可能导致NF-kappa-B激活(26),与操作系统生存负相关。正如我们所知,CD180是淋巴细胞的细胞表面分子,和它的高表达可能表明高抗癌活性的淋巴细胞,从而抑制系统肿瘤的生长。CD180以及CCR2,已被确认为强劲的药效学肿瘤和血液生物标志物临床使用BRD4 /押注抑制剂(27]。除了DNAI1另一个三个基因MYC(28),PROSER2(29日),而FATE1(30.),已报告与一些癌症有关。

此外,我们还分层操作系统进入高风险和低风险组患者根据风险评分估计的多变量Cox回归模型。OS病人的分层验证集的基于风险评分预测的多变量Cox回归模型进一步证明我们的模型是重要的和健壮(生存率较, )。应该注意的是,只有34个主要组织用于验证集,这可能是一个主要限制five-gene-based预测模型。此外,我们还研究了高风险和低风险组之间的生理差异,发现关于免疫力高纯度的生物过程之间的差异表达基因两个风险组。MHC II类基因的表达减少在高危操作系统(图样本4(c)),这表明这些样本可能失去的能力呈现和处理细胞外的病原体。一致,MHC II级基因表达下调与不利的结果和相关的操作系统(31日,32]。

总之,我们建立了一个五个基因在骨肉瘤的预后风险模型,分层的骨肉瘤分为高风险和低风险组样品,并发现潜在的与预后相关的分子机制,这不仅提供了一些证据,相关人员也改善我们对操作系统的理解的预后。

数据可用性

骨肉瘤RNA-seq数据(TPM)和匹配的操作系统病人的临床数据从目标数据库(https://ocg.cancer.gov/programs/target)和数据集的GSE21257被用于进一步的验证。

的利益冲突

作者声明没有利益冲突,关于这个手稿。

引用

  1. a . Longhi c . Errani m . De Paolis m·麦古利和g .减速,功率”主要在儿童年龄:骨骨肉瘤的艺术,“癌症治疗的评论,32卷,不。6,423 - 436年,2006页。视图:出版商的网站|谷歌学术搜索
  2. m·e·安德森,“更新在骨肉瘤的生存,”北美的骨科诊所卷,47号1,第292 - 283页,2016。视图:出版商的网站|谷歌学术搜索
  3. d·d·摩尔和h . h .并“骨肉瘤,”癌症治疗和研究卷,162年,第92 - 65页,2014年。视图:出版商的网站|谷歌学术搜索
  4. l . Mirabello r·普费弗·g·墨菲et al .,“高度在诊断和出生体重作为骨肉瘤的危险因素,”癌症的原因与控制,22卷,不。6,899 - 908年,2011页。视图:出版商的网站|谷歌学术搜索
  5. l . s . Chen Yang f . Pu et al .,“高出生体重增加了骨肿瘤的风险:系统回顾和荟萃分析,“国际环境研究和公共卫生杂志》上,12卷,不。9日,第11195 - 11178页,2015年。视图:出版商的网站|谷歌学术搜索
  6. r . s . Arora e . Kontopantelis r·d·阿尔斯通t .伊甸园,m . Geraci和j . m .桦木、“高度之间的关系在年轻人和骨肿瘤诊断:一个荟萃分析,“癌症的原因与控制,22卷,不。5,681 - 688年,2011页。视图:出版商的网站|谷歌学术搜索
  7. m . Kansara m·w·邓·m·j·史密斯和d·m·托马斯”转化生物骨肉瘤,”自然评论癌症,14卷,不。11日,第735 - 722页,2014年。视图:出版商的网站|谷歌学术搜索
  8. j . r . Musselman t . l . Bergemann j·a·罗斯et al .,“Case-parent青春期的荷尔蒙的变化分析基因和儿童骨肉瘤:儿童肿瘤组(齿轮)的一项研究中,“国际期刊的分子流行病学和遗传,3卷,不。4、286 - 293年,2012页。视图:谷歌学术搜索
  9. m z . Wang, g . Chen和陆x, z . Li”LncRNA SOX2-OT是小说为骨肉瘤患者预后的生物标志物,调节通过调节SOX2骨肉瘤细胞增殖和能动性,“IUBMB生活,卷69,不。11日,第876 - 867页,2017年。视图:出版商的网站|谷歌学术搜索
  10. n·m·Bernthal n . Federman f . r . Eilber et al .,“长期的结果(> 25年)的随机、前瞻性临床试验评估化疗患者的高档,可操作的骨肉瘤,”癌症,卷118,不。23日,第5893 - 5888页,2012年。视图:出版商的网站|谷歌学术搜索
  11. m . p .链接,a . m . Goorin a . w .守财奴et al .,“辅助化疗的作用在骨肉瘤患者复发存活率的肢体,”《新英格兰医学杂志》上,卷314,不。25日,第1606 - 1600页,1986年。视图:出版商的网站|谷歌学术搜索
  12. d . n .杰夫·e·弗雷3日来,和y主教,“辅助甲氨蝶呤,citrovorum-factor骨肉瘤的治疗。”《新英格兰医学杂志》上,卷291,不。19日,994 - 997年,1974页。视图:出版商的网站|谷歌学术搜索
  13. p·a·迈耶斯j·h·希利,a·j·周et al .,“添加磷酸盐为治疗骨肉瘤化疗,”癌症,卷117,不。8,1736 - 1744年,2011页。视图:出版商的网站|谷歌学术搜索
  14. j·h·j . y .赵j.y. Lim畅et al .,“基因表达基于签名在胃癌预后风险评分,“临床癌症研究,17卷,不。7,1850 - 1857年,2011页。视图:出版商的网站|谷歌学术搜索
  15. g . h, s . Wang Xiao et al .,“综合评价发表的基因表达预后签名biomarker-based肺癌临床研究”《肿瘤学,28卷,不。4、733 - 740年,2017页。视图:出版商的网站|谷歌学术搜索
  16. d . j . Tang香港,问:崔et al .,“乳腺癌的预后基因通过基因识别co-expression网络分析,“在肿瘤领域,8卷,p。374年,2018年。视图:出版商的网站|谷歌学术搜索
  17. 刘x, y, y . et al .,“Pan-cancer基因组和转录组分析1699年儿科白血病和固体肿瘤,”自然,卷555,不。7696年,第376 - 371页,2018年。视图:出版商的网站|谷歌学术搜索
  18. f . y . Li通用电气和美国王”四种基因预测骨肉瘤患者的生存目标数据库的基础上,“杂志的生物能学和生物膜,52卷,不。4、291 - 299年,2020页。视图:出版商的网站|谷歌学术搜索
  19. g .吴邦国委员长和m .张”,一个新颖的基于8基因风险评分模型和计算图表预测骨肉瘤患者的总生存期,“BMC癌症,20卷,不。1,p。456年,2020。视图:出版商的网站|谷歌学术搜索
  20. t . s . Liu j . Liu x Yu沈,和傅问:“二基因的识别(PML-EPB41)签名与独立的骨肉瘤预后价值,”在肿瘤领域,9卷,2020年。视图:出版商的网站|谷歌学术搜索
  21. e . p . Buddingh m . l . Kuijjer r . a . Duim et al .,“肿瘤浸润与转移抑制巨噬细胞相关高档骨肉瘤:巨噬细胞激活剂治疗的理由,“临床癌症研究,17卷,不。8,2110 - 2119年,2011页。视图:出版商的网站|谷歌学术搜索
  22. 王顾,x, r . et al .,“分析突变和肺腺癌的临床病理的特点与透明细胞组件,”Oncotarget,7卷,不。17日,第24603 - 24596页,2016年。视图:出版商的网站|谷歌学术搜索
  23. x史,黄t . j . Wang et al .,“下一代测序识别小说与罕见变异基因异常肺总静脉连接,”eBioMedicine,38卷,第227 - 217页,2018年。视图:出版商的网站|谷歌学术搜索
  24. 基因本体论财团,c . a球,j·a·布莱克等人et al .,“基因本体资源:20年,仍然强劲,”核酸Res卷,47号D1, D330-D338, 2019页。视图:出版商的网站|谷歌学术搜索
  25. 佐藤m . Kanehisa y、m .川岛m . Furumichi和m .田边”KEGG作为基因和蛋白质注释,参考资源”核酸的研究,44卷,不。D1, D457-D462, 2016页。视图:出版商的网站|谷歌学术搜索
  26. p . Tieri a . Termanini e·贝拉s Salvioli m .卡普里岛和c . Franceschi”NF -图表κB通路interactome地图。”《公共科学图书馆•综合》,7卷,不。第三条e32678, 2012年。视图:出版商的网站|谷歌学术搜索
  27. t·c·叶,g·奥康纳,p . Petteruti et al .,“识别CCR2和CD180健壮的药效学肿瘤和血液生物标志物临床使用BRD4 /押注抑制剂,”临床癌症研究,23卷,不。4、1025 - 1035年,2017页。视图:出版商的网站|谷歌学术搜索
  28. c . v .党“MYC在癌症,”细胞,卷149,不。1,22-35,2012页。视图:出版商的网站|谷歌学术搜索
  29. l . s .阮h . g . Kim j·a·罗森菲尔德et al .,“贡献涉及nonsense-mediated mRNA衰变通路基因的拷贝数变异神经发育障碍,”人类分子遗传学,22卷,不。9日,第1825 - 1816页,2013年。视图:出版商的网站|谷歌学术搜索
  30. k . e . Maxfield p . j .τ,k·科克兰et al .,“综合功能描述cancer-testis抗原定义专参与癌症的多个特征,“自然通讯》第六卷,没有。1,p。8840年,2015。视图:出版商的网站|谷歌学术搜索
  31. l . Endo-Munoz a . Cumming s·萨默维尔迪金森,n . a·桑德斯,“骨肉瘤的特点是减少表达osteoclastogenesis标记和抗原表达与正常骨相比,“英国癌症杂志》,卷103,不。1,第81 - 73页,2010。视图:出版商的网站|谷歌学术搜索
  32. 李x m . Li, h . et al .,“关键基因在抑制骨肉瘤预后价值转移使用综合分析,“BMC癌症,20卷,不。1,p。65年,2020。视图:出版商的网站|谷歌学术搜索

版权©2020 Junfeng陈等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点331年
下载282年
引用

相关文章

文章奖:2020年杰出的研究贡献,选择由我们的首席编辑。获奖的文章阅读