文摘

肾脏肾透明细胞癌(KIRC)是最常见的癌症之一,与世界各地的高死亡率。许多研究提出,在KIRC基因可以用来预测预后。在这项研究中,RNA表达数据从下一代测序和523名患者的临床信息从癌症基因组图谱(TCGA)下载数据集之间的关系进行分析,以确定基因表达水平和KIRC患者的预后。一组5个基因与总生存时间显著相关识别和模型包含这五个基因是由Cox回归分析。kaplan meier和接受者操作特征(ROC)分析,我们证实,该模型有很好的敏感性和特异性。总之,这模型的表达式与KIRC患者的预后结果有关,而且可能有重要的临床意义。

1。介绍

近年来,肾癌的发病率和死亡率不断上升在世界各地(1]。2013年,近58000新病例发生,在美国的130001名患者死于肾癌(2]。其中,肾肾透明细胞癌(KIRC)是最常见的组织学亚型和肾癌病例的-80%(占70%3]。KIRC组织是对传统化疗药物(4变化很多[],和患者的结果5]。虽然KIRC上的各种研究已经完成,KIRC患者的临床预后仍然很差;90%的患者的生存时间转移KIRC小于5年6]。因此,迫切需要找到潜在的预后的分子生物标志物KIRC,也是最重要的步骤之一,预后预测的病人。

信使RNA是最常见的分子标记之一。许多研究表明,基因参与了许多癌症的生物过程和相关的患者预后生存时间。例如,SIPL1(Shank-Interacting蛋白质像1)据报道,超表达在乳腺癌肿瘤发生,和抑制的表达SIPL1可能有助于抑制乳腺癌[7]。PLA2G16已被证实为原发性骨肉瘤患者的一个重要的预后因素(8]。Dicerl被发现在低水平表达在鼻咽癌组织中无论在基因或蛋白质的水平,而且它也可能是一个新的预后生物标志物(9]。至于KIRC,几项研究已经进行基因表达检测签名可以提供诊断和预后信息(10- - - - - -12]。通用电气等人已经确定了microrna的签名包括22个microrna小说作为一个独立的预测病人的结果(13]。玉等人发现的表达艾哈迈德(细胞death-inducing DFF45-like效应)是一种新型的预测预后[14]。然而,详细分析之间的关联基因表达水平与患者的生存时间KIRC仍然有限。

本文的目的是确定相关基因KIRC患者的总生存时间通过分析高通量TCGA RNA序列数据下载(15]。总之,主要目标如下:(1)确定基因可以预测KIRC病人的存活时间,并构造一个模型;(2)评估预后价值,敏感性,特异性的模型;和(3)调查的独立性和普遍性的基因标记在不同KIRC阶段。

2。材料和方法

2.1。从TCGA KIRC基因表达数据

到2015年1月,TCGA数据库(https://tcga-data.nci.nih.gov/tcga/)包含533 KIRC患者样本(15]。基因表达分析是由使用Illumina公司HiSeq平台(Illumina公司Inc .)、圣地亚哥、钙、美国)。排除病人没有生存状态信息,UNC RNASeqV2 3级523例,包括20531个人类基因表达数据和相应的临床数据下载。然后523年KIRC样本随机分为训练集( )和测试集( )。标本id在两组补充表所示S1(在网上补充材料http://dx.doi.org/10.1155/2015/842784)。训练集是用来识别基因表达特征,用于验证和测试集。

2.2。统计分析

首先, 转换是用于规范RNA-seq表达式值(16]。随后,先前的报道(17,18),有显著的基因( )有关病人生存被Cox回归分析确定和随机生存forests-variable狩猎(RSFVH)算法(19]。考虑到模型与一个小数量的基因通常是伴随着实际上更好的价值,我们用两个基因Cox比例风险进行回归分析,三个基因,和五个基因,分别,希望能挖出一个更好的生存预测模型。然后,基于Cox回归分析,建立了一个风险评分公式计算每个病人的风险评分。据Margolin et al。20.和孟等。18),低风险和高风险群体的生存差异进行评估,和模型的敏感性和特异性生存预测也相比。

3所示。结果

3.1。病人的特点

本研究中使用的所有523名患者的临床和病理诊断为KIRC。临床阶段的肿瘤分为I - IV阶段基于Fuhrman核评分系统(21]。在这里,有260名患者从阶段1,57例从第二阶段,第三阶段125名患者,分别从第四阶段和81名患者。此外,平均年龄和523名患者的平均预后生存时间是61年,902天,分别。总结了所有的统计信息表1

3.2。检测相关基因在训练集KIRC患者的总生存时间

识别的基因可能会与病人的总生存时间在KIRC,单变量Cox回归分析(见材料与方法)对基因表达数据进行训练集,0.001的显著性水平,共有3849个基因被确定(表S2)。随后,100个基因与随机森林生存最大的重要值分析使用默认参数(22,23被选中。然后,1 - 5基因选择从79375495年100个基因不枚举算法和模型建立了多变量Cox回归分析。相互比较后,最好的模型(由AUROC索引)包括5基因(CKAP4、ISPD MAN2A2、OTOF SLC40A1)确定,这个模型的风险评分公式(0.422×表达的价值CKAP4)+(−0.443×表达式的值ISPD)+(0.551×表达式的值MAN2A2)+(0.330×表达式的值OTOF)+(−0.369×表达式的值SLC40A1)。这五个基因的信息见表2。和这些基因的功能也总结表3。此外,出错率(27.27%)和变量重要性值这五个基因的获得与RSFVH(图1)。从图可以看出1这五个基因有相对较大的重要性;CKAP4比其他因素更重要。以风险评分中位数为截止,262 KIRC患者分为低风险组( )和高危人群( )。生存分析是由使用kaplan meier log-rank统计测试方法。如图2(一个)kaplan meier曲线表明,患者在高危组明显( )更糟糕的预后与低风险组(图进行比较2(一个))。

3.3。验证Survival-Associated基因测试集

确定的预后潜力这签名,kaplan meier生存分析测试集。就像在训练集,基于单个病人的风险评分,患者在测试组分为低风险和高风险组和kaplan meier分析被用来比较病人生存的差异。统计上显著差异( 观察高危组和低风险组之间);换句话说,更高的风险评分与生存时间短(图2 (b)),这是同意,在训练集,揭示,这可能发挥重要作用在预测KIRC患者的生存。

进一步确认的临床表现这模型作为预测预后的生物标志物,接受者操作特征(ROC)分析估算基因签名患者生存的影响。和相应的AUROC计算通过雇佣三年为分界点。AUROC为0.783(图3),表明这模型具有较高的敏感性和特异性,可以作为预测患者的预后生存的生物标志物。

3.4。这模型的独立和普遍性

研究表明,年龄和临床阶段也与患者生存5,13,21]。检查这是否可以区分高危患者从低风险病人当病人年龄和阶段考虑,多变量Cox比例风险分析培训和测试集。五个基因的结果证实风险评分是独立于年龄和阶段,如表所示4。此外,这是否功能在不同KIIRC阶段也调查了使用kaplan meier和ROC分析。结果表明,在第三阶段和第四阶段,患者的生存时间之间截然不同的高危组和低风险组( ,图S1)。此外,AUROC在第二阶段,第三阶段,第四阶段是0.761,0.718,和0.715,分别(图S2),进一步揭示,这在不同临床阶段有预测价值。

4所示。讨论

KIRC是最常见的一种主要肾恶性肿瘤发病率和死亡率高(24]。然而,KIRC的理解是不完整的,没有临床工具预测病人的结果除了传统的临床参数。准确的数据从KIRC标本的临床检查可以帮助医生决定适当的治疗对患者(25]。因此,新型生物标记物的鉴定和验证实际KIRC研究的一个重要组成部分(占26]。在这项研究中,我们发现了一个这明显与病人生存523年基于全基因组RNA分析KIRC KIRC TCGA患者数据库。此外,我们确认了这可能被视为一个独立的预测预后生存在考虑各种变量包括年龄和阶段,在不同阶段也是普遍的。

许多先前的研究基因KIRC主要考虑一些已知的癌症相关的基因。例如,魏等人发现,高表达的垂体tumor-transforming基因1 (PTTG1)KIRC病人被使用中存在与不良预后相关,免疫组织化学(27]。Peters等人证明,基因表达水平低GATA1GATA2肿瘤侵犯和生存时间短有关KIRC [28]。对五个基因在这项研究中,我们确定了所有人也被报道与癌症有关。事实证明,CKAP4可以用来区分主要唾oncocytic病变和转移有效碾压混凝土在可疑的情况下有100%的准确度(29日和淋巴转移相关30.,31日]。突变OTOF功能触发器膜融合和胞外分泌,可能提供钙信号和癌症之间的联系(22,32,33]。SLC40A1是一种细胞膜蛋白已被确认调解细胞铁流出(23,34),导致入侵表型(35]。突变ISPD可能会导致Walker-Warburg综合症(36,37]。MAN2A2在肝细胞癌(表达下调38]。然而,到目前为止,这样的预测标记并不KIRC患者的分析和分子研究这些基因在KIRC尚未报道。然而,我们的研究表明,这些基因的表达与患者的生存时间。ROC曲线表明,AUROC大约是0.8,考虑到大AUROC通常意味着一个更好的预测模型(6,39),我们的研究进一步证明了这是一种新型的预后标记精度高和具有重要的临床意义。此外,这是一个独立的预测,这是普遍的在不同的阶段。在不同阶段,ROC分析显示高敏感性和特异性(AUROC > 0.7)除了第一阶段,可能是因为第一阶段是生长缓慢的肿瘤,癌细胞不侵袭性和转移性,病人死于KIRC数量小于其他阶段(40]。我们发现,病人死于第一阶段的平均年龄是67多,这是高于其他阶段,显示的年龄对KIRC预后诊断可能会有一些影响,和部分的死亡是由于随着年龄的增长而增加疾病死亡率的风险。因此,这些结果暗示,这明显重要的诊所。这些基因的功能的机制尚不清楚。此外,这还没有在临床试验中测试。实验进一步研究这些基因和精心设计的研究应进行核实我们的发现,从而更好的理解他们的角色在预测KIRC预后。

5。结论

总之,这与患者的生存被确定通过执行Cox回归分析在训练集和kaplan meier分析。随后,kaplan meier和ROC分析测试组进一步表明,这可以作为一种新的生物标志物预测KIRC病人的治疗效果。此外,多变量Cox回归分析表明,这是一个独立的预测因素。这些结果表明,这可能有助于预测生存有重要临床意义。

缩写

KIRC: 肾脏肾透明细胞癌
TCGA: 癌症基因组图谱
RSFVH: 随机生存forests-variable狩猎
中华民国: 接受者操作特征。

利益冲突

作者宣称没有利益冲突。

作者的贡献

Yueping詹的构思和设计研究,进行数据分析,并解释整个结果。郭18进行数据分析和起草。应张和羌王帮助起草。徐Xin-jian进行数据分析和帮助起草。朱Liucun参与的设计研究和解释结果。所有作者阅读和批准了期末论文。Yueping詹和郭18同样这项工作。

确认

这项工作是由上海省青年科学基金(批准号12 zr1444200),中国国家自然科学基金(批准号31471200),基础的全国优秀博士论文的作者中国(201134)、江苏省医生收集计划,上海大学的高性能计算平台。

补充材料

表S1示例列表和信息的患者在训练集和测试集。表S2单变量Cox回归分析和显著性水平为0.001揭示重要基因表达和生存时间之间的关系。图S1 kaplan meier曲线分析不同临床阶段的测试集。双边生存率较被用来确定生存差异。接受者操作特征图S2 (ROC)分析的敏感性和特异性,这模型在预测存活时间患者不同临床阶段的测试集。

  1. 补充材料