乳腺癌(BRCA)是死于癌症的主要原因之一,妇女和代表一个异构组肿瘤起源于上皮细胞衬乳导管(
转录因子(TFs) dna结合蛋白质与基因的启动子序列和随后调节基因的表达
在目前的研究中,我们确定了几个survival-related TFs的预测和开发了一个11-TF签名BRCA患者的无病生存期(DFS)通过分析基因表达和相应的临床数据的BRCA患者癌症基因组图谱(TCGA)。TF签名验证的预测性能3独立从基因表达数据集综合(GEO)并与4以前公布的基因签名。此外,协会之间的风险评分基于11-TF签名和癌症的标志,和免疫细胞渗透了。
所有数据分析使用R软件(
这项研究的流程图。
2018年,兰伯特等人发表了一篇引人注目的评论覆盖≥1600可能人类TFs潜在的人类生理学和疾病(
共有950名患者相应的基因组数据(读计数)和临床信息包括DFS TCGA数据是从数据库中,作为训练集。基因表达谱和相应的临床信息的BRCA患者选择在线公共基因表达综合(地理,
Cox回归分析的临床病理因素之间的关系(包括风险分数)和BRCA患者的无病生存。
| 变量 | 集团 | 患者(<我nline-formula>
|
单变量分析 | 患者(<我nline-formula>
|
多变量分析 | ||
|---|---|---|---|---|---|---|---|
| 人力资源(95%置信区间) |
|
人力资源(95%置信区间) |
|
||||
|
|
|||||||
| 风险评分 | 低/高 | 475/475 | 4.18 (2.50 - -6.97) |
|
418/411 | 4.40 (2.31 - -8.39) |
|
| 年龄 | ≤50 / > 50 | 290/660 | 0.67 (0.43 - -1.03) |
|
251/578 | 0.66 (0.39 - -1.11) |
|
| 病理阶段 | i ii / iii iv | 723/216 | 3.34 (2.15 - -5.19) |
|
645/184 | 4.28 (2.49 - -7.34) |
|
| ER状态 | N / P | 214/697 | 0.49 (0.31 - -0.77) |
|
191/638 | 1.35 (0.32 - -5.61) |
|
| 公共关系状态 | N / P | 304/604 | 0.46 (0.30 - -0.71) |
|
274/555 | 0.56 (0.26 - -1.19) |
|
| HER2状态 | N / P | 680/160 | 0.93 (0.47 - -1.82) |
|
671/158 | 0.72 (0.30 - -1.69) |
|
| 三负 | 没有/是的 | 804/146 | 1.62 (0.97 - -2.71) |
|
685/144 | 1.89 (0.43 - -8.35) |
|
|
|
|||||||
| 风险评分 | 低/高 | 164/163 | 2.41 (1.58 - -3.68) |
|
164/158 | 2.22 (1.43 - -3.43) |
|
| 年龄 | ≤50 / > 50 | 209/118 | 0.74 (0.48 - -1.14) |
|
206/116 | 0.79 (0.49 - -1.27) |
|
| T台 | i ii / iii iv | 101/188 | 1.93 (1.50 - -2.49) |
|
100/186 | 1.22 (0.86 - -1.74) |
|
| N阶段 | N0 / N1-3 | 137/190 | 3.73 (2.26 - -6.15) |
|
135/187 | 3.46 (1.99 - -6.01) |
|
| M阶段 | M0、M1 | 319/8 | 21.96 (10.49 - -45.99) |
|
315/7 | 5.78 (2.02 - -16.58) |
|
| 相邻CT | 没有/是的 | 54/268 | 2.07 (1.07 - -3.99) |
|
54/268 | 1.34 (0.65 - -2.76) |
|
|
|
|||||||
| 风险评分 | 低/高 | 126/126 | 2.83 (1.77 - -4.53) |
|
115/113 | 3.04 (1.80 - -5.11) |
|
| 年龄 | ≤50 / > 50 | 92/160 | 1.14 (0.72 - -1.79) |
|
81/147 | 1.31 (0.79 - -2.17) |
|
| T台 | i ii / iii iv | 178/66 | 1.70 (1.06 - -2.73) |
|
164/64 | 1.20 (0.72 - -2.01) |
|
| N阶段 | N0 / N1-3 | 116/133 | 1.54 (0.98 - -2.40) |
|
105/123 | 1.61 (0.97 - -2.69) |
|
| ER状态 | N / P | 110/140 | 0.66 (0.43 - -1.02) |
|
100/128 | 0.46 (0.17 - -1.26) |
|
| 公共关系状态 | N / P | 124/126 | 0.84 (0.55 - -1.30) |
|
114/114 | 1.43 (0.60 - -3.38) |
|
| HER2状态 | N / P | 207/26 | 1.59 (0.84 - -3.03) |
|
204/24 | 1.09 (0.42 - -2.85) |
|
| 三负 | 没有/是的 | 160/85 | 1.19 (0.74 - -1.89) |
|
145/83 | 0.88 (0.26 - -2.90) |
|
|
|
|||||||
| 风险评分 | 低/高 | 52/52 | 3.68 (1.97 - -6.88) |
|
51/50 | 4.18 (2.13 - -8.17) |
|
| 年龄 | ≤50 / > 50 | 27/77 | 0.66 (0.36 - -1.21) |
|
25/76 | 0.72 (0.36 - -1.46) |
|
| N阶段 | N0 / N1-3 | 45/59 | 4.35 (2.16 - -8.76) |
|
44/57 | 4.72 (2.24 - -9.95) |
|
| ER状态 | N / P | 34/67 | 0.44 (0.24 - -0.79) |
|
34/67 | 0.40 (0.21 - -0.77) |
|
人力资源:风险比;置信区间:置信区间;呃:雌激素受体;公关:孕激素受体;HER2 / erbb2:表皮生长因子受体2;相邻CT:相邻的化疗;N:消极;P:积极的。
肿瘤样本和匹配相邻正常组织收集从20 BRCA病人在吉林大学第三医院(吉林、中国),2020年1月至2020年11月。口头同意了所有的病人。所有实验的伦理道德委员会批准吉林大学第三医院(吉林,中国)。所有样品都是匿名分析之前保证保护隐私。
Limma包是用来识别差异表达TFs 114双的BRCA和正常控制样品(
确定候选人预后TF,单变量回归分析进行评估的相关性差异表达TFs和DFS BRCA队列。只有TFs考克斯<我nline-formula>
为进一步验证的预测性能TF签名,时间的AUC接受者操作特征(ROC)曲线评估(
癌症特征总结数据集的相关信息,从而减少变异和冗余。这提供了更精确和简洁投入GSEA分析(
验证mRNA表达水平之间的TFs TCGA肿瘤和正常乳腺组织样本数据集,这些TFs mRNA表达水平是衡量在收集新鲜冷冻肿瘤组织样本中存在。随后,存在实施从癌症和收集的RNA正常溶解产物。总之,总RNA分离通过FastPure细胞/组织总RNA隔离设备V2 (Vazyme生物技术有限公司,南京,中国)根据制造商的指导方针。接下来,RNA转录到cDNA使用HiScript II第一链cDNA合成装备。所有反应都是使用一个实现AceQ普遍SYBR qPCR大师混合(Vazyme生物技术有限公司,南京,中国)在QuantStudio™5实时PCR系统(ABI,生活技术,热费希尔科学、沃尔瑟姆,妈,美国)。表达式计算为δ的褶皱变化阈值周期(<我nline-formula>
细胞类型鉴定评估相对子集的RNA转录(CIBERSORT)是一种算法,用于描述复杂组织的细胞成分基于基因表达谱(
生存使用kaplan meier方法进行估计(
在这项研究中,共有287个差异表达TFs被确定阈值以下的BRCA与正常对照组之间<我nline-formula>
识别的预后11-transcription因子(11-TF)签名。(一)火山差异表达TFs的情节。(b)差异表达TFs的热图。(c)无病生存期(DFS)曲线的12 survival-correlated TFs的高风险和低风险组。(d)套索回归分析的12 TF的候选人。(e)系数从套索算法获得12个TF的候选人。(f)预后11-TF签名的斯皮尔曼相关分析的预测乳腺癌的DFS (BRCA)。X:<我nline-formula>
单变量回归分析的DFS导致提取12 survival-associated TFs候选人预后签名,包括E2F2 EGR3, EMX1, FOXD1, FOXJ1, NKX6-1, NR3C2, PAX7, STAT4, MYBL2 ZNF552, MSX1。如图
细节的11个转录因子用于构造预后签名。
| 基因符号 | 基因稳定的ID | 基因型 | 空空的 | 基因开始(bp) | 基因(bp)结束 |
|---|---|---|---|---|---|
| E2F2 | ENSG00000007968 | 蛋白质编码 | 1 | 23506438 | 23531233 |
| EGR3 | ENSG00000179388 | 蛋白质编码 | 8 | 22687659 | 22693480 |
| EMX1 | ENSG00000135638 | 蛋白质编码 | 2 | 72916260 | 72936071 |
| FOXD1 | ENSG00000251493 | 蛋白质编码 | 5 | 73444827 | 73448777 |
| FOXJ1 | ENSG00000129654 | 蛋白质编码 | 17 | 76136333 | 76141245 |
| NKX6-1 | ENSG00000163623 | 蛋白质编码 | 4 | 84491987 | 84498450 |
| MSX1 | ENSG00000163132 | 蛋白质编码 | 4 | 4859665 | 4863936 |
| NR3C2 | ENSG00000151623 | 蛋白质编码 | 4 | 148078762 | 148444698 |
| PAX7 | ENSG00000009709 | 蛋白质编码 | 1 | 18630846 | 18748866 |
| STAT4 | ENSG00000138378 | 蛋白质编码 | 2 | 191029576 | 191151596 |
| ZNF552 | ENSG00000178935 | 蛋白质编码 | 19 | 57803841 | 57814913 |
缩写:装备=染色体。
我们接下来的表达模式分析11 TFs TCGA的数据库。正常样本,表达E2F2相比,FOXJ1, EMX1, PAX7, NKX6-1 FOXD1, ZNF552显著提高(<我nline-formula>
TF表达水平、患者复发状态和集群的性能。(a)表达模式的11个TF预后签名BRCA患者之间(肿瘤)和正常对照组(正常),TCGA数据库。(b)的mRNA表达水平实验验证11 TF签名BRCA患者之间(肿瘤)和正常对照组(正常)。(c)复发BRCA患者在高风险和低风险组的状态。(d)的分层集群性能11预后TFs高风险和低风险组之间。
接下来,我们分析了生存预测能力的风险评分,TCGA数据库,这被认为是训练集,如图
kaplan meier和接受者操作特征(ROC)曲线的BRCA患者分层风险评分。(a) kaplan meier和ROC曲线BRCA患者分层的风险评分在训练数据集(TCGA)和验证数据集(GSE20685, GSE21653, GSE42568)。(b) kaplan meier对先前发表的预测曲线和ROC曲线签名。
评估的敏感性和特异性11-TF签名,时间对DFS ROC曲线预测构造(图
在这项研究中,我们11-TF签名与4以前公布的预后签名面板:9-TF签名报道陈et al。
在这里,我们首先进行单变量回归分析探讨临床和病理因素之间的相关性和BRCA DFS的病人。如表所示
我们进一步进行分层分析患者临床病理的变量,分子亚型和风险评分。如图
kaplan meier和ROC曲线的BRCA患者临床病理因素分层,分子亚型和风险评分。(a) kaplan meier和ROC曲线BRCA患者分层的临床病理的因素和风险评分。(b) kaplan meier和ROC曲线的BRCA患者分层分子亚型和风险评分。
使用CIBERSORT方法,我们估计22免疫细胞亚型的丰度调查之间的关系风险评分和肿瘤微环境中免疫细胞浸润。如图
的作文分数高和低风险组之间的免疫细胞。
调查如果11-TF签名与肿瘤生物学过程相关,基因集富集(GSEA)进行了分析。如图
(GSEA)的特征基因集富集分析。(一)四个特征丰富的高危人群。(b)两个特征丰富低风险组中。
因为BRCA异构的特点,传统的预测因素似乎并不是足够的BRCA患者的生存。因此,survival-specific预后有价值的生物标志物的发展是至关重要的。近年来,一些研究已经确定基因可能作为预后指标BRCA面板。例如,陈等人。
11-TF预后模型是由E2F2 EGR3, EMX1, FOXD1, FOXJ1, NKX6-1, NR3C2, PAX7, STAT4 ZNF552, MSX1。在先前的研究中,陈等人报道,E2F家族共同或个别的TFs调节细胞增殖在癌症
癌症是一种复杂的多级过程涉及遗传和表观遗传变化,导致致癌基因的激活信号和/或肿瘤抑制信号的失活(
最近,在几项研究,表明肿瘤浸润免疫细胞与癌症患者的预后相关(
总之,我们已经确认和验证的预测预后11-TF签名DFS的BRCA患者。11-TF签名是一个独立的因素,可能作为一种补充临床病理因素的预后因素。
和/或使用的数据集分析在当前研究可从相应的作者以合理的要求。
TCGA的知情同意和地理科目得到TCGA的地理协会,分别。
我们国家没有利益冲突。
CF负责收集文献和写作。JD和NL提出这项工作的想法,进行数据分析,实现实验验证和修订后的手稿。
补充表S1:引物对qPCR。