文摘
背景。了解癌症相关的成纤维细胞的作用有限(CAF)肿瘤微环境的三阴乳腺癌(TNBC)。方法。三百三十五年TNBC四个样本数据集进行了检索和分析。为了确定CAF亚型通过结合基因表达谱,采用无监督聚类分析。预后,丰富途径、免疫细胞、免疫分数,和肿瘤纯度CAF亚型之间的比较。最高的基因通过生物信息学分析选择的重要性。机器学习模型是建立预测TNBC CAF通过这些选择基因亚型。结果。TNBC样本分为两CAF亚型(CAF +和CAF -)。CAF -亚型TNBC与总体生存时间越长,比CAF +亚型的免疫细胞。CAF -和CAF +丰富的几种途径和细胞外基质通路,分别。生物信息学分析发现9 CAF subtype-related标记(ADAMTS12、AEBP1 COL10A1, COL11A1, CXCL11, CXCR6, EDNRA, EPPK1,和WNT7B)。我们构建一个健壮的随机森林模型使用这些9基因,和曲线下的面积(AUC)模型的值为0.921。结论。当前的研究确定了CAF亚型基于基因表达谱,发现CAF亚型有显著不同的总生存期,免疫细胞,免疫治疗反应率。
1。介绍
乳腺癌(BC)最常见的癌和女性癌症死亡的第二大原因。有超过220万名患者被诊断为公元前,造成约070万人死亡的2020年(1]。公元前是一种异构的疾病,包括公元前三阴性(TNBC)和nontriple-negative (NTNBC)。缺乏雌激素受体(ER)、孕激素受体(PR),和人类表皮生长因子受体2 (HER2) TNBC的特点(公元前15%到20%的样本)2]。TNBC患者5年生存率比那些与其他类型的BC。例如,30%的人无法诊断后存活5年(3]。TNBC患者主要治疗与化疗,没有可供他们(靶向治疗4]。目前迫切需要开发新的疗法对TNBC患者。
最近的研究表明,肿瘤微环境(时间)对关键功能在肿瘤的生长和发展控制。时间是由肿瘤细胞,以及支持细胞基质细胞和免疫细胞浸润等(5]。在多种实体瘤类型,癌症相关的成纤维细胞(战乱国家)被发现的一个最普遍的基质细胞(6]。战乱国家由静止战乱国家(qCAFs) tumor-restraining战乱国家(rCAFs)和肿瘤促进战乱国家(pCAFs) [7]。在这三种类型的战乱国家,qCAFs rCAFs通常在低阶段发现癌症,和pCAFs检测到癌症晚期。大量研究表明,战乱国家扮演着重要的角色在各种protumorigenic生物过程,如肿瘤细胞的入侵,抵抗化疗,和逃避免疫细胞8,9]。例如,战乱国家可以促进肿瘤发展提供氧气和抑制免疫细胞的时间(10]。然而,其他研究表明,战乱国家可以发挥一个肿瘤抑制影响时间(11]。例如,一项研究发现,战乱国家至关重要的抑制影响纤维肉瘤(12]。收集这些研究的努力体现了重要性,战乱国家对TNBC预后的影响应该澄清。
免疫检查点封锁(ICB)如PDL1 / PD1抗体与改善临床结果在TNBC,使得TNBC患者[银行独立委员会一个吸引人的治疗选择13]。Progress-free生存(PFS)是大大大PD-1抗体组比对照组(9.7个月)(5.6个月)在一项随机、双盲、三期TNBC试验(NCT02819518)(值= 0.0012)(14]。然而,只有18.5%的TNBC KEYNOTE012试验样本反应PD1 / PDL1抗体,这远非令人满意(15]。根据新的研究,TNBC不是一个独特的疾病,和子组/亚型的识别在TNBC样本可能有助于找到合适的病人PD1 / PDL1抗体(16]。
对这个目的,我们分析和比较CAF亚型TNBC发现数据集的样本,以及披露其分子和生物属性。在训练数据集,CAF +亚型与不良预后有关。然后,我们建立了一个预测模型来预测CAF亚型使用机器学习方法基于9基因。一个独立样本的预测CAF亚型乳腺癌数据集显示,CAF +亚型临床疗效不佳。银行独立委员会的数据集的结果也证明了CAF亚型对TNBC抵抗ICB有至关重要的影响。
2。材料和方法
2.1。病人和标本
四TNBC的数据集和335个样本被利用作为CAF亚型的发现数据集分类。这四个数据集来自癌症基因组图谱(TCGA) (https://portal.gdc.cancer.gov/)和基因表达综合(GEO) (https://www.ncbi.nlm.nih.gov/geo/)。发现数据集包括GSE19615 (28 TNBC样本)17),GSE21653 (84 TNBC样品)18),GSE58812 (107 TNBC样品)19],TCGA (116 TNBC样本)。基于R GEOquery包(20.),GSE19615的规范化表达谱,GSE21653, GSE58812被加入从地理网站检索数据。TCGA-TNBC数据集的三级原始计数表达谱检索使用的TCGAbiolinks R包(21]。TCGA的日期下载表达谱和地理数据集是9月20日,2021年和2021年9月27日。创建的纤维母细胞亚型乳腺癌是使用一个独立的验证数据集(METABRIC数据集)22]。313 er阴性和her2阴性乳腺癌获得总生存期(OS)信息和基因表达矩阵从METABRIC检索(16]。
CAF亚型之间的联系,银行独立委员会反应是评估使用三个不同的数据集(GSE78220 [23],GSE35640 [24],IMvigor210 [25])患者组成的独立委员会。GSE78220包含预处理mRNA表达28 anti-PD-1治疗黑色素瘤的数据样本。GSE35640包含预处理mRNA表达数据从65年MAGE-A3免疫治疗治疗黑色素瘤和肺癌样本。IMvigor210包含预处理mRNA表达数据从348年anti-PD-L1治疗癌症样本。
2.2。批处理效应校正和共识集群(CC)分析
使用基因变异分析(GSVA) R程序,GSE19615的表达谱,GSE21653, GSE58812, TCGA-TNBC CAF基因的转化为矩阵集。综述了CAF相关生物标记和基因集研究和补充表中列出1(26- - - - - -28]。批处理效果显示之前和之后使用主成分分析(PCA)的转换。R聚类算法从共识“ConsensusClusterPlus”包是用来确定可能CAF亚型的表达CAF基因集的矩阵(29日]。最优簇数一致聚类算法选择基于跟踪情节,三角洲地区,平均轮廓宽度值,并提供结果(30.]。
2.3。Single-Sample基因集富集分析(ssGSEA)和估计
在从Bindea补充数据的研究中,得到了相对应的基因集免疫细胞(31日]。通过应用ssGSEA方法从GSVA包,TNBC的浓缩的28免疫细胞样本测定的基因表达矩阵。通过估计算法、基质免疫分数,计算了纯度和肿瘤基因表达矩阵。肿瘤基质的值、免疫分数和纯度被规范化的min-max正常化。“Min-max正常化是一种最常用的数据标准化的方法。基质的最小值,免疫分数,和肿瘤纯度是转化为0,最高的价值转化为1,其他值被转换成一个值范围从0到1。我们的下一步是比较不同CAF亚型之间的差异的学生的 - - - - - -测试。
2.4。差异表达基因(度)筛查和富集分析
为了选择两个CAF亚型之间的关键基因,我们使用度分析。包,包括“limma”,“磨边机,”和“DESeq2,”是最受欢迎度分析和准确的方法。这三个度的原则和首选数据方法是不同的。采用线性模型在“limma”包,但“刨边机”和“DESeq2”包计算度的负二项分布(32]。微分表达式测试“刨边机”和“DESeq2”精确测试,和微分表达式测试limma经验贝叶斯方法。此外,输入数据为“磨边机”和“limma”必须规范化后的表达谱。少量的数据复制,“limma”是最安全的选择33]。我们不使用DESeq2获取之间的度两个CAF亚型,因为需要更多的计算机资源和时间的计算(33]。自从GSE19615地理数据集样本较小,GSE21653 GSE58812,度进行了分析使用R包“limma”[34]。TCGA-TNBC数据集,它包含更多的样本,“磨边机”包是用于确定两个亚型之间的度35]。度的值< 0.05和 为每个数据集被过滤。
的排名聚合(基本)的方法,可以减少数据集的偏见,是用来将过滤数据集从上面的四度表达式。基本的方法是基于一个假设,即基因会被视为一个健壮度排名第一的度基因列表。基本计算重要性分数为所有基因,只有统计重要基因。可靠度在不同的数据集,使用基本使用R语言中的“RobustRankAggreg”包(36]。度是选择的截止 和值< 0.05。然后,功能基因本体论(去),京都基因和基因组的百科全书(KEGG)和Reactome浓缩进行了分析。使用操作系统信息,这些差异度的生存曲线计算。和prognostic-related基因选择的截止值< 0.05,kaplan meier模型进行说明生存曲线之间的差别。
2.5。CAF亚型预测模型
使用随机森林(RF),决策树(DT) - - - - - -最近的邻居(资讯)方法从R包”插入符号,“我们建造CAF亚型预测。包“脱字符号”是一个流行的应用程序构建预测模型和包含许多普遍的机器学习方法(16]。在模型训练过程中,prognostic-related基因表达数据被利用。在第一步中,表达数据随机分为训练数据集(50%)和测试数据集(50%)。之后,参数搜索伴随着5倍交叉验证过程应用。我们比较了机器学习模型的预测精度,和机器学习模型的最高价值曲线下的面积(AUC)被选中。然后,最高的基因被保存在模型建设的重要性。测试数据集被用来评估开发模型的预测能力。最后,CAF亚型METABRIC数据集样本的预测的构造模型,和METABRIC数据集被用来作为一个独立的验证数据集确认CAF亚型和预后。
2.6。选择基因在人类蛋白质的蛋白质表达谱图集(HPA)
蛋白质的值从HPA基因计算基于数据中心的数据。免疫组织化学染色(包含IHC)是由数字表示:没有发现/ -(0),低(1)、中(2),(3)高。IHC强度是由数字表示:没有/ -(0),弱(1),中等(2)和(3)。IHC数量是由数字表示:没有/ -(0),< 25%(1),(2),25 - 75%和> 75% (3)。IHC得分是由染色强度和染色质量的总和。
2.7。统计分析
R语言是用来实现统计分析。为目的的检查两组之间的差异,学生的 - - - - - -测试实施。如果不是说否则,p值小于0.05被认为是重要的。
3所示。结果
3.1。CAF亚型与不同的存活率
GSVA用于4数据集的基因表达矩阵转化为矩阵的CAF基因集。在转换之前,主成分分析显示一个明确的批处理效果这四个数据集(图中1(一))。批处理效果是成功地减少了转换后,根据主成分分析结果(图1 (b))。获得准确的CAF亚型TNBC的样品中,我们对矩阵进行CC CAF基因集。聚类数的参数从2到6跟踪情节,被选中的三角洲地区,并提供结果。跟踪结果图显示“2”(图1 (c))。CDF实验组的情节暗示“4”(图1 (d)CDF实验组的阴谋下),相对变化面积建议“3”(图1 (e))。平均轮廓值被用于优化集群数量选择(图1 (f))。这是一个数字0和1之间的数字,和高轮廓值意味着样本是适合自己的集群但弱相关的其他集群。平均轮廓值显示“2”(图1 (f))。的值从操作系统和无进展生存(PFS)分析如果集群数量设置为“3”(补充图1一)分别为0.091和0.02(补充图1c)。的值从操作系统和PFS分析如果集群数量设置为“4”(补充图1D)分别为0.23和0.043(补充图1E-F)。因此,集群数量最终被设置为2(图1G),因为它值(操作系统:0.025;PFS: < 0.001)在操作系统和PFS分析是重要的(数据2(一个)和2 (b))。患者在C1见证了显著增加操作系统和PFS的时间比C2。CAF亚型的比例不同的临床和病理方面TNBC患者中描述表1。结果表明,CAF亚型没有与临床和病理的关系等参数数据集,年龄和阶段。在这两个亚型,C1更高水平的PD1和PDL1(补充图2)。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(一)
(b)
(c)
3.2。CAF CAF不同亚型与免疫细胞
CAF基因的水平集是两个CAF亚型之间明显不同(图2 (c))。C2基因亚型的水平明显高于有大多数CAF组;因此,这种亚型被命名为“CAF+“子类型。CAF C1被命名为”- - - - - -子类型”,因为它缺乏大多数类型的CAF基因集。有趣的是,不像其他CAF基因集,趋化因子生物标志物明显在CAF -亚型。
我们也探讨和比较了两个CAF亚型之间的免疫细胞。CAF -亚型有更高水平的免疫细胞渗透(图3(一个))。同样,CAF -免疫得分较高的样品基质的得分越低,纯度较低的肿瘤,而CAF +免疫分数较低,样品基质的分数更高,纯度和更大的肿瘤(值< 0.001,学生的 - - - - - -测试数据3 (b)3 (d))。
(一)
(b)
(c)
(d)
3.3。度和富集分析分析
CAF亚型之间的度被确定(值< 0.05和 ;补充图3)。CAF +样品中,有895 (GSE19615), 649 (GSE21653), 711 (GSE58812)和890 (TCGA-TNBC)调节基因表达。有526 (GSE19615), 848 (GSE21653), 1061 (GSE58812)和960 (TCGA-TNBC)高表达基因在CAF -亚型。基本方法确定了553健壮度,其中包括262调节和CAF + 291个表达下调基因亚型。用于可视化的热图是选中的可靠度(图4(一))。
(一)
(b)
(c)
(d)
富集分析被用来找到丰富通路与553健壮度有关。在补充图4CAF -亚型在很大程度上是与免疫相关的途径,包括“leukocyte-activation”(去),“regulation-of-leukocyte-proliferation”(去),和“regulation-of-antigen-receptor”(去),“cytokine-and-cytokine-receptor-interaction”(KEGG),“chemokine-signaling-pathway”(KEGG),“hematopoietic-cell-lineage”(KEGG),和“immunoregulatory-interactions”(REACTOME)。另一方面,相关的通路extracellular-matrix-organization被发现在CAF +子类型,如“TGF-beta-signaling-pathway”(KEGG),粘着斑(KEGG),和“ECM-receptor-interaction”(KEGG),“degradation-of-the-extracellular-matrix”(REACTOME),和“regulation-of-cellular-response-to-growth-factor-stimulus”(REACTOME)。
3.4。选择基因和机器学习模型的建设
基于553健壮度,59 prognostic-related基因被确定使用单变量Cox回归模型。这些基因的表达被用来构造RF模型预测CAF亚型。可用TNBC样本分为训练(50%)和测试数据集(50%)。基因表达值是由中值离散的离散值。基于参数搜索和5倍交叉验证过程的训练数据集,机器学习模型的预测能力如射频、资讯和DT进行评估。在这些三个机器学习模型中,射频显示最高的AUC值被选中。根据地区的最高价值观在射频的曲线模式下,“mtry = 24”被选中(表2)。在补充表29变量/基因优先和根据他们的重要性。RF模型训练这些9基因在训练数据集。AUC值0.921得到的测试数据集的构造射频模式(图4 (b))。
3.5。预测模型验证数据集由一个独立的乳腺癌
这些9基因选择的模型建设是胶原蛋白类型Xα1 (COL10A1) disintegrin和金属蛋白酶与血小板反应蛋白motifs-12 (ADAMTS12),胶原蛋白类型XIα1 (COL11A1)、内皮素受体a型(EDNRA) C-X-C主题趋化因子受体6 (CXCR6), Wnt家庭成员7 b (WNT7B) C-X-C主题趋化因子11 (CXCL11),脂肪细胞增强子结合蛋白1 (AEBP1)和Epiplakin 1 (EPPK1)。这些基因被选为CAF subtype-related基因。
基于距离METABRIC 9基因数据集的矩阵表达式,CAF亚型是预测。更高的预后观察CAF -亚型样品相比,CAF +亚型样本(值= 0.0046,图4 (c))。CAF +亚型样本验证数据集有较高水平的CAF基因集比CAF -亚型(图4 (d))。同样值得注意的是,这些结果也与训练数据(数据一致2(一个)和2 (c))。
3.6。调查CAF Subtype-Related预后和CAF亚型的基因
TCGA-TNBC数据集,ADAMTS12、AEBP1 COL10A1, COL11A1, EDNRA, EPPK1, WNT7B与不良预后相关,当他们的表达式值高(图5)。积极的结果是与高CXCL11和CXCR6(图的表达式的值5)。ADAMTS12、AEBP1 COL10A1、COL11A1 CXCL11, EPPK1 WNT7B,他们表达的肿瘤样本的值高于正常样本(补充图5)。ADAMTS12、AEBP1 COL10A1、COL11A1 EDNRA, EPPK1,和WNT7B mRNA表达在CAF +样本值高于CAF -样本(补充图5 b)。CXCL11 CXCR6, mRNA的表达在CAF -样本值高于CAF +样品(补充图5 b)。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
3.7。评价CAF亚型对免疫反应的影响
测试CAF亚型预测模型,三个独立的数据集(GSE78220、GSE35640 IMvigor210)含有核糖核酸测序数据的患者免疫治疗前选择评估CAF亚型对免疫反应的影响。GSE78220包含28个黑色素瘤样本处理anti-PD-1疗法,GSE35640包含65个黑色素瘤和肺癌样本处理MAGE-A3免疫治疗治疗,和IMvigor210包含348个癌症样本处理anti-PD-L1疗法。病人从这些人群被分为CAF +或CAF -亚型9基因的表达水平(COL10A1、ADAMTS12 COL11A1, EDNRA, CXCR6, WNT7B, CXCL11, AEBP1,和EPPK1)。在GSE78220(图6(一)),GSE35640(图6 (b)),和IMvigor210(图6 (c)),11%的回应率是不同的,分别为24%和10%。有一个更大的增益与CAF -比CAF + OS(图6 (d))。
(一)
(b)
(c)
(d)
3.8。表达式验证CAF Subtype-Related基因在乳腺癌
9中选择基因,蛋白表达数据ADAMTS12, AEBP1, CXCL11, EDNRA, EPPK1 HPA数据集。IHC得分结果表明ADAMTS12、AEBP1 CXCL11, EPPK1乳腺癌样本中蛋白含量高于正常对照组(补充图6)。
4所示。讨论
最近的研究发现,CAF参与血管生成,肿瘤细胞增殖,治疗抵抗,免疫调节,在实体肿瘤如乳腺癌转移37]。然而,目前的研究是关于CAF在乳腺癌的作用非常有限。根据我们的研究,CAF在时间更大程度的患者预后差,并建议CAF的独立预后因素。我们也估计CAF亚型的相关性肿瘤纯度,免疫细胞浸润,银行独立委员会和响应速度。结果表明,CAF可能通过促进肿瘤细胞发挥其对预后的影响和抑制免疫细胞如CD8 T细胞。
在两个CAF亚型,免疫细胞被发现在CAF -亚型高于CAF +亚型。同样,免疫等相关途径的cytokine-cytokine-receptor-interaction’,‘T-cell-receptor-signaling,‘chemokine-signaling, nad的natural-killer-cell-mediated-cytotoxicity更高CAF -亚型。由于这些发现,我们可以假设CAF与抑制免疫力的微环境。CD8 + T细胞进一步分化成效应细胞杀死肿瘤细胞。CAF据报道,抑制由PDL2 CD8 + T细胞,FASL [38]。CAF可以分泌白细胞介素6,可以增加调节性T细胞和减少CD8 + T细胞(39]。在乳腺癌中,成纤维细胞激活蛋白(FAP)积极CAF会抑制免疫增强调节性T细胞和抑制T细胞效应器(40]。由于肿瘤浸润T细胞是一个至关重要的生物标志物指示ICB响应(41),该亚型也可能影响银行独立委员会的治疗效果。研究表明,战乱国家减少敏感性anti-PD-L1治疗(40]。独立学院的数据集的结果还表明,病人在CAF +亚型有银行独立委员会的反应率低,预后差。因此,CAF -亚型患者接受银行独立委员会是理想的候选人。此外,针对CAF可能是一个有前途的治疗方法,在传统治疗和免疫疗法的补充。
趋化因子包括CXCL5 CXCL9、CXCL12 CCL3, CCL5, CXCL16可能来源于CAF (26,42]。例如,使用免疫印迹试验和免疫荧光,CXCL5表达高在战乱国家42]。然而,这些趋化因子是多个资源。CXCL5可以由肿瘤细胞,巨噬细胞和中性粒细胞(43]。树突状细胞(dc)可以释放CXCL5, CXCL9和使用这些趋化因子招募CD8 + T细胞等免疫细胞和自然杀伤细胞到时间44]。自免疫细胞中发现抑制CAF +亚型,这些结果表明,CAF不是这些趋化因子的主要资源。
COL10A1 COL11A1,作为胶原蛋白家族的成员,是调节在乳腺癌的成纤维细胞(45,46]。ADAMTS12 metalloprotease分泌,在乳腺癌中扮演着protumoral角色通过增加乳腺癌肿瘤细胞的迁移和侵袭能力(47,48]。人们已经发现,抑制EDNRA可能抑制肿瘤细胞入侵公元前49]。WNT7B是Wnt通路蛋白之一,公元前和临床结果的高表达患者WNT7B差(50]。AEBP1转录阻遏物之一,可以通过细胞外基质增厚(公元前改善进展51]。EPPK1是表皮生长因子(EGF)的一部分信号,发现促进肿瘤细胞的增殖52]。CXCR6 CXCL11是趋化因子的成员,需要CXCR6抗肿瘤功效的CD8 + T细胞浸润(53,54]。然而,另一项研究发现,CXCR6可以增加细胞迁移、入侵和转移的乳腺癌[55]。这种现象可能是由于不同的趋化因子的起源,和需要更多的研究来阐明他们在TNBC的角色。
这项研究有一些局限性。首先,我们只使用纯生物信息学技术预测CAF在时间。为了确保我们的研究结果的鲁棒性,我们选择多个独立的数据集。其次,没有特定的生物标志物CAF的高异质性CAF起源、表型和功能(56]。不同CAF子组的生物标志物可能不同,甚至相反。最后,在战乱国家的差异忽略了在我们的研究中。
5。结论
CAF TNBC患者与较低的存活率和抑制免疫活动。总之,CAF可能导致银行独立委员会降低响应速度。同时,随机森林模型由COL10A1 ADAMTS12, COL11A1, EDNRA, CXCR6, WNT7B, CXCL11, AEBP1, EPPK1是一种很有前途的工具,CAF亚型的预测。
数据可用性
数据集是TCGA下载的数据库(https://tcga-data.nci.nih.gov/tcga/)和地理数据库(http://www.ncbi.nlm.nih.gov/geo/)。
伦理批准
所有表达数据和临床信息从公开数据集检索这是免费下载和分析没有限制。调查人员的研究获得了当地伦理委员会的批准,通知病人同意。
同意
调查人员的研究获得病人知情同意。
的利益冲突
作者认为他们没有利益冲突。
作者的贡献
MW设计和写论文。MW和射频相关的研究和数据收集。MW、佐和WS分析数据。MW、CL和HL的数据和表。千瓦、DL和XL修订和批准了手稿。
确认
这项工作是由河南省人民医院的资助“23456人才特殊研究基金项目”(格兰特号码:12021)。
补充材料
补充1。补充图1:聚类分析和生存曲线的集群。(一)一致矩阵的一个例子 所示的热图。(B)生存分析(OS)患者的三个亚型。(C)生存分析(PFS)的患者三个亚型。(D)一致矩阵的一个例子 所示的热图。(E)生存分析(OS)患者的四个亚型。(F)生存分析(PFS)患者的四个亚型。进行了生存率较确定子类型之间的差异的重要性。注意:操作系统:总体存活率;PFS:无进展生存。补充图2:PD1的mRNA表达值和两个CAF PDL1亚型。(一)程序性细胞死亡蛋白1 (PD1)。(B)编程death-ligand 1 (PDL1)。补充图3:火山地块为度。 (A–D) Volcano plots for differentially expressed genes in GSE19615, GSE21653, GSE58812, and TCGA-TNBC. Upregulated genes and downregulated genes in CAF+ samples are represented by the red and blue points, respectively. Supplementary Figure 4: enrichment analysis of robust differentially expressed genes (DEGs). Note: NES: normalized enrichment score. Supplementary Figure 5: the expression pattern of CAF subtype-related genes (ADAMTS12, AEBP1, COL10A1, COL11A1, CXCL11, CXCR6, EDNRA, EPPK1, and WNT7B). (A) The mRNA expression values of CAF subtype-related genes between normal and tumor samples. (B) The mRNA expression values of CAF subtype-related genes between CAF+ and CAF- samples. Supplementary Figure 6: protein expression values of ADAMTS12, AEBP1, CXCL11, EDNRA, and EPPK1. Representative immunohistochemistry (IHC) images of ADAMTS12 (A), AEBP1 (C), CXCL11 (E), EDNRA (G), and EPPK1 (I) in normal (left) and breast cancer (right) tissues in the Human Protein Atlas (HPA) dataset. The difference of IHC scores of ADAMTS12 (B), AEBP1 (D), CXCL11 (F), EDNRA (H), and EPPK1 (J) in normal and breast cancer tissues in the Human Protein Atlas (HPA) dataset.
补充2。补充表1:常用CAF标记。补充表2:随机森林模型中的变量的重要性。