文摘
本研究试图执行综合分析免疫/甲基化/自噬的景观在乳腺癌预后和单细胞基因型。乳腺癌复发风险评分(BCRRS)和乳腺癌预后风险评分(BCPRS)测定基于6预后IMAAGs从TCGA-BRCA获得队列。BCRRS BCPRS,分别被用来构造一个风险总体存活率和无进展生存率的预测模型。模型的预测能力是评估使用的临床数据。分析表明,BCRRS与中风的风险很高。此外,PPI和drug-ceRNA网络基于BCPRS被构造的差异。单个细胞的基因通过集成scRNA-seq BCPRS-related TNBC样本根据聚类结果的基因。本研究的结果显示了潜在的监管IMAAGs对乳腺癌肿瘤微环境的影响。高0.856和0.842得到的auc OS和PFS预后模型,分别。scRNA-seq分析显示高表达水平的脂肪细胞和脂肪组织巨噬细胞在高BCPRS集群(atm)。 Moreover, analysis of ligand-receptor interactions and potential regulatory mechanisms were performed. The LINC00276&MALAT1/miR-206/FZD4-Wnt7b pathway was also identified which may be useful in future research on targets against breast cancer metastasis and recurrence. Neural network-based deep learning models using BCPRS-related genes showed that these genes can be used to map the tumor microenvironment. In summary, analysis of IMAAGs, BCPRS, and BCRRS provides information on the breast cancer microenvironment at both the macro- and microlevels and provides a basis for development of personalized treatment therapy.
1。介绍
乳腺癌(BRCA)是全球女性最常见的癌症,占大约25%的女性恶性肿瘤(1]。尽管诊断和治疗的进步,大量的病例诊断在遥远的转移性网站提出一个挑战在治疗癌症2,3]。因此,分子生物标志物指导个体化治疗和改善乳腺癌患者总体预后的迫切需要。这些生物标记物可能是有用的在开发高效的治疗方法在乳腺癌的4]。
在当前精密医学的时代,高通量技术提供了一个机会发展来自不同来源的肿瘤预后的生物标志物。这些标记包括免疫、基因甲基化和Autophagy-Associated (IMAAGs)潜在的预后标志物在乳腺癌(5- - - - - -8]。自噬是至关重要的维持细胞质和基因组的完整性。此外,与肿瘤的发生和发展是在几个水平(3,9]。在癌症进展,积极自噬降解蛋白质和细胞器增加肿瘤的水库营养,促进肿瘤增殖和入侵10,11]。此外,以往的研究报告,autophagy-related基因可以作为乳腺癌预后标记(5]。
另一方面,m6A-RNA甲基化是真核细胞的一个重要内部修改。研究报告,m6A监管因素和基因表达变化与恶性肿瘤进展和免疫调节异常12- - - - - -14]。此外,修改个别癌症肿瘤m6A可以预测的模式阶段,亚型,遗传变异,病人的预后。此外,m6A methylation-related基因潜在的乳腺癌预后分子标记(6,7]。此外,免疫细胞参与肿瘤恶化所示(15- - - - - -18]。先前的研究报告,乳腺癌相关的免疫特点与临床特征。免疫相关基因的表达谱可能影响特定的乳腺癌亚型(19- - - - - -21]。评价肿瘤immunophenotypes是一个重要的补充指标的TNM(原发肿瘤、区域淋巴结和远处转移)阶段,复发和死亡率(22- - - - - -27]。
最近的研究报告,IMAAGs发挥协同作用在肿瘤微环境28,29日]。据报道,m6A修改可能影响autophagy-related基因转录本的稳定性和m6A methylation-related蛋白质会导致肿瘤免疫逃避和发展(29日- - - - - -32]。这意味着高度协调IMAAGs之间存在相互作用。然而,没有特定的标记基于IMAAGs全面应用于探索乳腺癌预后的微环境和援助。因此,IMAAGs对肿瘤的影响的详细分析将提供进一步的知识时间抗肿瘤免疫反应和指导发展的更有效的治疗方案(6,33]。一些研究报告,IMAAGs与乳腺癌的恶性进展(34]。然而,没有研究进行了全面的分析IMAAGs探讨其临床意义。
BRCA细胞恶性分化的肿瘤微环境受到几个因素的影响(35,36]。单细胞转录组分析描述细胞的状态及其转换提供了机会,同时探索整个肿瘤样本的基因组的综合性质分辨率显微镜(37]。订购这种全面tumor-constituting细胞轨迹有助于了解肿瘤细胞和肿瘤发生的相关子集恶性犯罪途径(38]。最新进展在单细胞分析方法提供了一个更全面的方法在细胞水平上探讨分子变化(39]。细胞类型特异的中的复合物此外,可以预测一个数据库策划复合物(http://www.CellPhoneDB.org/)[40]。这些方法可以用来找到一系列可靠的预后标记和揭示新目标治疗疾病。
因此,分子和细胞在微程序级映射构造了在当前的研究中通过整合这些预测与空间原位分析。IMAAGs和乳腺癌微环境之间的关系也被系统地分析。
2。材料和方法
2.1。数据检索和处理
数据源是在补充表1。转录组,拷贝数变异(CNV)和单核苷酸多态性(SNP)数据和临床数据相关乳腺癌(BRCA)从癌症基因组图谱(TCGA)数据库下载。转录组数据规范化使用R软件使用library-size正常化。Autophagy-related基因从人类自噬数据库(检索http://www.autophagy.lu/)根据先前的研究41]。此外,16 m6A RNA甲基化监管机构TCGA的表达式可用数据得到的数据集。之后,从共享数据获得的免疫相关基因在IMMPORT (https://www.immport.org/shared/genelists)。此外,mRNAsi指数用于匹配TCGA乳腺癌数据集从一项研究获得了42]。
scRNA-seq数据(加入GSE118389)共有1534个细胞在六个新鲜TNBC肿瘤从基因表达获得综合(地理,http://www.ncbi.nlm.nih.gov/geo/)数据库(43]。样品没有临床信息被排除在外。最后一个数据集包括934 brca TCGA队列和194 brca临床队列。
2.2。研究参与者
临床数据取自194乳腺癌患者参加上海综合医院。根据临床随访和病史记录,获得生存资料和疾病特征。所有参与者提供知情同意参与这项研究。本研究进行了符合赫尔辛基宣言的原则。这项研究是制度伦理审查委员会批准上海综合医院(没有。2020 ky211)。所有患者保守手术,放疗是规定,推荐基于辅助化疗后乳房切除术后局部复发的风险。
2.3。自噬的识别、甲基化和免疫相关基因
随机森林算法被用来屏蔽从IMAAGs基因与乳腺癌预后相关。此外,randomForestSRC算法被用来排名prognostic-related基因的重要性。随机森林模型被用来屏幕210个基因可能与乳腺癌的预后有关。共有19个高度与预后相关基因被确定通过单因素Cox回归。所有的混杂因素被认为是在研究过程中。我们已经考虑到所有尽可能的混杂因素。我们希望通过这个研究最关键的IMAAGs屏幕。此后,套索和采用多变量Cox方法减少维度和识别独立的预后因素。IMAAGs与死亡风险最高的被选择建立一个多变量Cox预后模型(44]。培训和对照组样本量在7:3比率。BRCA总生存期(OS)和无进展生存(PFS)列线图TCGA构建预测模型基于数据和临床数据。诺模图验证使用接受者操作特征(ROC)曲线45,46]。c指数是用来评估模型的性能(47]。决策曲线分析用于评估临床应用的诺模图48]。净收入计算后以前公布的方法(49]。
2.4。肿瘤免疫细胞纯度分析和估计
根据先前的研究,TPM TCGA-BRCA RNA序列数据被用作输入然后single-sample基因集富集分析(ssGSEA)用来分数免疫细胞类型的浓缩元基因,所述的GSVA包R软件(50- - - - - -52]。后来, - - - - - -得分数据进行预测的基础上渗透和浓缩的免疫细胞。的 - - - - - -评分数据的确定是基于预测的渗透和浓缩的免疫细胞。无监督聚类分析被用来在免疫细胞识别不同的改造模式和分类的样本作进一步调查。集群的数量和他们的稳定是由共识决定聚类算法(53]。ConsensusClusterPlus包是用于执行1000复制,以确保稳定的聚类分析的分类54]。肿瘤纯度分数估计使用估计方法如前所述[55,56]。
2.5。富集分析
基因变异分析微阵列和RNA-seq数据(GSVA)和基因集富集分析(GSEA)探讨了基因本体论(去)的生物过程和KEGG通路与乳腺癌预后相关风险评分(BCPRS) [52,57]。“c2.cp.kegg.v6.2。- - - - - -symbols” and “c5.all.v6.2.symbols” gene sets were retrieved from the MSigDB database for GSVA analysis. GSEA was used to explore the potential mechanisms associated with BCPRS using JAVA.
2.6。实时定量PCR (qPCR)
总RNA提取细胞培养使用Mini-BEST普遍RNA提取工具包(豆类,京都,日本)。互补脱氧核糖核酸合成然后使用Prime-Script RT执行主混合(豆类)。使用SYBR qPCR化验进行绿色主(豆类)PCR LightCycler480混合系统(罗氏诊断、巴塞尔、瑞士)。
2.7。建设WGCNA
基因转录组数据分析了TCGA-BRCA使用加权Coexpression网络分析(WGCNA)方法。7点设置电源确保更高规模的独立(接近0.9),并降低平均连通性(接近0)可以得到保证。层次聚类系统树图的拓扑测量(汤姆)矩阵构造使用重叠的平均距离最小阈值30和合并减少0.25的高度。表达式的单位类似的基因被分组到不同的基因模块。Cytoscope3.8用于可视化coexpression网络。“igraph”包被用来确定模块的度。大卫(http://david-d.ncifcrf.gov)和GOplot工具被用于KEGG通路富集浓缩,功能分析的基因筛选WGCNA方法(58]。
2.8。BCPRS表型之间的识别度
探索BCPRS-related基因,患者分为两组不同BCPRS表型基于BCPRS得分。limma R包中的贝叶斯方法被用来确定差异表达基因(度)之间的两组( )。
2.9。Drug-ceRNA网络建设
miRcode数据库被用来探索DE-lncRNAs之间的相互作用和DE-miRNAs之前报道(59,60]。相关性差异表达mrna(民主党)和DE-miRNAs探讨了使用miRWalk3.0数据库和miRTarBase(版本7.0),其中包含验证microrna的目标相互作用从不同的实验(61年]。LncMAP工具被用来确定lncRNA表达水平之间的斯皮尔曼相关系数和24的IC50值药物。那时可能drug-lncRNA网络构建基于预测的LncMAP数据库。
2.10。TNBC scRNA-seq数据分析
总共1535个细胞在六个新鲜TNBC肿瘤包括在分析中。三阴性乳腺癌患者预后不良,与高风险的复发和转移;因此,研究这个数据集促进探索BCPRS-related基因的潜在作用。修包在R 3.6.3用于质量控制62年]。剩下的1266个细胞的基因表达水平正常化使用修包。PCA进行识别明显可用维度值< 0.05 (63年]。统一的歧管近似和投影(UMAP)算法应用降维与20初始pc和执行集群分类分析在所有细胞(64年]。不同细胞集群识别和注释使用单一包基于标记基因的组成模式,然后被纠正使用CellMarker工具(65年,66年]。单片眼镜2算法用于构造单细胞拟时间轨迹的TNBC scRNA-seq数据(67年]。此外,聚类分析是基于六BCPRS基因(HEY1、INFA13 NKX2-3, NR2F1, POU5F1,和YY1)。度之间的集群2和3的脂肪细胞被定义为标记基因。细胞间相互作用分析使用CellPhoneDB数据库(40]。重要的细胞间的相互作用是决定使用值< 0.01。
2.11。神经网络的深度学习框架和统计分析
神经网络建立了使用python(3.6版)软件预测乳腺癌细胞类型(68年]。所有的细胞都被随机分配给一个训练集和测试集7:3比率。参数的设置是一样的在前一篇文章中(37,68年]。所有统计分析使用GraphPad棱镜(7.0版)软件和R(版本3.5.3)软件。kaplan meier方法用于计算整体存活率,像前面描述的那样69年]。生存条件(CS)被定义为病人可以存活的概率”“年”因为他们存活了“年69年- - - - - -73年]。
3所示。结果
3.1。识别不同的免疫、甲基化和Autophagy-Related基因
研究设计是呈现在图1(一)和补充图1。首先,RNA-seq和临床数据从1109年BRCA TCGA样本下载的数据库。386年之后,免疫相关基因,16 m6A methylation-related基因,和222年autophagy-related基因。随机森林分析用来确定210个基因与乳腺癌的预后相关(数字1 (b)和1 (c))。此外,19日与乳腺癌的预后相关的基因被确定使用单因素COX回归(图1 (d))。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
(j)
免疫细胞之间的交互描述的基因调控网络,methylation-related, autophagy-related基因以及它们对乳腺癌患者的预后的影响(图1 (e))。结果表明,一些基因与乳腺癌的预后相关(IKBKB、ATG16L2 CLN3, MBTPS2, TSC2,和CAPN10)有较高频率的突变(图1 (f))。此外,分析显示显著差异的CNV OS-related基因包括CLN3 TSC2, DAPK2, LAMP1, ATG16L2, FADD、IKBKB, RAB24, CAPN10, CFLAR, PEX14, MBTPS2, ST13 MAP2K7, STK11(图1 (g))。此外,套索分析被用来排除基因可能导致过度拟合的模型和减少变量(数字1 (h)和1(我))。多变量Cox回归模型来建立预测模型包含6个特征基因(HEY1、IFNA13 NKX2-3, NR2F1, POU5F1,和YY1)与乳腺癌的预后相关(图1 (e))。BCPRS模型构建基于6基因。风险评分计算如下: 和 。
3.2。评价BCPRS以及总体存活率和临床表型
kaplan meier (km)曲线显示,6 IMAAGs确认在前一节中有关乳腺癌的预后有良好的风险预测能力(图2(一个))。的低表达水平POU5F1和YY1 HEY1表达水平高,IFNA13, NKX2-3, NR2F1明显与乳腺癌预后不良有关。值得注意的是,肿瘤组显示HEY1表达水平低和NR2F1较正常组(补充图2 e)。这意味着HEY1和NR2F1可能与恶性肿瘤进展相关表型而非肿瘤发生表型。km曲线表明,死亡的风险高BCPRS组明显高于低的价格相比BCPRS TCGA的队列(图组2 (b); )。
(一)
(b)
(c)
(d)
低风险组的5年生存率范围从98%到99%,然后100%(1年、3年和4年,分别)。低风险组的5年生存率比与高危人群(从89%到96%)(数据2 (c)和(d))。值得注意的是,患者的存活率低风险组治疗3年后大约是100%。这意味着BCPRS可以有效地预测死亡的风险,在乳腺癌患者复发的癌症。此外,该模型可以帮助减轻可能在乳腺癌患者复发的恐惧在低风险组经过三年的治疗。此外,它可以帮助确保一个更活跃的高危人群随访和指导更合理分配医疗资源。
TNM分期显示了肿瘤的严重性和用于预测患者预后的临床实践。有趣的是,这项研究的结果显示BCPRS相关性不显著,TNM分期(补充图2- - - - - -二维)。这意味着BCPRS独立于肿瘤分期和可以作为肿瘤预后的替代指标。
3.3。评价肿瘤免疫微环境与BCPRS协会
分析表明,肿瘤与ImmuneScore纯度显著负相关,StromalScore ESTIMATEScore, BCPRS(枪兵的相关性, ,分别为-0.82、-0.99和-0.22;图3(一个))。为了进一步探索这种相关性,ssGSEA被用来预测每个样本的大量的免疫细胞。此外,患者无监督聚类分析进行分类到不同的免疫亚型。研究结果表明,较低的肿瘤免疫渗透亚型TCGA-BRCA队列的高纯度和低BCPRS分数相比,那些高免疫渗透亚型(数字3 (b)和3 (c))。这些发现表明BCPRS分数是高度相关的与特定的肿瘤微环境特征(如肿瘤纯洁和肿瘤组织免疫渗透)。热图然后构造(图的可视化特性3 (d))。
(一)
(b)
(c)
(d)
3.4。单核苷酸多态性的差异来自不同BCPRS亚型的肿瘤细胞
Maftools包被用来探索体细胞突变的分布差异之间的低和高BCPRS分数TCGA-BRCA队列。BCPRS得分较低组显示肿瘤突变而高的严重负担BCPRS分数组。十大最重要的基因突变的发生率分别为14.3%和12.1%,分别为(补充图3- - - - - -3 b)。分析表明,肿瘤突变患者三甲地位高与一种持久的免疫疗法的临床反应。因此,我们猜测肿瘤BCPRS分数的差异可能调解免疫治疗的临床反应。
3.5。浓缩BCPRS亚型分析
去功能富集分析被用来探索BCPRS功能有关。高纯度的功能包括atp酶耦合离子跨膜转运活动,双链RNA绑定,高voltage-gate钙通道活动,体液免疫反应,负调节体液免疫反应,NuA4组蛋白乙酰转移酶复杂,监管macroautophagy, RNA修改和T细胞受体复杂(图4(一))。此外,KEGG通路与BCPRS进行了探讨。高纯度通路包括细胞凋亡、cGMP-PKG信号通路,化学致癌作用,药物metabolism-cytochrome P450,内分泌和其他factor-regulated钙重吸收,脂肪酸降解,赖氨酸退化,p53信号通路,调节脂肪细胞的脂解作用(图4 (b))。这些发现表明BCPRS可能与免疫有关,甲基化和自噬通路。此外,BCPRS可以间接地显示肿瘤组织的整体生物功能。
(一)
(b)
(c)
基于GSVA热图分析和量化被用来可视化表达的六个关键基因和不同丰富KEGG通路(图4 (c))。发现NR2F1明显的聚类分析表明,表达与肾素血管紧张素系统,粘多糖生物合成,硫酸软骨素,补充凝血级联,ECM受体相互作用。
3.6。人口,临床病理,肿瘤微环境特征的BRCA病人高低BCPRS组
人口统计学、临床病理的患者和肿瘤微环境的特点,提出了高和低BCPRS / BCRRS表1和2。分析表明,低和高BCPRS组明显不同的临床病理和肿瘤微环境特征因素(免疫组、StromalScore ImmuneScore, ESTIMATEScore, TumorPurity, mRNAsi;表1)。BCPRS集团高纯度更高的免疫分数较低的肿瘤。值得注意的是,mRNAsi低高BCPRS组与低BCPRS组相比,这意味着BCPRS分数负相关与乳腺癌细胞具备干细胞。本研究从先前的研究结果是一致的,BCRRS得分与乳腺癌的恶性肿瘤显著相关(表2)。这表明BCPRS是独立的预后因素癌细胞具备干细胞特性。低风险组随访时间长与高危人群( ),随着时间的推移表明结果是有效的。年龄,种族,和治疗跨BCPRS组之间没有显著性差异暗示BCPRS是一个潜在的乳腺癌的预后危险因素独立于年龄,种族,和治疗。为了进一步验证这些发现,考克斯多因子的分析表明,BCPRS ( )BRCA预后的一个独立危险因素有更好的预测能力较其他肿瘤微环境特性(免疫组、StromalScore ImmuneScore, ESTIMATEScore, TumorPurity,和mRNAsi)(表3)。总之,BCPRS与几个肿瘤微环境特点和具备干细胞是肿瘤细胞的独立预后因子得分(mRNAsi)病理和临床TNM阶段。
3.7。建设和验证乳腺癌OS列线图的预测模型
肿瘤微环境的特点如免疫组,StromalScore, ImmuneScore, ESTIMATEScore, TumorPurity, mRNAsi往往很难获得在临床工作。因此,开发一种更适用的预测模型,brc OS诺模图预测模型构建基于年龄、T、N, M,舞台,BCPRS。操作系统列线图包括BCPRS和乳腺癌临床病理参数的预测模型,如图5(一个)和补充表2。校准曲线表明,该操作系统列线图是高度准确的预测相比,5年生存率与理想模型(图5 (b))。ROC曲线下的面积(AUC)训练队列是0.856而验证队列的AUC为0.726(图5 (c))。此外,培训组乳腺癌OS列线图的c指数预测模型是高(0.802,95% CI, 0.709 - -0.895),而与验证队列(0.747,95% CI, 0.600 - -0.894;表4)。此外,它是整个群体的价格相比高为0.767 (95% CI, 0.681 - -0.853),表明该模型有很好的预测能力对乳腺癌的预后。此外,决策曲线分析(DCA)的诺模图表明,该预测模型(图有很好的临床价值5 (d))。
(一)
(b)
(c)
(d)
3.8。建设和验证乳腺癌PFS的诺模图预测模型基于临床队列
194乳腺癌患者基本临床资料从上海第一人民医院,获得和聚合酶链反应(表6-gene签名进行了分析2)。基因的表达水平规范化使用 - - - - - -得分的过程。6-gene签名然后用于多因素COX回归分析(图6(一))(补充表3)。BCRRS计算以下类似的方法作为BCPRS描述。所不同的只是,BCRRS使用临床数据来预测乳腺癌复发的风险,而BCPRS TCGA使用数据预测乳腺癌患者的死亡风险。kaplan meier曲线分析表明,低的PFS BCRRS组相比明显高于与pRS集团( ;图6 (b))。6-gene签名然后策划构建乳腺癌复发风险评分(BCRRS)系统(图6 (c))。研究结果表明,BCRRS中风的风险(图6 (d))。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
乳腺癌患者的PFS诺模图模型是由结合肿瘤患者的临床特点和BCRRS分数,以确定肿瘤复发的风险(图6 (e))。校准曲线表明,PFS诺模图有更高的预测价值与理想模型(图6 (f))。模型的AUC的训练队列是0.842而验证组为0.726(图6 (g))。乳腺癌PFS列线图的c指数预测模型对培训组高(0.864,95% CI, 0.784 - -0.944),而与验证组,0.793(95%可信区间,0.672 - -0.914),和整个群体,0.843(95%可信区间,0.776 - -0.909)(表4)。这些研究结果表明,该模型有一个很好的对乳腺癌的预后预测价值。分析乳腺癌PFS列线图的DCA曲线预测模型进一步表明,该预测模型(图有很好的临床价值6 (h))。
3.9。WGCNA显示模块的关系
基因从936乳腺癌患者样本中选择TCGA-BRCA数据库被用于WGCNA网络建设。最大值表达的差异阈值为25%。在这项研究中,大规模的独立(0.9附近)和较低的平均连通性(0)附近获得通过设置在5。结合阈值被设定为0.25和15个模块和被表示为不同颜色(图7(一))。黑色的模块( , )蓝色代表基因与BCPRS呈正相关,而模块( , )基因BCPRS呈负相关(图表示7 (b))。总共有87个基因分为黑模块。分析表明,黑人模块是高度相关的基因与相应的模块和BCPRS的特质有显著相关性(图7 (c))。这一发现表明,该基因在黑模块应进一步探索。
(一)
(b)
(c)
(d)
(e)
(f)
3.10。函数和KEGG通路富集分析的核心基因
函数(英国石油(BP)、CC和MF)和KEGG通路富集分析的核心基因在黑人模块进行。这些核心基因与一些生物过程包括伤口愈合的积极监管,积极的监管回应受伤,对类固醇激素,负调控的蛋白质磷酸化,监管应对受伤,血管发展的积极的监管,积极调节凝血,止血的积极调节,调节凝血,和消极的磷酸化调节(图7 (d))。此外,核心基因与细胞组件包括collagen-containing细胞外基质、细胞外基质,外质膜,膜筏,膜microdomain小窝,脂滴,膜区域,血小板α颗粒,质膜筏。进一步,核心基因与不同的分子功能包括转录因子的活动,RNA聚合酶II近端启动子sequence-specific DNA结合,DNA结合转录激活活性,RNA聚合酶II-specific,转化生长因子β绑定,绑定细胞因子,生长因子绑定,粘多糖绑定,I型转化生长因子β受体结合,脂质磷酸酶活动,phosphatidate磷酸酶活性。
此外,KEGG路径分析表明,这些基因主要参与补充凝血级联,流体剪切应力和动脉粥样硬化,AGE-RAGE信号通路在糖尿病并发症,破骨细胞分化、疟疾、glycerolipid新陈代谢,组织apelin信号通路,结直肠癌,脂肪消化和吸收,MAPK信号通路,人类t细胞白血病病毒1感染、胆碱代谢在癌症,恰加斯病和肿瘤坏死因子信号通路( ;图7 (e))。KEGG去富集分析表明,黑色模块与BCPRS相关的基因可能参与肿瘤扩散,入侵和转移。此外,这些基因可能是关键基因与乳腺癌的预后不良。
3.11。基于WGCNA PPI网络的建设和验证分析
总共有86个节点和266个边缘识别的核心基因黑色模块使用字符串数据库PPI浓缩值为1.0 - - - - - -16(补充图4)。模块被确定,33中心基因筛选使用PPI网络(图7 (f))。值得注意的是,EGR1、BTG2 FOSB,小君,”丛书,JUNB, NR4A1, DUSP1, GADD45B, ATF1网络中扮演了重要的角色。总体生存数据显示,乳腺癌患者的预后差时两个基因(FOS和FOSB提交)或当四个高度表达的基因(六月,GADD45B NR4A1, BTG2)显示低表达水平(补充图4 b)。研究结果表明,BCPRS与JUNB的表达,DUSP1,小君,”丛书,EGR1, FOSB, ATF1, GADD45B NR4A1, BTG2(枪兵的相关性, ,分别;补充图4摄氏度)。这些发现表明BCPRS可以用来有效地识别基因和相关通路与不良预后的高危乳腺癌。
3.12。基于BCPRS Drug-ceRNA网络的建设
所有BCPRS-related lncRNAs, microrna mrna检索使用R软件。drug-lncRNA网络是构建基于预测的结果LncMAP数据库(补充图5)。之间的关系BCPRS-related lncRNAs、BCPRS-related microrna BCPRS-related mrna探索使用miRTarBase和miRWalk数据库(补充图5)。一个潜在的监管drug-ceRNA网络构造。
3.13。人类TNBC细胞识别细胞集群显示细胞异质性高
总共有1266个细胞包括1535年分析后质量控制肿瘤细胞的核心人类TNBC样本(补充图66)。方差分析情节显示1783对应的基因TNBC细胞,每个细胞集群和前20名标记基因标记(补充图6 b)。检测到的基因数显著相关的测序深度、皮尔森相关系数为0.63(补充图6摄氏度)。主成分分析(PCA)显示这些TNBC细胞没有明显的分离,和20个人电脑被确定(估计值< 0.05;补充图6 d- - - - - -6 f)。统一歧管近似和投影(UMAP)算法用于准确地把人类TNBC细胞分成14个人集群(图8(一个))。前20名标记每个细胞的基因不同的细胞集群的集群和集群被确定(补充图6克和6小时)。集群被注释与单一和CellMarker工具基于标记基因的表达模式(图8 (b))。六BCPRS-related基因的表达(YY1、POU5F1 NKX2-3, NR2F1, HEY1,和IFNA13)决心使用scRNA-seq(图8 (c)和补充图7一个)。横膈缪里斯是一个概略的单细胞生物的转录组数据模型亩,包含近100000个细胞从20器官和组织74年]。六个BCPRS基因的表达(IFNA13、HEY1 NKX2-3, NR2F1, POU5F1,和YY1)在乳腺癌组织中分析了使用横膈缪里斯的流式细胞仪和液滴方法(补充图8)。NKX2-3 IFNA13显示,正常乳腺组织中表达水平较低,然而,在乳腺癌组织中高度表达。POU5F1主要是脂肪细胞中表达。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
轨迹分析被用来探索TNBC细胞不同分化模式(图8 (d))。TNBC脂肪细胞细胞主要位于根(更早拟时间),而上皮细胞和巨噬细胞和其他位于分支或根(图8 (e))。此外,轨迹分析显示差异表达基因(POU5F1, YY1、HEY1 NR2F1)在不同拟时间(数字8 (e)- - - - - -8 (f))。
3.14。脂肪细胞和脂肪组织巨噬细胞(atm)富含高BCPRS集群
六BCPRS-related基因的聚类分析(IMAAGs)细胞分成三个集群(图9(一个))。集群3被定义为一个低BCPRS集群而集群2被定义为一个高BCPRS组。值得注意的是,脂肪细胞主要位于集群3(图9 (b)和补充图7 b)。这一发现表明,高度的脂肪细胞渗透可能与高BCPRS乳腺癌的预后不良。UMAP算法被用来成功地组织人力TNBC脂肪细胞成3个人集群。集群被注释与CellMarker工具基于标记基因的表达模式(图9 (c))。轨迹分析表明,TNBC脂肪细胞有明显的分化模式(图9 (d)和补充图9,9 b)。分析集群1只显示几个细胞的脂肪组织,以及集群之间的差异度的2和3是非常重要的。脂肪细胞主要位于集群2(数字9 (e)和9 (f))。脂肪组织巨噬细胞(atm) (CD68 +)高纯度高BRPRS集群( )(数据9 (f)- - - - - -9 (h))。分析表明,巨噬细胞是高纯度高BCPRS组,而mRNAsi的相对水平是降低高BCPRS组与低BCPRS组(图9(我))。因此,高渗透的自动取款机(CD68 +)可能与诱导BCPRS upregulation。高BCPRS特征可能存在恶性特征不同于茎BRCA细胞的细胞结构。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
3.15。基因中的交互分析和鉴定中心
CellPhoneDB被用来推断细胞间交流探讨中每个子类型之间的差异和共性信息交换。Receptor-ligand交互在每个亚型每个集群的脂肪细胞进行了分析(图10 ())。Wnt7b的高表达与乳腺癌预后差(图10 (b))。这意味着Wnt7b之间的相互作用和FZD4自动取款机(CD68 +)和脂肪细胞(FCs)可能导致乳腺癌的预后不良,主要是高BCPRS概要文件的形式。
(一)
(b)
(c)
(d)
(e)
(f)
中心自动取款机(CD68 +)和脂肪细胞之间的基因(FCs)被确定通过十字路口BCPRS-related度。维恩图构造了十字路口的基因BCPRS-related度,在脂肪细胞集群2和3之间的度。MALAT1和PRICKLE2-AS3被定义为常见的差异表达基因(图10 (c))。MALAT1高度表达的集群3和高BCPRS组。表达MALAT1并使用scRNA-seq PRICKLE-AS3 TNBC的脂肪细胞呈现在图10 (d)和补充图9 c。表达水平的相关性分析表明,MALAT1明显与其他基因的表达(YY1, POU5F1, NR2F1、IFNA13 HEY1) TCGA的BRCA数据集(补充图7 c)。类似于BRPRS, MALAT1的表达水平是负相关mRNAsi和EREG。mRNAsi(图10 (e))。轨迹分析表明,MALAT1 FZD4, Wnt7b状态1中高度表达类似于POU5F1和脂肪细胞(图10 (f))。因此,MALAT1 FZD4, Wnt7b被定义为中心与BCPRS相关的基因。
3.16。LINC00276&MALAT1 mir - 206 / FZD4-Wnt7b通路是预测
进行生存分析,识别潜在MALAT1-related lncRNAs / microrna BCPRS-related lncRNAs和microrna(图(11日)和补充图5)。mir - 206的低表达和高表达LINC00276 MALAT1明显与乳腺癌的预后不良。生物信息学分析使用RNAhybrid 2.12表明,mir - 206的潜在目标microrna LINC00276 (mfe: -62.5千卡每摩尔),MALAT1 (mfe: -71.7千卡每摩尔),和FZD4 (mfe: -72.3千卡每摩尔)(补充图9 d)。TCGA相关分析使用数据显示MALAT1 LINC00276和FZD4表达呈正相关,与mir - 206的表达呈负相关。此外,以往的研究报告,MALAT1可以作为mir - 206海绵(数字11 (b)和11 (c))[31日,32,75年]。THPA (https://www.proteinatlas.org/)被用来探索FZD4的表达在正常乳房组织和癌症。分析表明,FZD4高度表达在乳腺癌组织与正常乳腺组织(图11 (d))。这些发现表明MALAT1和LINC00276(由l - 685458)作为mir - 206的海绵,因此促进FZD4转录,移植Wnt信号通路在Wnt7b分泌自动取款机(CD68 +)。这个过程可能会打断了l - 685458(图11 (e))。
(一)
(b)
(c)
(d)
(e)
3.17。预测乳腺癌的细胞类型与BCPRS-Related基因签名
BCPRS-related基因(YY1 POU5F1、NKX2-3 NR2F1, HEY1,和IFNA13)显示高异质性不同的细胞;因此,基因可以独立预测细胞成分反映肿瘤组织的微环境。因此,建立了神经网络模型来预测细胞在乳腺癌组织中基于基因YY1 POU5F1, NKX2-3, NR2F1 HEY1, IFNA13(图12(一个))。曲线下的面积(AUC)中华民国高(数字12 (b)- - - - - -12(我))。这一发现表明,这些模型有很好的预测能力,特别是在预测脂肪细胞( ),成纤维细胞( ),和内皮细胞( )。这意味着这些基因可用于肿瘤微环境地图。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
4所示。讨论
目前的研究是基于免疫,进行甲基化,自噬的观点。总共6预后IMAAGs筛选和鉴定,全面分析与操作系统和PFS的预后相关的基因在乳腺癌。本研究的结果表明,BCPRS和BCRRS评分系统基于6 IMAAGs准确分层乳腺癌患者的预后。操作系统和PFS诺模图预测模型构造了令人满意的临床价值。值得注意的是,BCRRS与中风的危险。脂肪细胞和脂肪组织巨噬细胞(atm)高纯度高BCPRS集群和与不良预后有关。中的相互作用和潜在的监管机制进行了探讨。LINC00276&MALAT1 / mir - 206 / FZD4-Wnt7b通路被发现这可能是有用的在未来的研究目标与乳腺癌转移和复发。神经网络的深度学习模式建立了基于BCPRS-related基因签名和显示在细胞类型预测精度高。
使用BCPRS得分总体生存分析显示,患者的存活率低BCPRS组治疗后5年内高达98%。这个速度明显高于与存活率高BCPRS组(90%)。然而,三年的治疗后,两组的存活率几乎是相似的。这一发现表明,CS率逐渐增加两组病人的存活率逐渐稳定。病人更喜欢个性化的生存概率的预测;因此,这些信息可以帮助在应对复发或死亡的恐惧,可用于设计个性化的后续计划(76年- - - - - -78年]。
马耳他等人报道,mRNAsi可用于确定干细胞分化水平(42]。先前的研究报告,T4和四期有一个相对更高的mRNAsi价值34),而mRNAsi价值负相关,BCPRS在当前的研究中。此外,研究报告,BCPRS并不与TNM分期密切相关,随着TNM阶段不揭示肿瘤的生物学特性(79年]。这意味着TNM阶段是不够的在反映预后和预测肿瘤治疗的疗效。因此,TNM分期应结合其他因素形成一个综合风险评估模型对乳腺癌预后[79年]。在当前的研究中,BCPRS TNM分期的独立预后因素。列线图的分析表明,相比BCPRS优越的预测能力与TNM分期。因此,当前研究的结果表明,BCPRS具备干细胞是独立于肿瘤细胞的一个预测因素得分(mRNAsi)病理和临床TNM阶段。的综合评价BCPRS mRNAsi, TNM评分系统,因此,这项研究提供了有益的见解在乳腺癌的预后。
本研究的结果显示一个重要IMAAG基因之间的联系。六个基因用于BCPRS BCRRS评分系统是高度相关的操作系统和PFS在乳腺癌的预后。更高的乳腺癌患者BCPRS和BCRRS评分与预后差相关。此外,GSEA和GEVA富集分析表明,BCPRS得分显著相关的差异的生物通路参与免疫渗透,自噬和甲基化。值得注意的是,WGCNA分析显示一致的发现富集分析。KEGG去富集分析BCPRS-related基因来源于WGCNA分析表明BCPRS-related基因参与肿瘤扩散,入侵和转移。因此,BCPRS-related基因可能大大有助于乳腺癌的预后不良。此外,BCPRS可用于综合确定自噬的地位,甲基化,和免疫富集,从而增强肿瘤微环境在乳腺癌细胞的知识6]。
确定IMAAGs潜在的预后因素的操作系统和PFS的乳腺癌患者。值得注意的是,大部分的这些基因在先前的研究已报告与癌症患者的预后密切相关,其中包括乳腺癌。BRCA1基因是分子在乳腺癌的关键,主要表达在乳腺癌的低水平。其表达与YY1呈正相关。先前的研究报告,YY1 BRCA1基因启动子结合,和超表达YY1导致增加BRCA和一些下游基因BRCA1的表达(80年]。此外,一些研究报告,YY1的高表达可能是有益的在乳腺癌的预后81年- - - - - -83年]。博根等人报道,NR2F1是一个潜在的传播肿瘤细胞刺激因子,促进乳腺癌骨转移(84年]。此外,NKX2-3调节结肠直肠癌的发展通过调节Wnt信号通路(85年]。NKX2-3也可以作为诊断前列腺癌的标志(86年]。先前的研究报告,IFNA13可能是一个潜在的结肠癌的预后分子标记(87年]。此外,HEY1-related通路调节细胞可塑性肝癌的肿瘤,这是疾病的危险因素之一(88年]。此外,NOTCH4-HEY1途径诱发epithelial-mesenchymal过渡在头颈部鳞状细胞癌(89年]。POU5F1在肺癌和结肠癌中扮演一个重要的角色90年- - - - - -92年]。在乳腺癌中,POU5F1 ERα的肿瘤抑制功能(93年]。
在最近的研究中,脂肪细胞主要位于高BCPRS集群。研究报告,脂肪细胞有一个复杂的函数在BRCA [94年- - - - - -97年]。先前的研究报告,脂肪组织巨噬细胞可能积聚在乳房脂肪组织作为一种机制促进TNBC具备干细胞和肿瘤发生在肥胖(98年]。值得注意的是,脂肪组织巨噬细胞(atm)富含高BCPRS集群在当前的研究中。这一发现表明,巨噬细胞并不总是扮演一个角色在促进机体的健康和有时负责肿瘤的恶性转化在乳腺癌与以前的研究一致99年]。然而,进一步的研究应该探索最初的BRCA微环境细胞信号和脂肪细胞之间的双向信号(One hundred.]。研究结果表明,细胞聚集在一起是来自相同的解剖区域和克隆扩张(101年]。
研究结果还表明,Wnt7b分泌自动取款机可能激活Wnt信号通路在肿瘤免疫微环境通过与FZD4交互,最终导致乳腺癌的恶性转化。研究报告,upregulation Wnt7b是必要的入侵,增长和转移的BRCA通过Wnt信号通路的激活102年,103年]。FZD4作为受体Wnt7b和中扮演着重要的角色在Wnt信号通路的激活104年]。Wnt信号在干细胞生物学和再生医学是很重要的。生物信息学和相关分析显示,信使rna的FZD4有很强的最小自由能和mir - 206和转录的FZD4脂肪细胞可以抑制mir - 206。先前的研究报告,MALAT1海绵可以作为mir - 206 (31日,32,75年]。MALAT1诱发癌症细胞增殖,入侵,老鼠和迁移105年]。然而,致癌基因和肿瘤抑制功能MALAT1在乳腺癌细胞是有争议的105年]。类似于BRPRS, MALAT1的表达水平是负相关mRNAsi和EREG.mRNAsi。这一发现意味着MALAT1可能是一把双刃剑,其致癌作用可能与BCPRS-associated肿瘤微环境,具备干细胞与肿瘤细胞负相关。当前研究的结果表明,LINC00276充当mir - 206海绵上调FZD4转录。MALAT1和LINC00276(由l - 685458)因此协同作用作为mir - 206的海绵,进而促进FZD4转录和移植Wnt信号通路在自动取款机Wnt7b分泌的存在。这个过程可能会打断了l - 685458。
当前研究的目的是探讨IMAAGs和BRCA肿瘤微环境之间的关系。研究结果表明,BCPRS和BCRRS评分系统可以用于全面评价操作系统和PFS在乳腺癌患者的预后。他们的预测被证实使用临床样本。BCPRS评分系统是独立的传统TNM分期的,这意味着它可以用作补充对乳腺癌的预后评分系统。此外,这项研究的结果提供信息MALAT1致癌基因和肿瘤抑制功能的乳腺癌细胞。总之,BCPRS和BCPRS-related基因(HEY1、IFNA13 NKX2-3, NR2F1, POU5F1,和YY1)可以用来评估乳腺癌患者的肿瘤免疫微环境和纯洁。
此外,神经网络建立了深度学习模型预测乳腺癌细胞类型使用BCPRS-related基因(HEY1、IFNA13 NKX2-3, NR2F1, POU5F1,和YY1)。BCPRS-related以基因为基础的神经网络显示精度高使用训练集和测试集。因此,这些发现显示BCPRS-related基因的重要性,探索肿瘤微环境。
虽然基因改变可能影响mRNA的表达水平,本研究的结果显示,肿瘤无显著变化六个IMAAG基因的拷贝数和核苷酸突变(HEY1、IFNA13 NKX2-3, NR2F1, POU5F1,和YY1)。BCRRS惊讶地发现是与中风的危险。这些发现表明六IMAAG基因表达水平的变化更有可能出现由于肿瘤微环境的改变而不是CNV或单核苷酸多态性的变化。scRNA-seq和散装RNA-seq遵循一个二维数据分析表明,TNBC细胞分化轨迹,他们与BCPRS分化状态相关。脂肪细胞和脂肪组织巨噬细胞(atm)高纯度高BCPRS集群。此外,drug-ceRNA和中的交互分析预测,LINC00276&MALAT1 mir - 206 / FZD4-Wnt7b途径基于BCPRS可能有助于探索肿瘤的机制导致死亡率和可以提供见解的发展新的药物组合。BCPRS-related基于基因的神经网络深度学习模型表明这些基因有很大的潜力在肿瘤微环境的映射。这些发现提供了新颖的理念识别高危乳腺癌和个性化的治疗方案对疾病的发展未来。
BCPRS和BCRRS评分系统用于当前研究显示一个潜在的关系6 IMAAG基因和乳腺癌的微环境。然而,进一步的功能性实验应该执行探索潜在的IMAAG基因的作用机制。这个模型应该进一步验证使用独立的群体,以确保它是高度健壮。此外,未来实验需要探索drug-ceRNA网络的潜在机制和潜在LINC00276&MALAT1 / mir - 206 / FZD4-Wnt7b通路。
5。结论
在这项研究中,BCPRS和BCRRS评分系统建立了基于六IMAAGs满意临床效用。这一发现表明,脂肪细胞和自动取款机是高纯度高BCPRS集群和与不良预后相关。此外,中的相互作用和潜在的监管机制表明,LINC00276&MALAT1 / mir - 206 / FZD4-Wnt7b潜在通路的功能IMAAGs在乳腺癌转移和复发。总之,综合评价个人IMAAGs BCPRS, BCRRS提供了一个更好地了解乳腺癌的肿瘤微环境和见解的开发个性化的治疗方案。
缩写
| 参数: | Autophagy-related基因 |
| 自动取款机: | 脂肪组织巨噬细胞 |
| BCPRS: | 乳腺癌预后风险评分 |
| BCRRS: | 乳腺癌复发风险评分 |
| 个基点: | 生物过程 |
| CCs技术: | 蜂窝组件 |
| CNV: | 拷贝数变异 |
| CS: | 生存条件 |
| DCA: | 决策曲线分析 |
| 度: | 差异表达基因 |
| 民主党: | 差异表达mrna |
| 走: | 基因本体论 |
| GSEA: | 基因集富集分析 |
| GSVA: | 基因变异分析微阵列和RNA-seq数据 |
| HNC: | 头部和颈部癌症 |
| IMAAGs: | 免疫、甲基化和Autophagy-Associated基因 |
| KEGG: | 京都基因和基因组的百科全书 |
| 为: | 克鲁斯卡尔-沃利斯 |
| 套索: | 至少绝对收缩和选择算子 |
| MFs: | 分子功能 |
| microrna的: | 丙肝 |
| 操作系统: | 总生存期 |
| 主成分分析: | 主成分分析 |
| PFS: | 无进展生存 |
| PPI: | 蛋白质相互作用 |
| qPCR: | 定量实时聚合酶链反应 |
| 中华民国: | 接受者操作特性 |
| SNP: | 单核苷酸多态性 |
| TCGA: | 癌症基因组图谱 |
| TNBC: | 三阴性乳腺癌 |
| 汤姆: | 拓扑重叠测量 |
| WGCNA: | 加权基因Coexpression网络分析 |
| UMAP: | 统一的歧管近似和投影。 |
数据可用性
生成的数据集和分析在当前的研究可从相应的作者以合理的要求。
附加分
研究总结。虽然一个高度协调免疫之间的相互作用,甲基化和Autophagy-Associated基因(IMAAGs)存在,其综合应用程序特定标记的肿瘤微环境的分析和预测乳腺癌的预后还没有探索。六个预后IMAAGs被确定,全面探索乳腺癌预后的OS和PFS。研究结果表明,基于6 IMAAGs BCPRS和BCRRS评分系统可以准确地预测乳腺癌患者的预后。操作系统和PFS诺模图构建预测模型具有较高的临床价值。分析表明,BCRRS与中风的危险。蛋白质相互作用(PPI)和drug-ceRNA网络基于乳腺癌预后风险评分的差异(BCPRS)。此外,脂肪细胞和脂肪组织巨噬细胞(atm)高纯度高BCPRS集群和与不良预后有关。中的相互作用和潜在的监管机制进行了探讨和LINC00276&MALAT1 / mir - 206 / FZD4-Wnt7b通路被发现在这些基因的功能起着重要的作用,可以用来探索目标对乳腺癌转移和复发。此外,神经网络建立了深度学习模型预测细胞成分使用BCPRS基因签名。
伦理批准
本研究机构伦理审查委员会批准的上海综合医院(批准号2020 ky211)。
同意
从参与获得知情同意书是病人。
的利益冲突
作者声明不存在利益冲突。
作者的贡献
JW,金桥,JX, TJ和YC的数据进行管理和分析。JW,金桥,JX TJ,噢,KZ, YC, YL, TJ, JX分析和解释结果。JW,金桥,JX起草和回顾了手稿。所有作者阅读和批准最终的手稿。Jun-yi吴和秦军同样这项工作。
确认
我们欣赏价值的生物信息学分析支持收到Xueran Kang博士(联系电子邮件:(电子邮件保护);(电子邮件保护)在过去的几年里。这项工作是支持由中国国家自然科学基金(8197032698)。
补充材料
补充表和数据。(补充材料)