文摘
背景。T细胞介导的抗肿瘤免疫反应是结直肠癌(CRC)免疫治疗的基础。胆固醇在T细胞信号转导中起着重要的作用和功能。载脂蛋白E(APOE)在胆固醇代谢中起着重要的作用。客观的。筛选和分析关键参与anticolon癌症标记反应的CD8 + T细胞通过调节胆固醇代谢。方法。基于中位数截止值的表达式APOE根据数据下载癌症基因组图谱和基因表达的综合数据库,患者分为低和高表达组。不同的临床因素进行了评估,并进行生存分析。差异表达基因(度)高、低表达组筛选,紧随其后的是肿瘤浸润免疫细胞的差异分析和加权基因coexpression网络分析的结果。密切相关的基因APOE被确定,其次是富集分析,蛋白质相互作用网络分析(PPI),和微分表达式分析。免疫组织化学染色(包含IHC)是用于检测CD8在结肠组织的表达。结果。预后有显著差异,pathologic_N APOE之间的低和高表达组。2349度高、低表达组之间选择。总共有967个基因从蓝色和棕色获得模块。的概率分布的CD8 + T细胞明显不同在两组之间,和320度密切相关APOE筛选。基因包括HLA基因家族,B2M,IRF4,STAT5APPI网络有更高的学位。地理数据集验证预后相关的度APOE。包含IHC染色证实CD8 + T细胞的分布之间的关系APOE表达式。结论。基因包括HLA基因家族,B2M,IRF4,STAT5A可能涉及的关键基因anticolon癌症回应的CD8 + T细胞通过调节胆固醇代谢。
1。介绍
结肠癌是世界范围的一个主要卫生问题,因为它是癌症相关死亡的第二大原因1]。据报道,到2030年,特别是在发达国家,新病例的数量将增加到220万,和死亡的情况下将会增加到110万2]。虽然手术切除结合放疗和化疗是主要的治疗结肠癌,5年生存率仅约28% (3]。过多的膳食脂肪与感应/各种疾病的恶化,包括结肠癌(4]。此外,大量研究表明“西方”的风格与高脂肪饮食内容的一个重要因素在结肠癌的发病率的上升5- - - - - -7]。高脂肪饮食也广泛参与各种病理条件下,如肥胖和代谢疾病,这可能促进结肠癌的发展(8]。高血脂通常分为四种类型:高胆固醇血症、高甘油三酯血症、高脂血症,和低高密度脂蛋白胆固醇。一项研究表明,高脂血症是结肠癌的危险因素9]。
T细胞介导的抗肿瘤免疫反应的基础是肿瘤免疫疗法,这是与良好的预后相关(10]。然而,一些肿瘤进化获得免疫抑制特性和逃避攻击T细胞通过各种机制在肿瘤微环境11]。因此,重新激活T细胞的细胞毒性的临床癌症免疫疗法的兴趣。胆固醇在T细胞信号转导中起着重要的作用和功能。例如,杨等人发现,老鼠的CD8 + T细胞的抗肿瘤反应可以通过调节胆固醇代谢增强[12]。马等人表明,高胆固醇可以促进T细胞免疫检查点表达式,使T细胞更容易失去抗肿瘤功能(13]。然而,这些研究只集中在T细胞基因变化和内质网压力和不检查肿瘤细胞的影响。
据报道,高胆固醇可以促进干细胞的增殖,从而增加肠道肿瘤的增长速度100倍(14]。RORα/ hdac [15],CD36 [16],ACAT1 [17)等参与监管的CD8 + T细胞的抗肿瘤反应调节胆固醇代谢。然而,涉及的关键标记仍不清楚。因此,本研究旨在屏幕和分析关键参与anticolon癌症标记反应的CD8 + T细胞通过调节胆固醇代谢。本研究的工作流程如图1。
2。材料和方法
2.1。数据源和数据预处理
基因表达RNAseq数据(日志2(fpkm + 1)]和结肠腺癌的临床资料得到从癌症基因组图谱数据库(18)(https://xenabrowser.net/)。测序数据和临床信息匹配后,共有389个肿瘤样本(数据版本:07-19-2019)获得的。RNA-Seq注释是基于Gencode数据库的注释文件19(第23节,https://www.gencodegenes.org/)。Ensembl_ID的表达谱分析,映射探测器是用来计算基因表达值(从注释文件获得的芯片平台和微阵列数据集)Symbol_ID。平均值为Ensembl_ID表达水平当多个探测器匹配Symbol_ID之一。与“protein_coding”注释被提取基因mrna。
2.2。APOE相关临床和生存分析
载脂蛋白E(APOE)在胆固醇代谢中起着重要作用[20.]。因此,在这项研究中,筛选关键标记参与anticolon癌症的CD8 + T细胞的反应通过胆固醇代谢调控、APOE的表达水平是计算使用Survminer包R(版本:0.4.8,https://CRAN.Rproject.org/package=survminer),其次是中间截止表达式的值。然后,基于中值表达式的截止值,患者分为低和高表达组。此外,执行kaplan - meier存活曲线分析和生存率较比较两组之间的预测基于生存信息的样本。临床因素(年龄、性别、TNM阶段,pathologic_stage)比较低和高表达组之间使用卡方测试;差异被认为是重大的阈值< 0.05。
2.3。差异表达分析
典型的贝叶斯方法在limma包(21(版本3.40.6)是用于分析差异表达基因(度)高、低表达组之间。Benjamini和业务方法被用来调整值。调整值< 0.05和| logFC | > 0.263被用作截止条件筛选度。最后,ggscatter ggpubr包的函数(22在R(版本:0.2.2)被用来画一个火山的。
2.4。和基因筛查的APOE相关模块
加权基因coexpression网络分析(WGCNA)算法被用来屏幕模块和APOE基因相关表达式基于度的表达式值。网络建设和模块筛查程序包括数据一致性分析和基因coexpression相关矩阵,相邻函数,节点之间的相位差,网络模块和疾病之间的相关性分析。一个热图用于可视化每个模块的相关性。
2.5。免疫相关基因的筛选
CIBERSORT算法(23),一个有用的方法来获得高通量的特点22细胞类型在复杂的组织,是用于分析大量的免疫细胞与肿瘤浸润的参数烫= 100和QN =F。随后,大量的各种类型的免疫细胞在高、低表达组测试。然后,度之间的皮尔逊相关系数和CD8 + T细胞进行了计算,得到了和免疫相关基因的截止r < 0.05和| | > 0.3。模块的基因从WGCNA获得与这些免疫相关基因,和重叠基因被重新定义为基因密切相关APOE。
2.6。富集分析
基于基因密切相关APOE,集群分析器包(24在R是用于执行基因本体论(去)25)和《京都议定书》百科全书的基因和基因组(KEGG) [26)通路富集分析的截断值< 0.05,数≥2。
2.7。蛋白质相互作用网络分析(PPI)
字符串数据库(27)是用来评估的质子泵抑制剂编码基因密切相关APOE。PPI的分数是0.9分。随后,T的PPI网络闲暇的基因进行了分析使用Cytoscape软件(28]。
2.8。度分析与载脂蛋白e和CD8 + T细胞
R软件ggplot2(版本:3.2.1之上,https://CRAN.R-project.org/package=ggplot20.2.2)和GGpubr GGpubr(版本,t以及提供的https://CRAN.R-project.org/package=ggpubr)被用来分析两组之间的差异的基因。一盒图是显示的阈值< 0.05。
2.9。数据集验证
两个地理数据集,GSE71187 GSE39582,选择与预后信息从GEO数据库来验证APOE相关生存分析的结果。series_matrix。txt data containing 99 tumors and 12 para-cancers was obtained after pretreatment of GSE71187. Furthermore, the series_matrix.txt containing 566 tumors and 19 para-cancers was obtained after pretreatment of GSE39582. The expression of APOE in the two datasets was extracted.R软件Survminer(版本0.4.8)包APOE表达式计算获得最优截止。表达式的值>最优截止被视为高表达,与表达式值≤最佳截止被认为是低表达。然后,两组患者的预后。结合的生存信息样本,km曲线绘制,log-rank被用来测试它的意义。
病人在GSE71187和GSE39582分为两组中值显示APOE表达式。5表达的转录(STAT5A),组织相容性白细胞抗原(HLA)基因家族(HLA-E, HLA-C HLA-B,等等),β2微球蛋白(B2M)和干扰素调节因子4 (IRF4)被测试在高和低的载脂蛋白e表达组。R软件GGplot2(3.2.1版本,https://CRAN.R-project.org/package=ggplot2)和GGpubr GGpubr(0.2.2版本t以及提供的https://CRAN.R-project.org/package=ggpubr)被用来分析两组之间的差异的基因。一盒图是显示的阈值< 0.05。
2.10。CRC标本和包含IHC染色
研究人类伦理委员会批准的协议是湖州中心医院(没有:20210207)。四十CRC患者招募,补充表2中给出的基本信息。的表达通过使用immunoturbidimetry APOE血液检测。APOE高于53.0 mg / L是包含在APOE-high集团和APOE低于29.0 mg / L是包含在APOE-low组。进一步发现CD8表达式是由使用免疫组织化学。免疫组织化学检测组件,抗原修复解决方案,和CD8抗体都购自北京中山金桥生物技术有限公司有限公司组织部分进行扫描低倍镜下(X100)选择CD8阳性细胞密度高的地区。然后,积极的CD8细胞在五个领域的决心高倍镜(X200型)来计算平均值。积极的CD8细胞表达为平均值±标准偏差。使用SPSS 13.0统计软件,皮尔森χ2执行测试。
3所示。结果
3.1。临床因素比较和分析之间的度高、低表达组
的执行kaplan - meier存活曲线分析和生存率较比较两组之间的预测基于生存信息的样本。结果表明,预后有显著差异之间的低和高表达组(=(图0.018)2(一个))。此外,显著差异在两组之间的病理发现N (=(图0.029)2 (b))。总共有2349度,其中1949年和400年是调节和表达下调,分别在高、低表达组选择(图2 (c))。
(一)
(b)
(c)
3.2。疾病相关模块和基因
2349度被用于WGCNA分析。矩阵变换的软阈值功率是确定为8日之间相关系数的平方log2k和log2p (k(图0.85)3(一个))。基因的最小数量为每个模块设置为30,和修剪高度cutHeight = 0.2。总共有五个不同的疾病相关模块(图的筛选3 (b)),包括蓝色,棕色,绿色,红色,和黄色模块。确保检查结果的可靠性的关键网络模块、疾病关键网络模块再次进行了分析通过计算基因的绝对值的意义(GS)模块,模块和结果表明,蓝色和棕色有更高的GS(图3 (c))和疾病有显著相关性(图D)。最后,总共有967个基因从蓝色和棕色获得模块。
(一)
(b)
(c)
(d)
3.3。CD8 + T闲暇的度
免疫渗滤高和低表达组根据CIBERSORT算法进行了分析。如图4(一)和4 (b)22岁的肿瘤免疫细胞比例高、低表达组进行了分析。观察到的概率分布不同的肿瘤免疫细胞在两组之间,小提琴的阴谋。如图4 (c)的概率分布的CD8 + T细胞是最重要的两组之间的差异(< 0.01)。度之间的相关系数和CD8 + T闲暇的基因被计算,总共612 CD8 + T闲暇的识别度。此外,模块的基因来自WGCNA交叉与这些CD8 + T闲暇的基因,和一个320度密切相关APOE获得(图4 (d)、补充表1)。
(一)
(b)
(c)
(d)
3.4。富集分析和PPI网络分析的APOE度密切相关
富集分析表明,密切相关的调节度主要是参与544年GO-biological流程(个基点;例如,T细胞激活;淋巴细胞活化的监管;和调节T细胞激活)和54 KEGG路径(例如,hsa05169: eb病毒(EBV)感染和hsa04514:细胞粘附分子)(数据5(一个)和5 (b)),而密切相关的表达下调度没有参与GO-BP和KEGG通路。PPI网络分析320度密切相关APOE显示191个节点和1153互动对(图5 (c))。PPI网络,基因包括组织相容性白细胞抗原(HLA)基因家族(HLA-E, HLA-C HLA-B,等等),beta-2-microglobulin (B2M)、干扰素调节因子4 (IRF4),STAT5A拥有更高的学位,这可能导致他们作为关键基因(表的分类1)。
(一)
(b)
(c)
(d)
3.5。度分析与载脂蛋白e和CD8 + T细胞
如图5 (d)组织相容性白细胞抗原(HLA)基因家族(HLA-E, HLA-C HLA-B,等等),beta-2-microglobulin (B2M)、干扰素调节因子4 (IRF4), STAT5A显著差异表达在高和低的载脂蛋白e组(< 0.001)。
3.6。验证APOE-related生存分析和度与载脂蛋白e和CD8 + T细胞
如km曲线在图所示6(一)和6 (b),GSE3958的生存分析结果和GSE71187验证高表达组预后不良(< 0.05)。此外,在数字框所示图6 (c)和6 (d)有关,大多数基因在GSE39582 GSE71187数据集和高表达(< 0.05)。结果与分析结果一致,TCGA的数据库。
(一)
(b)
(c)
(d)
3.7。CD8 + T细胞的渗透与载脂蛋白e部分组织标本
招募了CRC患者的基本信息出现在补充表2。包含IHC染色CD8蛋白质的检测表明,CD8调节表达APOE-high表达组(图7(一)),而CD8在APOE-low表达下调表达组(图7 (b))(= 0.001)。统计结果表2。
(一)
(b)
4所示。讨论
在这项研究中,预后有显著差异,pathologic_N之间的低和高表达组。2349度高、低表达组之间选择。此外,CD8 + T细胞的概率分布是最重要的两组之间的差异。320度密切相关APOE被确定。基因包括HLA基因家族,B2M,IRF4PPI网络有更高的学位,然后呢STAT5A被许多microrna在龙头、网络监管。
胆固醇被报道与结肠癌有关。鸡蛋脂肪含量低,含有大量的胆固醇,和鸡蛋消费与结肠癌的风险增加有关(29日]。此外,雅各布斯等人似乎表明,高胆固醇水平增加结肠癌的风险(30.]。符合我们的数据,在这项研究中,生存分析结果表明,高胆固醇组与贫穷的生存,这表明高胆固醇是结肠癌的危险因素。pathologic_N除此之外,一个重要的差异被发现之间的低和高表达组和pathologic_N3高表达组的比例高于低表达组,这进一步表明,高胆固醇是结肠癌的危险因素。
CD8 + T细胞在抗肿瘤免疫发挥极其重要的作用;然而,肿瘤浸润T细胞经常失去效应函数。马等人报道,胆固醇诱发CD8 + T细胞疲劳,调节内质网应激途径(IRE1 / XBP1)在肿瘤微环境13]。更重要的是,CD8 + T细胞被极化成IL-9-secreting (Tc9)细胞发挥抗肿瘤反应,而胆固醇或其衍生物抑制IL-9表达式通过激活肝脏吗X受体(LXRs),导致LXR SUMOylation和减少p65绑定IL-9启动子(31日]。疲惫的CD8 + T细胞的特点是衰减抗肿瘤反应和降低浸润密度。因此,高胆固醇降低CD8 + T细胞的渗透。在这项研究中,我们还分析了关键标记anticolon癌症CD8 + T细胞的反应通过胆固醇代谢调控使用生物信息学分析。结果表明,基因等HLA基因家族,B2M,IRF4PPI网络有更高的学位,然后呢STAT5A被许多microrna在龙头、网络监管。的HLA基因家族在调节免疫反应中起着重要作用的癌症。例如,蔡等人发现HLA-DQA1和HLA-DQB1可能参与口腔癌症的发展(32]。Bianchini等人表明,HLA-E基因强烈支持一个潜在tumor-evading免疫监视策略在结肠癌组织中(33]。此外,Benevolo等人发现抗原,HLA-B,HLA-C表达在结肠癌与预后有关(34]。布卢姆等人建议,在II期结肠癌患者,Map7 / B2M表达比率是生存的预后因子(35]。IRF4被认为是一种癌基因在淋巴恶性肿瘤和多发性骨髓瘤(36,张等人表明,过度的circPIP5K1A减毒的表达IRF4在结肠癌的发展开发(37]。转录因子,激活或磷酸化的统计与许多癌症相关。Slattery等人表明STAT5A与结肠癌进展(38]。此外,核苷酸分析表明,调节密切相关的基因参与EBV感染和细胞粘附分子KEGG通路。EBV与多种恶性肿瘤有关。关等人报道积极EBV感染与结肠癌之间的联系(39]。据报道,参与多种细胞粘附分子信息和cell-matrix交互在结肠癌,和一些信息和确定结肠癌cell-matrix交互行为(40]。基于这些结果,我们推测,包括基因HLA基因家族,B2M,IRF4,STAT5A可能参与EBV感染和细胞粘附分子通路anticolon癌症响应中扮演重要角色的CD8 + T细胞通过调节胆固醇代谢。
然而,这项研究有一些局限性。我们需要进行相关的实验等细胞生物学实验和动物实验来验证获得的多个候选目标和信号通路在这个生物信息学分析。
5。结论
总之,基因等HLA基因家族,B2M,IRF4,STAT5A可能涉及的关键基因anticolon癌症回应的CD8 + T细胞通过调节胆固醇代谢。这些发现可以指导临床决策结肠癌的治疗以及未来研究结肠癌。
缩写
| KEGG: | 京都基因和基因组的百科全书 |
| 走: | 基因本体论 |
| 地理: | 基因表达综合 |
| PPI: | 蛋白质相互作用 |
| 英国石油公司: | 生物过程 |
| 龙头: | 内源性RNA竞争 |
| WGCNA: | 加权基因coexpression网络分析 |
| 度: | 差异表达基因 |
| 载脂蛋白e: | 载脂蛋白E |
| HLA: | 组织相容性白细胞抗原 |
| STAT5A: | 信号传感器和5的转录激活 |
| IRF4: | 干扰素调节因子4 |
| B2M: | Beta-2-microglobulin。 |
数据可用性
从TCGA存储库和原始数据获得https://xenabrowser.net/datapages/。验证数据来源于地理库(GSE3958和GSE71187) (https://www.ncbi.nlm.nih.gov/geo)。分析数据可在补充信息或从作者在合理的请求。
附加分
1。结肠癌的预后不同之间的高和低胆固醇组。2。CD8 + T细胞的概率分布不同显著高和低胆固醇组之间。3所示。基因包括HLA基因家族,B2M,IRF4可能涉及的关键基因anticolon癌症回应的CD8 + T细胞通过调节胆固醇代谢。
伦理批准
临床病人有关的协议和知情同意的形式是湖州中心医院伦理委员会的批准(没有。20191101 - 01)。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
所有作者参与的概念和设计研究。梁董和汉Shuwen构思和起草了手稿。习杨和金阴分析数据。王Yangyanqiu和周清起草了图。东梁、陈龚和汉族Shuwen写和修改后的文章。所有作者阅读和批准。
确认
作者欣然承认多个数据库,使数据可用,感谢病人和志愿者的贡献临床数据的调查,CRC组织,和paracancerous组织收集。这项工作是支持的医疗卫生科技项目浙江省卫生委员会(没有。2020 rc117)和湖州的公益性技术应用研究计划(没有。2018 gy15)。
补充材料
补充表1。度相关的载脂蛋白e。模块的基因来自WGCNA被分割的CD8 + T闲暇的基因,和载脂蛋白e 320度密切相关。补充表2。40 CRC患者的基本信息。原始数据得到TCGA从存储库,就我们的目的而言,https://xenabrowser.net/datapages/。分析数据可在补充信息或从作者在合理的请求。(补充材料)