文摘
它吸引了越来越多的关注,丝氨酸羟甲基转移酶2的角色(SHMT2)各种类型的癌症。然而,SHMT2在肺腺癌的预后作用(LUAD)及其与免疫细胞浸润的关系还不清楚。在这项研究中,在LUAD mRNA表达和诊所的信息数据,分别从地理和TCGA数据库下载。我们进行了生物分析选择基因SHMT2签名。在线数据库包括Oncomine GEPIA TISIDB,计时器,和HPA分析SHMT2表达式的描述,预后和相关免疫LUAD渗透。SHMT2 mRNA表达和蛋白表达的LUAD组织是高于正常组织。kaplan meier分析显示,患者SHMT2有更好的表达水平较低的总体生存率。多变量分析和Cox比例风险回归模型显示,SHMT2表达式LUAD患者是一个独立的预后因素。与此同时,基因SHMT2 LUAD高度与肿瘤浸润淋巴细胞相关。这些结果表明,SHMT2基因是一种很有前途的候选人作为一个潜在的预后与不同类型的相关生物标志物和高度在LUAD免疫细胞浸润。
1。介绍
肺癌是最常见的癌症和癌症相关死亡的主要原因,导致全球日益增长的公众关注。肺癌分为nonsmall细胞性肺癌(NSCLC)和小细胞肺癌(SCLC)。非小细胞肺癌占大约85%的肺癌(1),其中包含两个主要类型:肺鳞状细胞癌(LUSC)和肺腺癌(LUAD)。LUAD是最常见的非小细胞肺癌诊断、组织学亚型LUSC紧随其后。最常见的组织学亚型,LUAD经常发生在女性和不吸烟的人来说,在早期没有明显的临床症状,但共享一些与其他呼吸系统疾病常见的症状,导致肺癌的鉴别困难。此外,LUAD平均5年生存率不到20% (2)由于其在早期阶段转移。因此,迫切需要确定新的诊断和预后的生物标志物LUAD增加早期诊断的有效性。
丝氨酸羟甲基转移酶(SHMT)之间的转换是一个重要的酶的丝氨酸和甘氨酸以及一个碳代谢,提供蛋白质和核酸合成的重要前体对肿瘤生长和转移。注意,氨基酸和一个碳代谢是癌症生物学的基础,和一个碳代谢的hyperactivation已经被证明是驱动因素相关的细胞增殖和细胞的表观遗传状态(3]。SHMT2是SHMT基因,编码一种蛋白质,这种蛋白质定位线粒体(4开车,被确定为一个潜在的基因在不同癌症细胞生长和侵略性5]。hiv - 1病毒转录的关键调节器,乙水平调节通过K63Ub-selective autophagy-mediated通过SHMT1 2和BRCC36 deubiquitinase。许等人已经确定SHMT2和BRCC36小说和hiv - 1乙蛋白质含量的重要监管机构感染T细胞(6]。霁等人证明SHMT2在肝癌组织的表达水平与肿瘤密切相关年级和乙型肝炎病毒(HBV)感染(7]。此外,基因消融SHMT2导致炎性细胞因子签名(强劲增长8]。SHMT2可能减轻细胞凋亡和损害肝缺血再灌注损伤后炎性因子的释放,抑制物通路的激活和过度激活的NF -κB通路(9]。SHMT2显示不宜总生存期肝内胆管癌患者(10]。SHMT2在许多癌症,是一个非常重要的基因和蛋白质组学分析乳腺癌的新陈代谢标识SHMT2预后因素(11),它导致缺血神经胶质瘤细胞的生存取决于甘氨酸间隙(12,13]。然而,相关的几种SHMT2 LUAD及其预后的潜在使用在很大程度上仍是未知的。
近年来,免疫疗法的结合和高通量基因芯片已广泛用于肿瘤和其他疾病领域更深层次的相关性分析来预测更深刻的研究。因此,可用的高通量数据分析在许多数据库已成为一个有效的、低成本的方法来发现许多疾病的生物标记物。免疫细胞与各种癌症的预后密切相关。越来越多的证据支持这一恶性表型不仅是由肿瘤细胞的内在活动也由组件在肿瘤微环境,尤其是肿瘤浸润免疫细胞(14),这是一个重要的决定因素的预后和肺癌的免疫反应15]。例如,CD83 +树突细胞和Foxp3 +调节性T细胞在初级病变和区域淋巴结胃癌的预后(呈低度负相关,16]。增加肿瘤浸润肿瘤相关巨噬细胞(tam)与非小细胞肺癌的预后不良(17];直流和T细胞与更好的预后(18,19]。与此同时,高通量基因微阵列让我们可以进一步探索肿瘤在多个水平。
在这项研究中,我们从GEO数据库下载LUAD-related数据集(基因表达综合)和TCGA(癌症基因组图谱)数据库和生物信息学进行统计分析,选择不同的基因表达(度)之间的正常组织和肿瘤组织。随后,随后进行了功能分析和生存分析选择与生物和临床基因签名和验证签名。此外,我们充分利用方便的在线网站的工具来探索签名和免疫细胞之间的关系,尤其是在不同层次验证假设。
2。方法
2.1。数据收集和预处理
我们获得了LUAD-related微阵列资料(GSE116959 [20.],GSE21933 [21],GSE31210 [22从地理数据库])(https://www.ncbi.nlm.nih.gov/geo/)。在这项研究中,选择符合以下标准的数据集:(a)的研究比较人类LUAD癌症样本之间的基因表达和相应的正常组织;(b)样本的数量在每个基因表达分析数据集应该超过30。
微阵列数据规范化和分析通过R“limma”方案,实现经验贝叶斯方法分析微阵列数据(23]。我们设置log2褶皱的变化 与一个调整值小于0.01作为阈值来定义重要(度),选择的差异表达基因进行后续分析。我们命名为度,重叠的三个数据矩阵作为常见的度。此外,多个探针对应于相同的基因注释文件;这些探测器的平均表达是用作表达式值相应的基因。分析和处理这些上述数据乘以R语言。
此外,我们获得了LUAD转录组RNA-seq TCGA临床数据集的数据集和相应的数据库(https://cancergenome.nih.gov/)包含521个肿瘤样本和46个正常样本。
2.2。功能性浓缩度的分析
2.2.1。去和KEGG途径分析
为了研究生物过程功能和通路相关的选择度,我们也进行基因本体论(去)和基因和基因组的京都百科全书(KEGG)富集分析。去分析分类的共同度分为三个类别,包括生物过程(BP)、蜂窝组件(CC)和分子功能(MF)。KEGG分析进行确定显著富集度的途径被定义为截止重要标准值< 0.05。此外,Cytoscape软件(版本3.8.0)被用来屏幕中心的基因。去和KEGG分析都是基于在线数据库大卫(6.8版)(https://david.ncifcrf.gov)和视觉显示通过R软件(版本3.6.1)。
2.2.2。筛选基因Cytoscape软件中心
Cytoscape软件(版本3.8.0)是一个开源的生物信息学软件平台可视化分子间相互作用网络和生物通路和集成这些网络与注释,基因表达谱等状态数据。MCODE Cytoscape应用,发现集群网络中(高度连接的区域)。
2.2.3。基因集富集分析
基因集富集分析(GSEA) (http://software.broadinstitute.org/gsea/index.jsp)是一种计算方法,确定一组预先定义的基因显示统计学意义,整合两个生理状态之间的差异(24(例如,表型)(从GSEA官方网站)。我们使用这个计算方法分析功能和特征基因的潜在途径。为了找出基因集和函数之间的关系我们感兴趣的是,我们进行GSEA分析基于“C5:基因集”三组gse的GSEA 4.0.3的软件版本。错误发现率 和名义 被认为是截止条件。
2.3。生存分析
2.3.1。风险评分公式成立
临床信息的原始521 TCGA肺腺癌患者排序和筛选270例,与肺腺癌患者随机分为培训集团( )和测试组( )。我们进一步研究了潜在的角色在临床结果筛选后的基因。我们使用风险评分公式预测LUAD病人的生存。风险评分公式如下: (25]。
2.3.2。风险评分公式验证
签名验证基因风险内部验证数据集,我们计算每个病人的风险评分在完整的TCGA队列。病人被分为高风险和低风险组根据相应的风险评分中位数。这种风险模型的预测精度是由接受者操作特征时间(ROC)分析。
2.3.3。统计分析
统计分析和图形绘制软件进行了R。病理和分子特征差异不同组的患者相比,使用卡方和确切概率测试。预后因素被Cox回归分析评估,kaplan meier方法。kaplan meier的存活率计算方法使用生存率较曲线和比较。预后因素的重要性是通过多变量Cox比例风险评估回归,用值小于0.05视为统计显著。
然后,kaplan meier绘图机是应用于检查SHMT2的预后价值。kaplan meier绘图仪数据库(http://kmplot.com/analysis/)是一个包含微阵列配置文件和mRNA-seq数据的在线分析工具与患者的生存信息,包括总生存期(OS)和无进展生存(RFS),总结了从TCGA,基因表达混合,和癌症生物医学信息学网格(26]。kaplan meier绘图仪数据库用于分析LUAD SHMT2表达式和生存之间的关系。一个log-rank价值和风险比(人力资源)和95%的置信区间也计算。
2.4。在线签名基因验证和分析
2.4.1。Oncomine数据库分析
SHMT2的表达水平,分析了各种类型的癌症在Oncomine数据库(https://www.oncomine.org/),特别是肺癌。Oncomine癌症数据库是一个在线数据库的强大分析功能计算基因表达特征,集群,和基因片段的模块,自动从数据中提取生物见解(27]。信使rna表达肿瘤与正常组织之间的差异进行了分析和阈值如下:值为0.01,褶皱变化的基因排序的数据从信使rna。
2.4.2。GEPIA数据库分析
基因表达分析互动分析(GEPIA)数据库(http://gepia.cancer-pku.cn/)是一个交互式web分析RNA的表达数据基于9736年肿瘤和8587年癌症基因组图谱的正常样本(TCGA)和一种项目(28]。我们进行了一次网上生存分析的基因SHMT2功能部分命名为生存GEPIA数据库中的情节。阈值是由以下原则:基因SHMT2,整体生存的方法,小组的截止值,切断高压(%)和切断低压(%)都是50岁的危害比(人力资源)是的,95%置信区间的是的,轴的单位,和数据集设置为LUAD。
2.4.3。UALCAN数据库分析
UALCAN数据库(http://ualcan.path.uab.edu)是一个用户友好的和交互式的数据库,提供方便地访问RNA-seq和31个癌症的临床数据类型的癌症基因组图谱(TCGA) [29日]。我们检查了RNA-seq表达SHMT2又进一步探讨SHMT2蛋白表达之间的相关性和LUAD数据库。
2.4.4。计时器数据库分析
SHMT2表达之间的相关性和丰富的免疫浸润探索基因模块在数据库计时器(https://cistrome.shinyapps.io/timer/),这是一个全面的工具建立了系统分析免疫浸润跨不同类型的癌症(30.]。与此同时,我们也分析了SHMT2和基因的表达之间的关系标记肿瘤浸润免疫细胞的相关模块。此外,SHMT2表达水平的各种类型的癌症在计时器数据库再次检查。
2.4.5。TISIDB数据库分析
进一步调查SHMT2表达之间的相关性,淋巴细胞和其他免疫调制剂,TISIDB数据库(http://cis.hku.hk/TISIDB),被称为肿瘤和免疫系统交互的web门户,应用于分析。TISIDB集成多种异构数据类型,包括988年报道的几种抗肿瘤基因,高通量筛选技术,分子分析和para-cancerous multiomics数据,以及各种资源为免疫数据从7个公共数据库(检索31日]。我们使用了TISIDB数据库分析SHMT2之间的联系和免疫细胞渗透和学习在LUAD函数。
2.4.6。人类蛋白质图谱分析
的蛋白表达SHMT2 LUAD和正常组织从人类获取蛋白质图谱数据库(HPA) (https://www.proteinatlas.org/),这是一个程序,目的是将所有的人类蛋白质在细胞、组织和器官使用一个集成的各种组学技术,包括免疫抗体成像质量spectrometry-based蛋白质组学、转录组和系统生物学(32,33]。在这项研究中,我们使用了HPA数据库分析蛋白表达和执行免疫组织化学(包含IHC)分析SHMT2之间正常的肺组织和LUAD组织。
3所示。结果
3.1。识别差异表达基因共同(度)
研究广义的流程图如图1。在执行差异分析数据集收集(GSE116959 GSE21933, GSE31210)在地理数据库中,共有577个样本46(521肿瘤样本和正常样本),TCGA数据库进行了探讨。有1868度从GSE116959过滤数据集,包括624年调节和1244个表达下调基因;2570度筛选GSE21933数据集,包括1193年调节和1377个表达下调基因;和7220度从GSE31210中选择的数据集,包括4107年的调节和3013个基因表达下调。为了使结果更直观,可视化。我们之间的度显示每个数据集通过火山地块(数字2(一个)- - - - - -2 (c))。更重要的是,度的聚类分析显示两个明显不同的分配模式之间的肿瘤和正常样本,表明度的关键作用的发生和进展LUAD(数据吗2 (d)- - - - - -2 (f))。通过维恩图解分析,670年共同度三个数据集的交集是识别和选择进行进一步分析。
(一)
(b)
(c)
(d)
(e)
(f)
3.2。签名的选择基因
为了寻找基因签名,我们进行基因集富集分析GSE21933, GSE31210, GSE116959。GSEA之后,我们发现有9套结果与免疫密切相关,和他们都是高表达的基因集。特别是,GSE21933与巨噬细胞,这是我们的一个重点。GSEA结果被列在图的信息3。接下来,我们选择调节基因之间的差异基因的进一步分析和浓缩。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
我们进行分析和KEGG通路富集分析度微分分析探讨其潜在的生物功能和通路与LUAD有关。在图的结果去分析4 (c)表明度显著相关的核分裂,有丝分裂的细胞基质粘附,细胞器分裂,有丝分裂姐妹染色单体分离,核分裂,调节细胞基质粘附,调节有丝分裂核分裂,微管细胞骨架组织参与有丝分裂,染色体分离,染色体隔离监管,姐妹染色单体分离,有丝分裂纺锤体组织,细胞外结构组织,泌尿生殖系统的发展,核监管部门依赖DNA的DNA复制和细胞连接装配,对于肿瘤的快速增长。此外,如图4 (b)集群,MCODE筛选出15包含所有调节5共同度中心基因(SHMT2 PYCR1, PSA T1、PC和LDHA)从Cytoscape软件,和发现SHMT2基因是位于特定的中心人物4 (b),这表明SHMT2起着重要的作用在调节细胞的行为。TISIDB的函数模型,我们验证了SHMT2参与甘氨酸的代谢,丝氨酸,苏氨酸,代谢途径,碳代谢、氨基酸的生物合成,提供关键依据蛋白质和核酸生产对肿瘤生长和转移。因此,我们相信SHMT2起着重要的作用在调节LUAD的增长。
(一)
(b)
(c)
3.3。高表达水平的SHMT2肿瘤
SHMT2表达水平的肿瘤和邻近的正常组织在Oncomine数据库验证。如图5 (d),SHMT2显示较高的表达水平在膀胱癌,乳腺癌、结肠直肠癌、肾癌,肺癌,和淋巴瘤,表达水平较低在肝癌和胰腺癌。我们也分析了mRNA-seq表达数据在肿瘤UALCAN数据库和计时器数据库(数据5(一个)和5 (c))。这些结果一致表明,SHMT2 LUAD显示明显高表达。此外,我们探讨了蛋白质的表达SHMT2 LUAD与正常组织之间UALCAN数据库(图5 (b))和免疫组织化学研究(包含IHC)在人类蛋白质图谱(HPA)(数据6(一)-6(f))。通过上面的分析,我们总结了蛋白质的表达SHMT2显著升高的肿瘤可能拥有不同的功能在不同的肿瘤,尤其是LUAD。
(一)
(b)
(c)
(d)
3.4。LUAD SHMT2的预后价值
我们计算曲线下的面积(AUC)接收机操作曲线(ROC)的评估预测规则的区别的能力。训练数据集和AUC得分为0.613(图7),表明更好的生存预测性能的训练数据集。kaplan meier对整体病人生存分析显示一个不利的影响。多变量分析和Cox比例风险回归模型发现SHMT2的表达是一个独立的预后指标LUAD患者数据8(一个)和8 (b))。
(一)
(b)
(一)
(b)
(c)
(d)
然后我们检查的预后价值SHMT2使用kaplan meier绘图仪和基因表达分析交互式分析(GEPIA)数据库。我们计算了考克斯/ log-rank价值和风险比为95%的间隔。我们将考克斯/ log-rank 作为阈值。患者分为两组基于SHMT2表达式在每个队列的平均水平。单变量分析的影响进行了评估SHMT2各种癌症存活率GEPIA和Kaplan-Mayer绘图仪数据库(数据8 (c)和8 (d))。结果表明,表达水平的SHMT2 LUAD对预后有显著影响。此外,低水平的SHMT2表示LUAD患者延长生存期。综上所述,这些结果表明,高表达的SHMT2 LUAD不良预后相关。
3.5。SHMT2免疫调节分子
GESA分析的结果基于数据集在图33表明GSE21933调节基因,GSE31210显然是与免疫细胞生物功能和SHMT2被证明为显著调节基因3个数据集,表明SHMT2可能与免疫调节。
为了探索SHMT2是否产生潜在的免疫渗透生物角色,我们进行了一次综合分析基于定时器数据库和TISIDB数据库,分析之间的联系SHMT2和免疫细胞浸润以及LUAD免疫细胞亚型的基因标记。结果在图3提出了高水平的SHMT2 mRNA表达与高免疫渗透LUAD有关。SHMT2 mRNA表达水平显著负相关水平浸润的免疫细胞、CD4 + T细胞( , ),巨噬细胞( , ),和树突细胞(dc) ( , )(图9)。此外,补充表1也证明了SHMT2 mRNA表达水平与免疫细胞有显著的相关性,tam, DCs, CD4 + T细胞,中性粒细胞,Th1、Th2,四氢呋喃,和T细胞在LUAD疲惫。
进行进一步的调查,我们发现SHMT2的表达与肿瘤浸润淋巴细胞(尖),包括激活1型辅助T细胞、自然杀伤细胞,T辅助滤泡细胞,激活B细胞、不成熟的B细胞,活跃的CD4 T细胞类型17辅助T细胞,Tem CD8细胞,CD56dim自然杀伤细胞(数字10 ()- - - - - -10(我))。特别是,上述细胞的价值都是小于0.001。整体而言,这些结果表明SHMT2及其相关基因是重要的免疫细胞浸润LUAD微环境,并可能产生更为显著的影响在LUAD的预后。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
4所示。讨论
糖酵解过程的一个重要分支和一个碳代谢的一个重要来源3),丝氨酸支持肿瘤细胞增殖至关重要(34]。SHMT必不可少的酶,催化丝氨酸对甘氨酸的转换,调节丝氨酸新陈代谢和一个碳代谢,提供蛋白质和核酸合成的重要前体对肿瘤生长和转移3]。SHMT2,一种SHMT基因发现了在人类基因组中,与各种肿瘤的预后相关(10]。据报道,SHMT2是丝氨酸和甘氨酸合成途径中的关键酶,催化丝氨酸的变换成甘氨酸在哺乳动物的线粒体12]。SHMT2可能作为一种预后因子,作为一个潜在的治疗目标为人类神经胶质瘤在临床实践13,35]。然而,目前还没有研究SHMT2和LUAD之间的关系。因此,它具有重要意义,分析在LUAD SHMT2所扮演的角色。
作为最常见的LUAD,密集的淋巴细胞浸润是LUAD最明显的特征之一,表明免疫系统发挥积极参与LUAD的发展和增长。在这项研究中,我们进行了筛选关键基因SHMT2通过差异分析,功能富集分析,TCGA生存分析基于地理数据库和数据库。接下来,我们使用了Oncomine数据库和计时器数据库比较SHMT2的表达水平在不同癌症和验证其在LUAD表达水平增加。单变量分析本研究进行了评估的影响SHMT2表情的存活率LUAD通过R软件和kaplan meier绘图仪数据库。的高表达水平SHMT2更重要的影响LUAD病人的预后。筛选肿瘤预后相关SHMT2后,SHMT2和免疫渗透水平之间的关系在不同的肿瘤研究的计时器数据库和TISIDB数据库。免疫细胞的渗透水平LUAD进行定时器数据库,显示SHMT2显然是在这癌症免疫相关过滤。
此外,多变量分析和Cox比例风险回归模型验证SHMT2可能LUAD患者的独立预后因子。SHMT2的表达水平与肿瘤浸润淋巴细胞显著负相关不成熟的B细胞、CD4 T细胞活跃,Th17, CD56dim自然杀手细胞(所有 ; )。此外,结果SHMT2和基因标记的免疫细胞之间的相关性表明,SHMT2密切相关,T细胞(CD8 + T细胞,Th1细胞,Th2细胞,四氢呋喃细胞,T细胞,和疲惫的T细胞),TAM, NK细胞和DCs(补充表1)。肿瘤浸润淋巴细胞(尖),包括T细胞和B细胞,免疫细胞的另一个重要的组成部分,展览antitumoral功能,尤其是CD8和CD4 T细胞。一些研究显示,Th1细胞与长期生存。SHMT2调节免疫渗透可能参与这些免疫细胞,特别是T细胞受体相互作用。上述分析表明,SHMT2可以作为一个潜在的患者总体预后标记生存,改善LUAD的生存和预后;SHMT2也可能发挥重要作用的微环境LUAD通过调节肿瘤免疫细胞的渗透。
根据已知的研究成果,目前的高表达SHMT2可以检测到不同类型的癌症,报道中扮演关键角色=迁移和入侵。敲门SHMT2在肝癌细胞系验证,减少了细胞生长和体外和体内致瘤性。基因集富集分析显示,SHMT2有很强的相关性与癌症入侵和可怜的乳腺癌患者的生存。SHMT2也报道,除了控制炎症细胞因子信号通过交互BRISC deubiquitylase(配音)及其重要的催化剂(36]。和SHMT2受损的T细胞生存在文化和体内抗原T细胞丰度(37]。总的来说,这些研究提供证据表明SHMT2参与不同的疾病通过免疫机制。
5。结论
在这项研究中,我们显示SHMT2作为一个独立的预后因子,发现其高表达是LUAD与不良预后相关。并进一步分析推测,SHMT2可能调解免疫细胞渗透LUAD通过调节巨噬细胞和T细胞的微环境。虽然有一些缺点在这项研究中,比如我们缺乏实验验证,我们也展示一些亮点,值得更多的关注。我们充分利用可用的公共网络数据集来验证我们的猜想。然而,进一步的探索和研究也需要研究的具体机制。我们希望本文可以为以下研究。
数据可用性
的数据支持本研究的发现可以从相应的作者在合理的请求。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
LX罗构思的想法;XL李、罗LX YS郑,ZP Lin XD,李和XL促成了收购,分析和解释数据。LX罗和y郑写的手稿;我李罗H、L崔和LX罗回顾了纸和提供评论,作者回顾了手稿。
确认
这个项目得到了广东医科大学博士启动基金(B2019016)、广东省中医药管理局(20201180)、广东省中医药管理局(20211223)、湛江科技专项项目(2019 a01009),广东省自然科学基金(2016 b030309002),广东省基础和应用基础研究项目(2019 a1515110201), GDNRC[2020] 038年,广东南部海洋科学与工程实验室的和基金(湛江)(zjw - 2019 - 007)。
补充材料
补充表1:SHMT2之间的相关分析和相关基因标记的免疫细胞。(补充材料)