文摘

背景。强直性脊柱炎(AS)的发病机制仍不清楚,没有系统地探索和免疫相关基因的。本文的目的是确定潜在的大多数免疫有关的早期生物标志物和发展与生物信息学方法预测疾病风险模型和基因表达综合数据库(GEO)来提高诊断和治疗效率。方法。识别和创建一个基因的差异表达基因coexpression网络之间和健康的样本,我们下载相关数据集GSE25101和GSE73754 GEO数据库,并采用加权基因coexpression网络分析(WGCNA)。,我们使用了GSVA GSEABase limma ggpubr, reshape2包进免疫数据和调查免疫细胞和免疫功能之间的联系通过使用single-sample基因集富集分析(ssGSEA)。核心基因集的值和构造模型为早期诊断研究通过接受者操作特征(ROC)曲线分析。结果。生物功能和免疫得分分析确定核心基因与免疫有关,关键的免疫细胞,关键通路相关,基因模块,和coexpression网络。Granulysin (gn) Granulysin (GZMK) CX3CR1, IL2RB, dysferlin (DYSF)和S100A12可能参与开发通过NK细胞、CD8+T细胞,Th1细胞和其他免疫细胞和代表潜在生物标志物早期诊断的发生和发展。此外,T细胞coinhibitory途径可能参与发病。结论。疾病风险模型构建基于免疫相关基因可以指导临床诊断和治疗,可能有助于发展的个性化的免疫疗法。

1。介绍

强直性脊柱炎(AS)是一种免疫介导的慢性炎性关节病。大部分的症状包括损坏轴向骨头,骶髂关节和脊柱附件点,导致关节功能的受损,甚至残疾(1]。很容易引起炎症背部疼痛和传播脊柱和骶髂关节,这明显影响患者的生活质量,但早期诊断和治疗可以帮助延缓疾病进展(2]。目前的主要治疗药物包括非甾体类抗炎药(非甾体抗炎药),传统合成治疗风湿病的药物(DMARDs)和生物制剂。非甾体抗炎药是治疗的一线药物。然而,随着生物工程和基因工程的迅速发展,生物制品研究取得突破性进展。生物治疗,如肿瘤坏死因子-α(肿瘤坏死因子-α)抑制剂(TNFis)和IL-17A阻滞剂,通常利用在诊所和已被证明是有效的3]。肿瘤坏死因子抑制剂已经被证明是减少ESR和患者血清c反应蛋白的浓度活跃在一些试验。注射在疾病的早期阶段发展比注射后(可能更有利4]。然而,发病机理和生理和病理机制尚未彻底的研究,和缺乏准确和详细的对该病的早期诊断指标。因此,探索潜在早期诊断的生物标志物和发展这种疾病风险预测模型提供了一个新的战略的早期诊断和有效的预防和治疗。

高通量测序和微阵列分析人类疾病样本生成大量的科学数据在最近几年,已有用在理解相关的分子机制参与生物过程(5]。此外,高通量微阵列技术经常被用来探索和揭示疾病的诊断和预后有前途的生物标记在基因组水平(6]。许多研究表明,先天免疫系统中扮演关键角色的出现和发展,它可以激活一系列的免疫途径。此外,先天和innate-like免疫细胞,包括γδT细胞,组3先天淋巴细胞(ILC3s)和中性粒细胞,显示异常活动(7]。IL-17A IL-17A-producing T细胞是各种自身免疫性疾病的重要介质(8]。根据已发表的研究,大量的IL-17A和17 (Th17)辅助T细胞在血液和滑液的病人远高于那些在健康个体,而CD8+T细胞被发现在发炎的关节滑液的病人,和水平与疾病活动相关联9]。因此,有必要进行更全面的分析分子机制和潜在的免疫微环境,深化的理解。

这个项目的目标是识别有前途的早期诊断的生物标志物,建立预测疾病风险模型来提高诊断和治疗效率。本研究患者的基因表达谱分析在公共基因表达综合(GEO)数据库,并进行综合生物信息学分析来识别早期的分子变化和生物机制。Single-sample基因集富集分析(ssGSEA)被用来评估免疫细胞和免疫功能。的基因被发现是强烈表达筛选,及其与免疫细胞与免疫功能的关系。我们识别潜在生物标记最相关的免疫力在通过分析接受者操作特征(ROC)曲线下面积(AUC)。

2。材料和方法

2.1。数据采集和mRNA过滤

相关数据集GSE25101和选择GSE73754 GEO数据库(https://www.ncbi.nlm.nih.gov/geo)。这两个数据集是通过使用全基因组芯片技术,包括总RNA,包括遗传损伤的外周血样本。GSE25101生成使用GPL6947平台Illumina公司HumanHT-12 V3.0,并使用GPL10558平台生成GSE73754 Illumina公司HumanHT-12 beadchip V4.0表达式。GSE25101数据集由32个样本,代表16活动性疾病患者和性别和年龄组,而GSE25101数据集包含72个样本,代表52活动性疾病患者和20名健康对照组。自两个数据集完整的RNA的数据集,我们使用了一个算法来屏幕信使RNA基因进行后续分析。

2.2。差异分析

我们从基因中提取相关数据矩阵为原始mRNA表达谱数据集。微分表达式分析的样本数据集,采用R程序limma,将调整后的筛选标准 值(adj。 val) < 0.05

2.3。Coexpression分析

我们合并和预处理的两个数据集的程序叫affy R软件,包括执行背景校正、标准化,log2转换。“WGCNA”包被用来分析加权coexpressed基因在合并后和修正数据。

2.4。免疫的分数

Coexpressed基因被ssGSEA得分算法,免疫细胞和免疫功能也分别得分。我们使用ssGSEA,使用一个浓缩的分数来表示绝对每个样本的基因集富集程度由于某些数据集(10]。这可以用来计算一个标准化的浓缩得分为每个免疫类别。我们使用了GSVA [11,GSEABase limma、GGPUBr reshape2包进行免疫免疫数据的得分。R软件被用来画一个热图显示样本的相关性与免疫细胞和免疫功能。

2.5。相关分析的免疫细胞和免疫功能

我们评估了免疫细胞和免疫功能之间的关系通过使用上述免疫获得的分数。

2.6。不同的免疫分析分数

免疫的差异分数之间的正常组和疾病组与R软件进行了分析。

2.7。显著的相关性分析表达基因与免疫细胞和免疫功能

我们发现显著差异分析的基因表达基因的联合数据集和选择的日志FC值差异两个数据集的分析来选择几个基因表达更高的分数。R软件心理包被用于分析。之间的关系重要基因和免疫细胞或免疫功能。最相关的几个基因免疫筛选进行后续分析。

2.8。建设一个基因模型

从之前的步骤中,选择最相关的基因基因模型的建设根据免疫相关性的程度。Rms和ROCR包R软件被用于分析。首先,加权coexpression数据最相关基因的筛选,然后他们结合临床分组数据来确定相关的规模分高表达每个基因值和较低的表达式值。的AUC指数计算模型,和一个AUC回归图了。

3所示。结果

3.1。差异基因

基于差异分析合并和修正数据,4个差异表达基因(度)IL2RB dysferlin (DYSF) S100A12, NRGN被确定。IL2RB的表达下调,而DYSF和S100A12调节(研究的流程图如图1)。根据这两个数据集的差异分析研究,有36个和163个差异表达基因在GSE25101和GSE73754,分别,199个基因(图相结合2)。

3.2。基因的筛选

总共有9595个加权coexpressed基因筛选两个数据集的加权基因coexpression网络分析(WGCNA)。

3.3。免疫的分数

计算后,结合免疫测定的样本的得分,得分和免疫结果。一个热图是根据免疫的分数。我们发现CD8的水平+T细胞,中性粒细胞,tumour-infiltrating淋巴细胞(尖),细胞因子活性,HLA,晋升,炎症类MHC I, I型干扰素反应高我们的样品(图3)。

3.4。相关分析的免疫细胞和免疫功能

通过相关分析,我们发现,在免疫细胞,B细胞和T滤泡之间存在正相关性辅助(Tfh)细胞( )和CD8之间+T细胞和尖( )和中性粒细胞和尖之间的负相关性( )和中性粒细胞和辅助T 1之间(Th1)细胞( )(图4(一))。相关分析表明,免疫功能有积极的I型干扰素反应之间的相关性和parainflammation ( ),促进炎症和细胞溶解的活动( ),T细胞之间coinhibition和溶细胞的活动( ),和T细胞之间coinhibition和检查点( )。炎症促进和CCR之间也有负相关性( )和T细胞之间的聚集有关和parainflammation ( )(图4 (b))。

3.5。不同的免疫分析分数

在免疫细胞分数的差异分析,有显著差异激活树突状细胞(adc), CD8+T细胞,树突状细胞(dc),肥大细胞,中性粒细胞,自然杀伤(NK)细胞,Th1细胞,T辅助2 (Th2)细胞,尖之间的疾病组和正常组(图5(一个))。得分差异分析的免疫功能,在检查站有显著差异,溶细胞的活动,促进炎症和T细胞之间coinhibition疾病组和正常组(图5 (b))。

3.6。显著的相关性分析表达基因与免疫细胞和免疫功能

根据筛选标准,我们检查以下度:neurogranin (NRGN) MYOM2, granulysin (gn) granzyme K (GZMK) COMMD6, GNG11, CX3CR1, AAK1, IL2RB, dysferlin (DYSF)和S100A12。我们发现Th1细胞之间有着很强的相关性,NK细胞、T细胞coinhibition和上述基因(图6)。

3.7。建设的基因模型

我们选择最高的6个基因相关性由免疫测定,gn, GZMK, CX3CR1, IL2RB, DYSF S100A12,构建基因模型。根据加权coexpression数据最相关的基因和结合临床分组信息,我们构建了一个基于免疫测定基因预测模型相关性(图7)。ROC曲线分析( )模型(图证明了它有前途的预测价值8)。此外,校准图表是评价模型(图9)。

4所示。讨论

作为一种慢性和进步的关节炎,通常发生在45岁之前的人,导致身体功能有限,工作效率明显下降,对生活质量造成严重的负面影响,不良心理和生理效应(12]。以前的生物信息学研究发现CD8有显著差异+T细胞CD4细胞+T细胞和其他免疫细胞之间的患者和健康对照组和这些变化息息相关的发病和进展(13]。IL-17是唯一3型免疫细胞因子,已成功作为目标(14,大量的临床试验数据证明,secukinumab, IL-17特定单克隆抗体,可以有相同的效果,肿瘤坏死因子抑制剂治疗的患者(15]。这些调查表明,免疫系统和免疫细胞的发病机制中扮演关键角色,尽管额外的分子靶点和潜在的几种机制仍然未知。我们认为,免疫相关基因可能调节的发病和发展发挥了关键作用。因此,需要更多的研究在这个领域。

在这项研究中,与健康对照组相比,我们确定了四度从两个数据集,WGCNA用于基因筛查。我们评估coexpression基因、免疫细胞和免疫功能使用ssGSEA,这是用来演示样本的关联与免疫细胞和免疫功能。然后,免疫分数的基础上,我们分析了免疫细胞和免疫功能之间的相关性和使用R软件分析重要基因的相关性免疫细胞和免疫功能。最后,六个关键免疫相关基因,gn, GZMK, CX3CR1, IL2RB, DYSF,和S100A12筛选构建预测模型基于免疫测定基因的相关性。的敏感性和特异性基因的诊断模型的研究使用ROC曲线分析。此外,标定图用于内部验证。基因测试的结果显示,本研究有可能被雇佣的有前途的生物标志物早期诊断和治疗的基因表达水平可以预测的发生。

通过许多筛选过程,如差异分析,免疫得分,和相关分析,我们选择了gn, GZMK, CX3CR1, IL2RB, DYSF, S100A12关键基因。ROC曲线分析和标定地图评估显示,这些基因可能是最相关的早期诊断标记物的免疫。而IL2RB和S100A12已报告在文献中相关的发病机制,其他基因的关系没有明确报道。因此,这个模型代表一个新发现。gn属于AMP细胞溶解产物和促炎肽家族。这种肽存在于T细胞和NK细胞的颗粒,并生成granzyme和由这些细胞穿孔素(16]。gn作为内源性危险信号在炎症条件下,招聘和激活白细胞,包括抗原呈递细胞(apc),通过toll样受体4 (TLR4),促进抗原免疫反应(17]。一些研究表明,银屑病关节炎的gn加速恶化,其apoptosis-related机制介导关节病变的发展(18]。GZMK是颗粒分泌酶属于丝氨酸蛋白酶家族。大量实验数据表明,GZMK细胞毒性,可能促进释放促炎细胞因子(19]。Mogilenko et al。20.发现GZMK-expressing CD8+T细胞存在于老鼠细胞作为一个独特的子集在老龄化的影响环境和促进炎症因子表达增加GZMK的分泌物,它强调GZMK+CD8+T细胞和GZMK潜在目标治疗年龄相关性免疫系统紊乱。在最近的生物信息学研究,GZMK被确认为一个潜在的标志类风湿性关节炎(RA)的早期诊断和分析表明,GZMK可能引发连续在RA炎症扩张(21]。CX3CR1是单核细胞的趋化因子受体表达和单核细胞粘附和迁移的关键调节器22]。M2表型鉴定的子集或者激活单核细胞/巨噬细胞和M2-like单核细胞可以被定义为CX3CR1+CD163+/ CD206+细胞(23,24]。赵et al。25]发现M2表型的主要表型在当地组织和外周血单核细胞/巨噬细胞的患者与先进,进一步证实,先进的病理组织修复和组织改造的特点。一些研究表明,患者,CX3CR1+单核细胞有一个特定的促炎的转录组,积极参与ILC3s的激活和扩展,从而促进持久的促炎的状态(26]。signalling-related IL2RB基因是细胞因子基因(27)编码的受体白介素2(2)和与自身免疫和炎性疾病28]。一项研究发现,一个IL2RB多态性(rs2281089)显著降低患风湿性关节炎的风险28]。10年的患者随访研究发现,14个单核苷酸多态性(snp)在10个不同的基因分布在与外周关节炎患者显著相关(PA)和IL2RB是10基因(29日]。DYSF是II型跨膜糖蛋白ferlin家庭。DYSF表达的失调密切相关,许多遗传性肌肉疾病和自身免疫性疾病30.,31日]。肖等人报道,DYSF至关重要的疾病进展皮肌炎(DM)和多发性肌炎(PM),两个子组的特发性炎性肌病(IIM)。调节表达DYSF,连同HLA-An MCP-1,发现起着至关重要的作用在炎症细胞浸润和肌肉损伤(31日]。S100A12 S100蛋白家族中的一员,具有独特的促炎的活动和显著表达多种炎性肌病(32]。最近,S100A12报道是等离子体中表达显著的布劳综合症患者(b,显性遗传性autoinflammatory疾病),活动关节的数量与S100A12的数量密切相关,和S100A12被发现的生物标志物联合BS患者的疾病活动(33]。在法国开展多中心前瞻性群组研究发现S100A12表达水平的变化在RA患者的临床治疗效果的一个很好的指标TNFis RA和创建了一个多元模型准确地预测RA病人反应TNFis个性化治疗,可以用在日常实践(34]。CX3CR1,总之,gn, GZMK IL2RB, DYSF, S100A12,这对包含在我们的模型中,我们选择与自身免疫和炎症性疾病密切相关,尤其是在关节炎症的调控。

为患者的早期诊断和治疗,关键是监控和恢复免疫系统的功能。先天免疫细胞,NK细胞,一种是大颗粒淋巴细胞分化从常见的淋巴祖细胞(35]。NK细胞的细胞毒性,可以释放大量的细胞因子,导致免疫反应调制(35]。越来越多的证据表明,NK细胞的发病机制和疾病发展中扮演很重要的角色。Kucuksezer等人总结大量的研究(35)报道,HLA-B27 ERAP-1,吉珥和其他相关基因可能影响NK细胞的功能和一些NK细胞功能的变化可以用来预测患者对治疗的反应。一项研究表明,肿瘤坏死因子-α由自体单核细胞分泌增强循环CD56bright NK细胞的患者,这可能导致持续入侵免疫过程,导致异常的炎症(36]。娇等人研究了基因多态性在NK细胞受体,发现由于HLA-B27遗传因素相关,吉珥的变化及其相应的具体HLA-C配体可能会妨碍NK细胞的作用在识别和消除目标免疫反应,从而促进发展的37]。CD8+T细胞扮演着一个关键角色,消除细胞内感染和恶性肿瘤细胞(38]。它可以提供长期保护性免疫和密切相关的免疫系统疾病,如类风湿性关节炎的发病机制(38,39]。汉森等人发现,刺激后的外周血单核细胞的患者体外受体CD8的特征+T细胞发生了变化,巴尔病毒和巨细胞病毒的具体克隆显著扩大。这种动态变化的边缘作为病人的T细胞的反应表明,自适应免疫紊乱可能是疾病的病理特征之一(40]。Gracey等人发现CD8的绝对数量的减少+作为患者的T细胞导致损失的细胞毒性细胞的基因表达,还发现CD8+T细胞优先聚集在关节炎症的患者(41]。溶细胞的活性是一个重要的细胞发展的过程。免疫监测和溶细胞的活动对转换或感染细胞可能受益于CD8之间的串扰+T细胞和NK细胞,可以在不同阶段的招募免疫控制。NK细胞、CD8+T细胞密切接触诱导特定的细胞溶解(42]。Th1细胞扮演主导的角色在帮助宿主防御细胞内病原体和也参与某些自身免疫性疾病的发展。Th1 T细胞谱系的过度刺激可能会导致大量的促炎细胞因子的生产,导致了慢性炎症状态(43]。王等人发现,Th1 / Th2细胞比例显著增加患者的是,这种不平衡导致的mRNA和蛋白表达增加免疫介质(44]。温等人进行临床实验(45),发现il - 4和il - 10的水平在患者的血清活性明显降低,而肿瘤坏死因子的水平α和干扰素-γ增加,这表明一个失衡Th1 / Th2细胞可能参与的发病机制。的变化在外周血Th1、Th2细胞因子的表达的患者可以反映这种疾病的活动。总之,改变NK细胞的数量和活动的进展和Th1细胞是重要的。他们可以反映疾病进展和活动,并有可能进一步治疗和预后的预测价值。

制衡的一个复杂的网络,包括costimulatory和coinhibitory通路调节T细胞的活化作用和功能,调节免疫反应(46]。Costimulatory和coinhibitory受体及其配体、形状和从根本上调节免疫反应。聚集有关,coinhibition调节T细胞的功能,以及它们之间的失衡会导致公差分解,导致自身免疫性疾病(47,48]。免疫球蛋白超科(Ig-SF)和肿瘤坏死因子受体超家族(TNFR-SF)包含大多数costimulatory和coinhibitory分子。家庭是必不可少的T细胞受体调节和控制T细胞在动态和顺序49]。合成许多研究的结果后,西蒙斯等人得出的结论是,coinhibition似乎平衡T细胞激活的关键,保护宽容,和诱导免疫内稳态。加上costimulatory通路,coinhibitory通路是T细胞在免疫反应失败的一个重要中介感染或肿瘤(50]。张和Vignali认为coinhibitory通路中的一个缺陷也与RA易感和进展并提出了coinhibition固有的缺陷可能会导致系统性宽容在RA的损失47]。在我们的研究中,我们发现,T细胞coinhibition密切相关的基因选择包含在我们的模型和大多数免疫功能有关。

5。结论

总结上面的结论,基于高通量地理数据集,我们获得了基因gn, GZMK, CX3CR1, IL2RB, DYSF, S100A12大多数免疫相关的基因和确认他们是早期诊断的潜在生物标志物与综合生物信息学分析的帮助。这些基因可能影响通过免疫细胞、NK细胞、CD8等+T细胞,和Th1细胞,我们发现,T细胞coinhibitory通路可能是一个潜在的发病机制的重要组成部分。此外,我们构造了一个疾病风险模型组成的首次免疫相关基因和评估潜在的这些基因的表达来预测的风险。我们的结论是,监控gn的表达,GZMK, CX3CR1, IL2RB, DYSF, S100A12体内可能有良好的早期诊断的潜力。

我们旨在寻找生物标志物,了解更多关于免疫细胞和免疫功能的角色,和开发一个基于免疫相关疾病风险模型早期检测的基因。我们的研究也有一些局限性。首先,由于样本量较小的数据和数据内容的限制,我们无法进行外部数据集验证。此外,当我们建立了模型,我们不能把额外的因素,比如年龄和性别,一个更详细的小组讨论。第二,引发的免疫反应基因的确切机制用于构造模型需要进一步研究。最后,还有缺乏临床数据和实验来验证基因表达的水平和对疾病的影响。

数据可用性

在这项研究中提出的数据集可以在在线存储库中找到https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE73754https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE25101

的利益冲突

作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。

作者的贡献

工作组负责设计、数据管理、形式分析、调查、方法,和写作。RH, YC, XW导致了概念化,监督,平面设计,手稿编辑。WH,詹和肯塔基州提供实质性的贡献,数据管理,正式的分析,和手稿编辑。YH负责监督、方法和资源监督。所有作者已阅读及同意发布版本的手稿。

确认

这项研究由山东省自然科学基金资助项目(ZR2022MH096和ZR2021MH254)。我们感激地承认国家生物技术信息中心(NCBI,美国国家卫生研究院)的免费的地理数据库资源。我们还要感谢托马斯et al。(GSE25101)和Gracey et al . (GSE73754)无私地分享他们的数据集。