文摘
背景。儿童哮喘是一种常见的慢性呼吸道疾病,严重影响孩子的健康和成长。生物信息学研究旨在识别潜在的RNA在当前候选人与儿童哮喘的发展密切相关的基因数据库。方法。GSE65204 GSE19187数据集筛选和从NCBI GEO数据库下载。差异表达长非编码rna (DE-lncRNAs)和mrna (DE-mRNAs)被确定使用Bioconductor limma包R,这些DE-mRNAs被用于执行生物过程(BP)和京都基因和基因组的百科全书(KEGG)分析。此后,加权基因coexpression网络分析(WGCNA)是利用筛选模块直接关系到儿童哮喘,和coexpression网络DE-lncRNAs DE-mRNAs建成。最后,主成分分析(PCA)。结果。总共7 DE-lncRNAs和1060 DE-mRNAs,以及7 DE-lncRNAs 1027 DE-mRNAs,分别确定GSE65204 GSE19187,。336年比较,之后重叠基因表达有相同的趋势,其中包括2重叠DE-lncRNAs和334 DE-mRNAs重叠。这些重叠DE-mRNAs浓缩在28日英国石油公司和12 KEGG通路。11模块得到GSE65204,发现紫色,黑色,黄色模块与哮喘发展显著正相关。随后,coexpression网络包括63 DE-mRNAs和2 DE-lncRNAs建成,和五个KEGG途径,包含8个基因,被认为是与儿童哮喘直接相关。主成分分析进一步验证这些结果。结论。LncRNAsLINC01559和SNHG8和mrnaVWF,LAMB3,LAMA4,CAV1,ALDH1A3,SMOX,GNG4,PPARG被确定为生物标志物与儿童哮喘的发展有关。
1。介绍
哮喘是最常见的一种慢性炎症性呼吸道疾病。它是由遗传、环境、生活方式因素和特征是炎症、气道高反应性和可变气流阻塞(1]。哮喘不仅影响成年人的健康和生命,而且还严重影响儿童的身心健康成长阶段。约有1/3到1/2的中度至重度哮喘患儿可能会持续到成年,也产生了沉重负担医疗系统(2]。据报道,流行,全球儿童哮喘的发病率和死亡率逐年增加(3]。与当前的上升趋势,儿童哮喘很可能成为日益严重的公共卫生问题。目前,糖皮质激素,ß受体激动剂、硫酸镁和抗胆碱能药物的主要药物用于治疗儿童哮喘(4]。然而,这些药物需要长期使用,可导致儿童的副作用和耐药性。此外,草药,包括甘草glabra(甘草),也被用作药物治疗呼吸系统疾病如哮喘(5]。然而,具体的治疗机制仍不清楚。尽管其患病率和全球影响,生理和病理机制儿童哮喘的发生和发展仍然是难以捉摸的。这动机研究及其搜索的新生物标志物对哮喘的诊断和治疗策略。
长非编码rna (lncRNAs)是一类非编码rna的长度大于200元,各种生物过程的监管机构,包括染色质结构的变化、转录激活/抑制,细胞内贩卖,微rna (microRNA)螯合和翻译效率监管6,7]。虽然lncRNAs可能扮演的角色在疾病发展尚未完全阐明,lncRNAs已报告参与癌症的发展由于其作为基因调节器。LncRNAs被认为是潜在的生物标记物对许多疾病,如肝细胞癌(8],黑色素瘤[9),和心血管疾病10]。一项研究由魏et al。11)表明,lncRNAMEG3是健康的组织毗邻胃癌组织中高度表达,其超表达可以抑制胃癌细胞的增殖和转移通过p53信号通路。曹et al。12)报道,lncRNARMRP显著调节在膀胱癌组织和肿瘤大小密切相关,淋巴结转移患者的生存时间。LncRNARMRP能促进增殖、迁移和入侵膀胱癌细胞株(12]。所有这些研究表明lncRNAs参与各种癌症的发生和发展。此外,Dolcino et al。13]分析了类风湿性关节炎(RA)患者的记录档案和健康的捐赠者,发现lncRNA rp11 - 4989.15在RA发病机理中起着重要的作用。另一项研究差异表达基因筛选八个重要交互lncRNAs 52富含asthma-associated途径,而这些lncRNAs有可能作为潜在生物标记物用于治疗的未来发展策略(14]。然而,特定的生物标志物对于儿童哮喘还没有被鉴定,和lncRNAs在儿童哮喘的作用尚不清楚。
加权基因coexpression网络分析(WGCNA)已经成功地用于识别高度相关的基因簇(coexpression模块)和识别潜在的生物标记物或治疗靶点与临床表型显著相关15,16]。赵和风扇17成功应用WGCNA和单变量Cox回归分析方法来确定五个lncRNAs (GAS5,HCP5,PART1,SNHG11,SNHG5)来预测卵巢癌的预后。因此,本研究旨在识别差异表达rna(各级)使用WGCNA儿童哮喘的发展密切相关。这些发现可能会提供新的诊断生物标记和治疗儿童哮喘的发展目标。
2。材料和方法
2.1。数据源
2020年11月5日,数据集符合以下标准筛选在NCBI GEO数据库(https://www.ncbi.nlm.nih.gov/)[18)与搜索关键字“哮喘、孩子,童年”和下面的搜索限制:(1)相同类型的样品(固体或血液或组织样本);(2)样品被归类为疾病和对照组;(3)分析中的样品的总数超过20个,每个类型都有至少两个重复样本。两组数据,GSE65204 [19]和GSE19187 [20.),筛选和下载。GSE65204包含69个样本从市中心10 - 12岁儿童的鼻腔上皮组织,其中包括33个健康样品和36哮喘样本。GSE19187由11健康样本和13岁儿童的哮喘样本6 - 17日y。用于样品的检测平台GSE65204和GSE19187安捷伦- 028004 SurePrint G3 GE 8 x60k微阵列和Affymetrix人类基因第1.0位数组,分别。
2.2。差异表达RNA (DER)屏幕
详细的注释信息的平台从运用基因组浏览器,下载96版本(https://asia.ensembl.org/index.html),包括注释文件、记录id和RefSeq id。的表达谱GSE65204和GSE19187 reannotated mrna和lncRNAs。
的Bioconductor limma包(3.34.0版本,https://bioconductor.org/packages/release/bioc/html/limma.html)在R 3.6.1[编译21)是用来确定各级的差异基因表达谱GSE65204 GSE19187数据集,包括差异表达mrna (DE-mRNAs)和差异表达lncRNAs (DE-lncRNAs)。各级阈值的选择是一个错误发现率(罗斯福)< 0.05和|日志2褶皱变化(FC) | > 0.5。各级之间通过比较单GSE65204 GSE19187,相同的微分表达式被选为各级重叠(重叠DE-lncRNAs和DE-mRNAs)与哮喘有关。这些筛选重叠DE-mRNAs用来执行生物过程的基因本体论(BP)和《京都议定书》全书的基因和基因组(KEGG)通路富集分析使用大卫版本6.8 (https://david.ncifcrf.gov/)[22]。一个值< 0.05是用作浓缩截止准则的意义。
2.3。屏幕WGCNA显著稳定的模块与哮喘相关的
WGCNA包(1.61版本,https://cran.r-project.org/web/packages/WGCNA/index.html在R(编译23)被用来屏幕明显稳定模块与哮喘有关。GSE65204包含相对大量的样本作为训练集,而GSE19187是作为验证集。参数设置如下:(1)≥100 rna被包含在一个模块;(2)cutHeight = 0.995。随后,重叠DE-mRNAs从WGCNA映射到每个模块,然后折叠浓缩参数pDE-mRNAs价值计算使用超几何算法(24]。 和折叠浓缩> 1担任模块滤波的阈值。超几何算法的公式 ,在哪里N表示所有的基因参与WGCNA分析,米表示基因在每个模块的数量,n表示数量的重叠DE-mRNAs,k代表的数量DE-mRNAs映射到相应的模块。
2.4。Coexpression网络建设
之间的皮尔逊相关系数(PCC) DE-mRNAs丰富的模块和重叠DE-lncRNAs从屏幕前面的微分表达式计算使用软木函数R (https://77.66.12.57/R-help/cor.test.html)。随后,coexpression网络构建,Cytoscape 3.6.1 (https://www.cytoscape.org/)用于可视化25]。之后,大卫工具是用来分析KEGG通路富集基因的coexpressed网络( )。
2.5。识别rna直接关系到哮喘和主成分分析(PCA)
“哮喘”作为关键字,比较Toxicogenomics数据库(2019更新)(https://ctd.mdibl.org/)[26)是利用直接搜索KEGG通路与哮喘有关。通过比较路径搜索那些coexpressed网络后,我们使用了重叠路径识别的重要基因直接关系到哮喘。
PCA降维技术,将多个变量转换成几个主成分,可以反映原始变量的大部分信息(27]。PCA进行这些标识与哮喘有关的基因项目使用人格心理2.1.6包版本(https://CRAN.R-project.org/package=psych)编制R。
3所示。结果
3.1。DE-lncRNAs和DE-mRNAs的识别
reannotation和处理后,135 lncRNAs和11808 mrna。后来,度正常样本和哮喘之间样本识别。总共有1067单(7 DE-lncRNAs和1060 DE-mRNAs)发现GSE65204和1034年各级(7 DE-lncRNAs和1027 DE-mRNAs)中发现GSE19187(图1(一))。通过比较这两个数据集之间的接单,535被发现(图重叠基因1 (b)),但是只有336个重叠基因相同的微分表达式,包括2重叠DE-lncRNAs (SNHG8和LINC01559)和334重叠DE-mRNAs。
(一)
(b)
(c)
(d)
3.2。重叠DE-mRNAs功能富集分析
这些334重叠DE-mRNAs用于BP和KEGG分析。发现这些DE-mRNAs富含28生物过程,如“-肽链内切酶活动的监管,”“氧化还原过程,”“表皮发展”“t细胞聚集有关,”“O-glycan处理,”“N-linked蛋白质糖基化通过天冬酰胺、”“谷胱甘肽衍生生物合成的过程,”“组织细胞外基质,”和“骨凝固”(图1 (c))。此外,这些重叠DE-mRNAs被浓缩进12 KEGG途径:“造血细胞谱系,”“矿物质的吸收,”“甲状腺激素合成、”“精氨酸和脯氨酸代谢,代谢途径,”“mucin-type O-glycan生物合成,”“吞噬体”,“补充凝血级联,”“内分泌和其他factor-regulated钙重吸收,”“组氨酸代谢,”“谷胱甘肽代谢,”和“胰岛素分泌”(图1 (d))。
3.3。被WGCNA显著稳定与哮喘有关的模块
WGCNA执行在所有各级GSE65204 GSE19187,使用GSE65204作为训练集和GSE19187作为验证集。确保基因表达水平在每个数据集是相似的,我们首先分析了表达水平和连接所有基因表达值的一致性检测到在这两个数据集。发现基因表达水平和网络连接训练集和验证集之间呈极显著的正相关关系,这说明,这两个数据集确实比较(图2(一个))。随后我们确认显著稳定与哮喘有关的模块的两个数据集。基于GSE65204,功率值是12,coexpression网络的平均度是1(图2 (b))。分层集群生成树被从数据集(包括11个模块从GSE65204)(图2 (c))。临床资料之间的相关性的热图样本和训练得到的每个模块设置显示在图2 (d)。结果表明,紫色,黑色,黄色模块与哮喘发展(图极显著的正相关关系2 (d))。
(一)
(b)
(c)
(d)
然后,模块的稳定性进行评估。通过分析,发现有6显著稳定与保护模块Z得分高于5(表1)。根据超几何算法,上述334重叠DE-mRNAs被映射到每个模块由WGCNA标识,和242重叠基因被发现。的两个模块(黑色和黄色)明显富集,14个黑色和58黄色DE-mRNAs发现一致。72年一致DE-mRNAs被用于进一步的研究。
3.4。建立Coexpression网络
ppc之间72年一致DE-mRNAs发现在前面分析和上述2重叠DE-lncRNAs计算。之间的连接对mrna和lncRNAs保留PCC > 0.4。随后,coexpression网络,其中包括2 DE-lncRNAs和63 DE-mRNAs,生成使用这些连接双(图3)。KEGG路径分析发现这些DE-mRNAs明显富集在五KEGG途径:“ECM-receptor互动,”“粘着斑”,“beta-alanine新陈代谢,”“PI3K-Akt信号通路,”和“癌症通路”(表2)。
总共有195 KEGG通路直接从数据库,供相关哮喘得到。后与coexpression DE-mRNA-enriched通路的网络,五个丰富KEGG通路(包含八个基因)被证明是与哮喘(表直接相关2)。很明显,血管性血友病因子(VWF)、层粘连蛋白β亚基3 (LAMB3)和层粘连蛋白亚基α4 (LAMA4)基因参与“ECM-receptor互动”,“粘着斑”,和“PI3K-Akt信号通路”LAMB3和LAMA4也参与了“癌症通路。“此外,caveolin-1 (CAV1参与“粘着斑”,醛脱氢酶1家人A3 (ALDH1A3)和精胺氧化酶(SMOX)与“beta-alanine代谢有关。“G蛋白亚基伽马4 (GNG4)“PI3K-Akt信号通路”和“相关通路在癌症。”此外,过氧物酶体proliferator-activated受体γ(PPARG)是参与“癌症通路。《coexpression网络发现lncRNALINC01559可能coexpressedVWF,LAMB3,CAV1,ALDH1A3,SMOX,GNG4。lncRNASNHG8可能coexpressVWF,LAMB3,LAMA4,ALDH1A3,SMOX,PPARG。这一分析表明,这些lncRNAs、mrna和通路可能与儿童哮喘的发展密切相关。
3.5。主成分分析
PCA进行五的八个基因与哮喘有关的通路。通过基因表达值的计算与分析GSE65204 GSE19187,总共八个主成分(pc)被拟合获得。其中,累积贡献率PC1、PC2,生物是超过80%,暗示这三个电脑因素包含重要的原始变量的信息(基因表达值)。此后,PC1、PC2和生物被用来构造样本分布的三维图和构建接受者操作特征(ROC)曲线。如数据所示4(一)和4 (b)、PC1 PC2,生物可以明显区分控制和哮喘样本。曲线下的面积(AUC) ROC曲线GSE65204和GSE19187 0.899和0.888,分别为(数字4 (c)和4 (d))。这些结果进一步证明VWF,LAMB3,LAMA4,CAV1,ALDH1A3,SMOX,GNG4,PPARG是与儿童哮喘的发生和发展密切相关。
(一)
(b)
(c)
(d)
4所示。讨论
儿童哮喘是一种常见的慢性呼吸道疾病,严重影响孩子的健康和成长28]。因为儿童哮喘的病因很复杂,其发病机制尚不清楚,未来的研究必须专注于探索潜在的诊断和治疗疾病进展的生物标志物。本研究确定了1067单(7 DE-lncRNAs和1060 DE-mRNAs)和1034单(7 DE-lncRNAs和1027 DE-mRNAs)在GSE65204 GSE19187数据集,分别。比较GSE65204和GSE19187之后,两个重叠DE-lncRNAs (SNHG8和LINC01559)和334重叠DE-mRNAs有相同的微分表达式。之后,明显稳定模块相关哮喘WGCNA薄层色谱法鉴别和coexpression网络建成2 DE-lncRNAs和63 DE-mRNAs。基因功能分析后coexpression网络,五KEGG途径(“ECM-receptor互动,”“粘着斑”,“beta-alanine新陈代谢,”“PI3K-Akt信号通路,”和“癌症通路”)包含8基因(VWF,LAMB3,LAMA4,CAV1,ALDH1A3,SMOX,GNG4,PPARG),是直接关系到儿童哮喘的发展和疾病进展有潜力用作生物标记。
以前的研究已经表明lncRNAs儿科呼吸道疾病的发展中起着重要作用,包括哮喘(29日,30.]。我们的研究发现lncRNAsSNHG8和LINC01559被发现与儿童哮喘的发展有关。SNHG8,位于4 q26,调节肿瘤发生和转移和控制多方面的疾病的进展,如肝细胞癌(31日),胰腺腺癌(32),子宫内膜癌(33),和胃癌34]。王等人表示LINC01559在胃癌组织和调节可以刺激PI3K-Akt信号通路促进胃癌的进展(35]。因此,我们推测lncRNAsSNHG8和LINC01559可能参与儿童哮喘的发生和发展通过调节细胞增殖,迁移和PI3K-Akt信号通路。
此外,从lncRNA-mRNA coexpression网络,LINC01559可能coexpressVWF,LAMB3,CAV1,ALDH1A3,SMOX,GNG4,SNHG8可能coexpressVWF,LAMB3,LAMA4,ALDH1A3,SMOX,PPARG在五KEGG途径,丰富,包括“ECM-receptor互动,”“粘着斑”,“beta-alanine新陈代谢,”“PI3K-Akt信号通路,”和“癌症通路。“主成分分析进一步证实这八在儿童哮喘基因是重要的。VWF大型等离子体糖蛋白,起着至关重要的作用在调节凝血和出血之间的平衡36]。一项由姚明et al。37)表明,VWFIL-25-induced小鼠哮喘模型中高度表达,与哮喘支气管粘膜血管重建。LAMB3和LAMA4属于层粘连蛋白亚基的家人和已报告参与某些类型的癌症的转移和入侵38,39]。张等人的研究。40)表明,LAMB3可以调节细胞凋亡、增殖、迁移和入侵胰腺导管腺癌的细胞通过PI3K / Akt信号通路。另一项研究发现,高表达LAMA4可能是一个新的标记在人类肝细胞癌肿瘤浸润和转移的41]。CAV1是一种致癌的膜蛋白与细胞外基质组织,细胞迁移,胆固醇分布、内吞作用和信号转导42]。在我们的研究中,CAV1参与焦点粘连,从而导致儿童哮喘的发病机制。GNG4是一个十四γ蛋白质亚基的G蛋白三聚物复杂(43,刘等人。44)发现,GNG4与PI3K-Akt相关信号通路参与直肠癌通过使用生物信息学方法。PPARG是三种亚型的过氧物酶体proliferator-activated受体,及其激活报道调节免疫调节细胞因子的合成和释放各种细胞类型(45]。先前的研究表明,PPARG调节炎症和可能影响控制哮喘的长期控制在儿童和年轻人46]。
此外,ALDH1A3和SMOX也对于儿童哮喘和浓缩在“beta-alanine代谢通路”。ALDH1A3是广泛分布在正常组织和在各种癌症中表达的异常47]。李等人。48)表明,ALDH1A3可以作为活化剂的间叶细胞分化和可能是一个标记为预测恶性胶质瘤患者的存活率。SMOX的聚胺氧化酶类,催化氧化降解的聚胺生产亚精胺和亚精胺是由各种各样的刺激,包括细菌感染和氧化应激(49]。耆那教等。50)发现的低表达SMOX在支气管哮喘肺上皮细胞(bec)的样品,和SMOX等天真的老鼠,降价导致哮喘气道高反应性,重建,BEC的细胞凋亡。结合我们的研究结果,我们推测lncRNAsLINC01559和SNHG8可能coexpressedVWF,LAMB3,LAMA4,CAV1,ALDH1A3,SMOX、GNG4和PPARG,这些lncRNAs和mrna可能直接生物标志物与儿童哮喘的发生和发展有关。然而,lncRNAs及其目标基因之间的关系需要进一步的特征,并使用这些标识lncRNAs mrna和生物标志物在临床环境需要进一步验证。
5。结论
总之,LINC01559和SNHG8可能coexpressedVWF,LAMB3,LAMA4,CAV1,ALDH1A3,SMOX,GNG4,PPARG。此外,这些lncRNAs和mrna可能直接参与儿童哮喘的发病机制通过ECM-receptor交互,粘着斑,beta-alanine新陈代谢,PI3K-Akt信号通路,在癌症通路。两个lncRNAs和八个基因可以解释潜力,小说,儿童哮喘病理和分子机制,可以作为候选人对该疾病的治疗策略。
数据可用性
使用的数据集和/或分析研究可从相应的作者在合理的请求。
信息披露
执行这项研究的一部分,作者的工作在各自的附属组织。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
敏浩和金陵Zan概念化和调查研究,提供了方法和表现形式分析。敏豪写的文章。金陵Zan编辑这篇文章并监督这项研究。