文摘
背景。新生儿败血症(NS)被认为是新生儿死亡的最常见原因,新生儿患。尽管许多研究关注NS基因生物标记,基因生物标记的预测价值很低。NS发病机理仍需要调查。方法。数据预处理后,我们使用KEGG浓缩方法识别NS和正常对照组之间的差异表达途径。然后,功能采用主成分分析(FPCA)计算在NS基因值。为了进一步研究的关键信号通路NS, Mann-Whitney elastic-net回归模型U测试和coexpression网络被用来估计的重量信号通路和基因中心。结果。总共有115 NS之间不同的路径和控制被首次发现。FPCA充分利用时间序列基因表达信息和估计基因在不同通路的价值观。前1000个基因被认为是不同的基因,并进一步分析了elastic-net回归和MWU测试。有7个关键信号通路之间的NS和控制,根据不同的来源。在这些基因参与关键通路7中心基因,PIK3CA, TGFBR2, CDKN1B,喀斯特,E2F3, TRAF6,路段,确定基于coexpression网络。他们中的大多数是癌症相关基因。PIK3CA被认为是常见的标志,这是淋巴细胞组织中高度表达。是知之甚少的相关性与NS PIK3CA,给了我们一个新的启蒙NS研究。结论。这项研究可能提供角度信息探索小说的潜在基因和通路NS治疗目标。
1。介绍
新生儿败血症是新生儿的死亡的最常见原因肯定很少有报道生物标志物很多年了。至少每年35%新生儿死亡是由感染引起的。新生儿通常患有早发性NS,发生在出生后的第一个72小时(1,2]。根据最近的报告,脓毒症的诊断是由非特异性和谦卑的高度可变人类炎症和抗炎过程(3]。导致新生儿死亡的主要危险因素是感染,包括呼吸道感染、耐药感染,新生儿破伤风(4]。为了管理感染,研究开发初级和二级预防策略基于不同类型的感染已经热场NS研究近几十年(5,6]。未来的医学研究应该基于NS减少抗生素的应用和持续时间。针对NS的治疗引起的副作用,重要的是要使用正确的实践标准的部门的弱势群体。目前易感人群的分类标准是至关重要的未来的研究和改善新生儿管理策略的发展。Medzhitov等人发现toll样受体2和toll样receptor-4参与细菌在新生儿的识别过程7]。感染性新生儿重大upregulation明显下降的几个基因,而参与先天免疫(8,9]。脓毒症的新生儿先天免疫反应是由先天免疫基因(IL1R2、ILRN SOCS3) (10]。目前研究还调查了细胞因子之间的关系模式和NS和证明,促炎细胞因子的表达增加,如tnf、il - 6、il - 10,与NS的急性和急性阶段,分别为(11]。
尽管大量研究NS发病机理基于基因,有价值的预测仍公布,导致研究的一个重大挑战NS。基因转录组谱可以用来识别在复杂疾病的诊断和预后相关基因表达和揭示NS的发病机制9,10]。建造了几个系统生物学方法来解剖脓毒症的生理机制。特别是,发现方法的上下文相关的激活途径(12,13)合并。然而,对于时间进程的研究,它将很难做临床试验如果选择的基因的作用不是特定于感兴趣的生物过程。换句话说,一个暂时差异表达基因应该显示一个重要时间点非常数的表达模式。为了解决这个问题,需要加权方法进行评估给定基因功能之间的相似性和不同时间点的集14]。
在这个报告中,一个方法基于功能的主成分分析(FPCA)提出了发现任意时间进程非常数的趋势数据分析(15]。估计基因的影响后,一个elastic-net回归模型被用来分析基因的权重。此外,一个广义Mann-WhitneyU(MWU)测试也申请基因集合级别的推论。最后,中心基因由coexpression网络的拓扑特性(16]。利用提出的分析方法、感染途径和关键基因将被揭示。他们将促进未来NS的调查。
2。方法
2.1。招聘和数据预处理
人类外周血细胞的基因表达谱在不同时间点的样品脑膜炎球菌败血症都需要在基因表达综合数据库的数据加入。GSE11755,包括NS患者和正常对照组。这些数据集上处理Affymetrix人类基因组U133 + 2.0数组平台。完全,四十一样本,在4个时间点(t= 0,t= 8,t= 24,t= 72 h后进入儿科重症监护室)进行了研究,基因也确定了关键路径和中心。接下来,基于RNA的芯片、基因表达式从全血分离,淋巴细胞和单核细胞也进行了分析,分别。根据不同来源的微阵列数据,我们采用不同的组:第一,我们命名的所有来源,包含所有的41个样本(10控制和31名患者)。第二,我们叫血源,包含微阵列数据来源于血液(3控制和8例)。第三,我们叫淋巴细胞来源,包含微阵列数据来源于淋巴细胞(4控制和12例)。第四,我们命名为单核细胞来源,包含微阵列数据来源于单核细胞(3控制和11个病人)。在以下的分析中,我们进行了四个平行分析基于不同群体。这项研究是由当地医学伦理委员会批准。
数据预处理,免费R平台(http://cran.r-project.org/)应用。GraphPad Prism 7.0软件被用来创建图像。的数据集和数据预处理开始读取数据的标准方法由Affy执行。基因的表达规范化使用健壮multiarray平均(RMA)方法,以消除非特异性杂交的影响(17]。然后,基因被quartile-based进一步过滤算法(18]。总共有15144个基因为每个主题报道。
2.2。通路富集分析
路径分析是用于查找NS的重要途径和控制组织根据《京都议定书》全书的基因和基因组(KEGG) [19]。确切概率法采用选择的重要途径,和阈值的意义被罗斯福和定义价值。重要途径提取的阈值和交叉基因数> 1。
2.3。一个能够汇总统计功能的主成分分析
在目前的研究中,FPCA模型被用来确定暂时差异表达基因(20.]。获得的基因表达谱被认为分散成员从基因表达的真实形象。和真正的概要文件将被进一步干扰噪声信号。减去后的平均价值的基因表达,FPCA用于中心所有的基因值。预处理的基因表达谱数据加权根据相应的意思表达和FPCA分数在所有基因表达值。
观察到使用FPCA模型表达式如下: 在哪里是时间样本的平均表达,是本征函数,是FPC的量化值多少钱可以解释为 。
当它应用于基因表达时间进程,我们使用功能统计总结每个基因的基因模式信息的时间点: 在哪里残差平方和的零假设和残差平方和的替代假说。可以被视为一个“信噪比”比和揭示基因的重要性。
2.4。估算的重量信号通路使用Elastic-Net回归模型
在这项研究中,我们还带着一种方法计算效率和高度灵活的方法的基础上,一个等价的影响之间的罚函数回归和一个标准的多元回归,为了最小化优化问题,这被称为功能elastic-net回归问题(14]。这个问题是因为函数线性回归模型选择方法的不必要的并发函数回归模型。
模型的主要功能如下: 在哪里惩罚系数和吗的向量组线性系数。当的权重计算和估计,然后途径可以获得的
类似的方法可以用来估计基因的权重。
2.5。加权Mann-WhitneyU(MWU)测试使用基因集富集与相关性分析(GSEA)
MWU测试是用来比较两个独立样本。鉴于两个样品被完全相同的组,平均是不同的。MWU测试的目的是分析是否存在显著差异的两组。最近的报告表明,MWU基因集富集分析测试中扮演了重要的角色(GSEA) [21,22]。通路富集分析进行了基于全基因组背景和应用于识别的重要生物功能的集群。KEGG通路富集也执行。类别有超过5基因了,值< 0.01被认为是重要的通路富集分析(23]。
2.6。基于Coexpression中心基因网络的识别
邻接矩阵是首先构建基于intergenomic关系评价斯皮尔曼相关系数(24]。拓扑特性进一步研究发现网络中的关键节点。基因的程度大于平均度值和斯皮尔曼相关系数大于0.6的基因被认为是中心。
3所示。结果
3.1。通路富集分析
基因表达谱的人类NS系列GSE11755从基因表达综合下载。预处理后的表达谱数据的数据集,我们从共有41个样本收集的数据,包括与脑膜炎球菌败血症六个孩子。血液是在四个时间点和匹配控制。通路富集分析NS和控制的基础上进行了KEGG数据库路径。共有286个途径覆盖6893个基因。Fisher精确检验后,115年微分途径覆盖3532个基因相遇的阈值和交叉基因数> 1。表1显示前6微分信号通路以升序排序的基础上价值。
3.2。综合分析的基因签名使用FPCA模型
在目前的研究中,FPCA模型被用来确定暂时差异表达基因,每个基因都得到一个价值。根据115年微分途径(包括3532个基因),我们确定了前1000基因签名使用FPCA NS模型,定义为特异表达基因。FPCA缩小了搜索范围从3532年到1000年的基因。更大的值意味着很大程度上与他人不同的表达水平。数据1(一)- - - - - -1 (d)显示曲线的基因签名价值。特异表达的基因当中,前12个来自所有来源的基因,血源,淋巴细胞来源,和单核细胞源CDC37, NCOA2, P2RY12, RXRB基因,EDEM2, ACTN4, STX12, PPM1A, PRKACB, DUSP10 VEGFA, SLC44A2。自从NS主要是由感染引起的,在NS基因特异表达应该免疫反应相关。然而,有一些免疫相关的基因列表中。激活细胞因子在一个特定的感染可能不是来自所有可以激活这些基因的调节基因。因此,重要的是要找到NS的通路被激活的感染。FPCA可以有效利用时间序列信息,克服了传统控制设计缺陷(14]。可用于MWU测试值。
(一)
(b)
(c)
(d)
3.3。估计使用Elastic-Net回归模型权重的基因
基因存在于多种途径被认为是重叠的基因。这些基因被认为扮演多个角色在假设检验中,权重系数被高估了。在目前的研究中,elastic-net回归模型被用来分解之间的重叠基因基因集和消除重叠效应。后计算每个基因的重量值和增加的体重值通路基因,通路的总重量值。图2显示每个通路的重量之和。重量值()的每个基因可用于MWU测试。
(一)
(b)
(c)
(d)
3.4。功能富集分析使用GSEA和MWU模型试验
基于KEGG通路富集,115微分途径获得。为了更准确地找到关键通路和分子,FPCA elastic-net回归进行消除重叠基因的影响。结合MWU测试、关键分子途径NS基因转录数据的确定和控制。基于t以及,通路在降序排名。通路后MWU测试的数据模型,总共7途径满足条件值< 0.05。没有途径会见了单核细胞群的条件。由此产生的途径提出了表2。
根据MWU测试中,有7通路筛选的基础上值< 0.05。我们选择前三重要途径:hsa05220:慢性骨髓性白血病;hsa04380:破骨细胞分化;和hsa05222:小细胞肺癌进行进一步分析。此外,途径包括促炎细胞因子基因也研究,如hsa05164:甲型流感(TNF、il - 6、地震和IFNA1;值0.3256);hsa04620: toll样受体信号通路(TNF、il - 6和IFNA1;值0.2185);hsa05168:单纯疱疹感染(TNF、il - 6、IFNA1 IL-15;值0.4868)。不幸的是,MWU试验表明,控制和患者之间没有差别的促炎细胞因子包括通路。获得前三通路中的基因,人物3(一个)表明hsa05220的表情变化:慢性骨髓性白血病所有来源是不明显的。的水平hsa05120:上皮细胞信号幽门螺杆菌感染血源进入儿科重症监护室后明显高于控制。此外,hsa05222的水平:小细胞肺癌淋巴细胞来源是在72 h后进入儿科重症监护室。
(一)
(b)
(c)
3.5。识别和评估权重的中心途径中的基因
网络提供有效的模型来研究复杂的生物系统,如基因和蛋白质相互作用网络。使用邻接矩阵加权coexpression基因网络构建基于超人系数。我们进一步研究了拓扑特性来发现网络中的关键节点。基因的程度大于平均度值作为中心的基因。基于7的三个网络从所有来源途径,血源,淋巴细胞来源,我们绘制一个维恩图。图4表明这三集的交集只包含一个基因,PIK3CA。我们定义PIK3CA NS的共同标志。所有来源的交集和血液来源有两个基因,也就是说,PIK3CA TGFBR2。总共4基因(PIK3CA, CDKN1B,喀斯特,E2F3)存在于所有源和淋巴细胞源集,同时进行。有3基因共享血液来源和淋巴细胞来源:PIK3CA, TRAF6和路段。
3.6。基因表达水平的中心和常见的炎症性因素
在分析基于7通路网络的拓扑特性,7基因被认为是上述中心的基因。为了研究中心的相关基因和NS, PIK3CA的表达水平,TGFBR2, CDKN1B,喀斯特,E2F3 TRAF6,柷进一步分析。我们都知道,NS主要是由感染引起的,促炎基因的水平也观察到,如肿瘤坏死因子-α(TNF -α)、白介素2(- 2)、白细胞介素- 6 (il - 6)、白介素- 7 (IL-7)、白细胞介素- 10”(il - 10)和干扰素alpha - (IFNA1)。此外,我们检查了管家基因的表达GAPDH和β-连环蛋白(这里没有显示)针对客观地反映出中心基因的变化。图5显示了这些基因的表达水平在Box-whisker阴谋。我们可以很容易发现PIK3CA水平从常见的血型儿科重症监护室的病人入院后没有明显的变化与控制相比,虽然表情PIK3CA淋巴细胞来源的显著下降。据报道,NS主要是由于感染;然而,没有明显区别控制和患者免疫与响应相关的基因表达水平(数字5 (d)- - - - - -5(我))。CDKN1B的表情,喀斯特,E2F3 TRAF6,柷没有显示在这里。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
(j)
(k)
(左)
(m)
(n)
(o)
4所示。讨论
近年来,许多新的数学模型方法如高维微分方程(25,26),动态贝叶斯网络(27,28],格兰杰的模型(29日被广泛应用于分子生物学和生物信息学。据报道,早期基因表达变化的潜在疾病或感染可以通过数学模型计算。低et al。27,28)用于分析时序基因表达的变化之间的因果关系在许多时间点。时序基因表达实验是越来越受欢迎。该方法在研究翻译和基因调控中发挥着重要作用。我们提供一个灵活的方法来检测各个科目的常见的表达模式。Elastic-net回归模型结合MWU测试被用于这项研究。根据这种方法,个人基因和基因变化,引起感染的一个科目的方式,将检测到的。
在经典的MWU测试中,每个变量是独立的,它们之间没有关系。然而,基因是相互关联的,特别是在相关的信号通路。因此,我们必须做出一些修改经典MWU测试,可用于容纳与基因相关。在我们的方法中,我们假设相对信号通路中的基因共享一个共同的两两相关问和无关紧要的基因保持独立。在当前的研究中基于KEGG浓缩的基因签名,结果表明,在几个KEGG途径,排名前三的重要途径是hsa05220:慢性粒细胞白血病,hsa04380:破骨细胞分化、和hsa05222:分别为小细胞肺癌。此外,途径包括促炎细胞因子基因也研究,如hsa05164:甲型流感,hsa04620: toll样受体信号通路,和hsa05168:单纯疱疹感染。不幸的是,MWU试验表明,控制和共同组之间没有差别的促炎细胞因子包括通路。为了确定中心基因,根据coexpression网络的拓扑特性,PIK3CA被定义为NS的共同标志。TGFBR2, CDKN1B,喀斯特,E2F3 TRAF6,柷也被选为我们的目标分子。
PIK3CA致癌基因,编码p110类我磷脂酰肌醇的催化亚基3-kinases (pi3k),即PI3Kp110a。大约4/5的PIK3CA基因突变发生在两个热点,第9外显子,外显子20。其突变不仅可以减少细胞的凋亡,但也可以促进肿瘤的浸润和增加下游激酶pi3k的活动30.]。在生理条件下,PIK3CA表达于大脑、肺、乳腺、胃肠道、子宫颈,和其他组织和许多重要的生理功能调节等体细胞增殖,分化和生存。PIK3CA通常是不活跃的,通常不容易发现。然而,PIK3CA过表达后突变,这可能增加pi3k的催化活性,促进细胞癌变组织。PIK3CA基因突变已成为许多肿瘤的分子生物标志物(31日- - - - - -34]。PI3K-Akt-mTOR信号与细胞增殖和生存之间的平衡中起着重要作用不仅在肿瘤的生长,而且在癌症治疗的潜在反应,如渥曼青霉素和LY294002 [35,36]。不幸的是,似乎没有直接相关性PIK3CA在现有文献和NS。
TGFBR2、转化生长因子β受体二世是一个肿瘤抑制基因。编码的蛋白是一种跨膜蛋白,蛋白激酶结构域,形成heterodimeric复杂的与另一个受体蛋白质,结合及护。杂合的突变TGFBR2发挥重要作用在马凡综合征,这是一种细胞外基质失调与红衣主教的眼睛,表现骨骼和心血管系统(37]。最近的一些报告显示,诱导烧蚀的TGF -β受体2型信号能够限制肝星状细胞和纤维化和减弱肿瘤相关炎症(38]。TGF -β作为免疫细胞的关键调节器,上皮细胞在炎症性肠病(39]。许多研究表明TGFBR2信号是与inflammatory-related疾病相关。但是,TGFBR2和NS相关是否仍然是一个谜。CDKN1B,细胞周期蛋白依赖性激酶抑制剂1 b,可以绑定,防止细胞周期蛋白的激活E-CDK2或细胞周期蛋白D-CDK4复合物,从而控制细胞周期G1进展。KRAS基因作为一个开/关开关在细胞信号和控制细胞增殖。大多数我们选定的目标分子与细胞增殖和肿瘤发生。虽然很少有文献研究报告它们之间的相关性和NS。这项研究给了我们一个新的启蒙新生儿脓毒症的研究。然而,我们的研究也有一些局限性。首先,PIK3CA和其他分子生物标志物预测生物标志物n,应该进行进一步的实验验证来验证我们的结果。此外,工作流是否适合其他分析或另一个数据库是一个问题。
5。结论
总之,一个全面的过程中数据的数据集的NS进行研究。然后,系统提供的功能和信号通路的NS的前沿模型。最后,根据潜在的途径及其coexpression网络的拓扑特征,几个关键NS基因被识别。PIK3CA被定义为NS的共同标志。然而,目前的研究是基于前面的报告和结果需要更多的临床证据。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
信息披露
YuXiu孟和薛宏Cai co-first作者。
的利益冲突
作者宣称没有利益冲突。