重型肝炎(FH)是一种危及生命的肝脏疾病的特点是强烈的免疫攻击,大量的肝细胞死亡。共同precore终止密码子突变的乙型肝炎病毒(HBV), A1896,经常与跳频,但缺乏特异性。本研究试图发现所有可能的病毒核苷酸是专门通过编译与跳频序列分析跳频和non-FH从急性感染病例。我们检索67跳频和280年急性non-FH乙型肝炎病例从基因库和应用支持向量机(SVM)模型寻求候选人核苷酸高度预测的跳频。六个最佳候选人前预测的准确性,92.5%被用来建立一个支持向量机模型;他们是C2129 (85.3%)、T720 (83.0%)、Y2131 (82.4%)、T2013 (82.1%)、K2048(82.1%),和A2512 (82.1%)。这个模型给了高特异性(99.3%)、阳性预测值(95.6%),和消极的预测价值(92.1%),但只有温和的敏感性(64.2%)。我们成功地建立了一个支持向量机模型包括六个变量是高度预测和特定FH:四个核心地区和一个每个聚合酶和表面区域。这些变异表明,细胞内的病毒粒子/核心保留可能发展为FH发挥重要作用。
在乙型肝炎病毒(HBV)感染,重型肝炎(FH)发生在不到1%的成年人感染但与近70%死亡率(
乙型肝炎病毒是影响肝病毒科的分类下的家庭。病毒的部分双链DNA基因组包含四个重叠的开放阅读框(ORF),即聚合酶,表面上看,核心,X基因。而聚合酶和X基因对病毒复制至关重要,核心基因编码的核心蛋白(HBcAg)和排泄e抗原(e抗原)和表面基因编码三个表面抗原,即大型pre-S1,中间pre-S2,和小S蛋白(
跳频的突变与发展主要是发现precore地区最频繁被报道A1896 [
目前可以寻找更可靠的病毒基因变异与跳频由于越来越多的全球乙肝病毒基因组被测序。通过这些病毒变异,我们试图提供洞察跳频的潜在机制是否支持举办大规模的免疫攻击,viral-induced细胞病由于细胞内病毒粒子/衣壳积累,或两者兼而有之。
乙肝病毒的基因组跳频和non-FH乙型肝炎急性感染被国家生物技术信息中心(NCBI)核苷酸数据库2017年4月20日。高级搜索中使用的关键词是“乙型肝炎病毒”、“完整基因组”,“重型”或“严重”。基因组长度在搜索被限制在2800到3400个核苷酸(nt)作为典型的乙型肝炎病毒基因组大小约为3.2 k nt。跳频的初始搜索生产了98和726的点击率和non-FH情况下,分别。Acute-on-chronic肝炎和Acute-on-chronic肝功能衰竭,导致慢性感染,被排除在进一步分析。排除无关,最后搜索了67跳频和280例急性non-FH病例;一个案例是sub-FH。急性non-FH例作为对照组的序列比较研究。这些乙肝病毒基因组的加入数字提供了附加的表
乙肝病毒基因组基因分型使用病毒基因分型工具,可以在NCBI网站(
neighbour-joining (NJ)树重建完整的乙肝病毒基因组的系统发育分析,使用大型7.0.18版本软件,Kimura-2参数核苷酸替代模型,网站,统一率和完整删除空白
统计分析使用社会科学统计程序(SPSS 17.0对windows, SPSS, Inc .,芝加哥,IL)。确切概率法应用于检查核苷酸类型和疾病状态之间的关系。一个
为了避免假阳性发现,观测随机基准最大20倍随机猜的准确;在这种情况下,它被发现81.8% (284/347)。55的最大通过的候选人核苷酸随机猜测精度被确定基于MAFFT-aligned序列数据。这些55核苷酸按精度在降序排序进行特征选择的过程。单轮的蛮力选择6一次候选人核苷酸使用55核苷酸是不可能的因为它需要很高的计算资源。实现了两轮的蛮力选择过程与支持向量机(SVM)点内核算法RapidMiner 7.2.001 [
支持向量机模型被用来评估候选人的预测值核苷酸从而选择。对于每一个功能,最常见的核苷酸类型在两类编码为1,其他人则编码为0。减少偏见由于取样大小不均,候选人的预测准确性核苷酸是由平衡训练数据集组成的67 FH病例和对照组67例随机选择。这是基准随机猜测精度为50%。例对照组的随机抽样是重复1000次。1000年的5倍交叉验证进行了平衡的数据集。
预测值都表达了在整体或平均精度方面,敏感性,特异性,阳性预测值(PPV)和阴性预测值(NPV)。“整体”指所有情况和控制,而“平均”是用于预测的计算值在5倍交叉验证使用平衡抽样法。精度定义为正确的和跳频和急性non-FH病例的猜测在这两种情况下的总数。灵敏度计算的总和除以正确识别跳频情况下与一个标记在所有跳频情况下,而获得了特异性的总和除以正确识别控制情况下没有标记所有控制情况。PPV的计算的总和除以正确识别跳频情况下对所有积极的预测,与NPV计算除以正确识别控制情况下对所有消极的预测。
跳频的67例44来自亚洲国家(主要是中国和日本;65.7%),23.9%来自西方(欧洲和美国),6从非洲(9.0%),和1从中东(1.5%),而280年急性non-FH情况下,相应的百分比是169从亚洲(60.4%),从西方50(17.9%)、5从非洲(1.8%),56个来自南美(20.0%)。跳频的地理分布和non-FH团体似乎是相似的。大部分的HBV基因型模拟(表
基因型分布的暴发性和急性nonfulminant乙肝病毒基因组从NCBI检索。
| 基因型 | 重型, |
严重的, |
|---|---|---|
| 一个 | 8 (11.9) | 65 (23.2) |
| B | 22日(32.8) | 31 (11.1) |
| C | 22日(32.8) | 112 (40.0) |
| D | 15 (22.4) | 26日(9.3) |
| F | 0 (0.0) | 40 (14.3) |
| G | 0 (0.0) | 1 (0.4) |
| H | 0 (0.0) | 4 (1.4) |
| 我 | 0 (0.0) | 1 (0.4) |
NCBI:国家生物技术信息中心。
总共55的最大通过的候选人核苷酸随机猜测精度被确定(5表
6候选人核苷酸的乙肝病毒的最佳组合与重型肝炎选择从上55候选人核苷酸使用蛮力选择方法用支持向量机实现点内核算法。
| 核苷酸 | 基因/监管元素 | 重型, |
严重的, |
%的准确性 |
|
|---|---|---|---|---|---|
| C2129 | 核心 | 17 (25.4) | 1 (99.6) | 85.3 |
|
| T720 | 表面/ polymerase-RT | 9 (13.4) | 1 (99.6) | 83.0 |
|
| Y2131 | 核心 | 6 (9.0) | 0 (100.0) | 82.4 |
|
| T2013 | 核心 | 5 (7.5) | 0 (100.0) | 82.1 |
|
| K2048 | 核心 | 5 (7.5) | 0 (100.0) | 82.1 |
|
| A2512 | Polymerase-TP | 5 (7.5) | 0 (100.0) | 82.1 |
|
乙肝病毒,乙肝病毒;支持向量机,支持向量机;RT,逆转录酶;TP、终端蛋白质;
乙型肝炎病毒感染的跳频是一种可怕的并发症。FH-associated乙肝病毒突变的识别可以提供更准确的了解跳频的疾病发病机理。我们建立了一个高度预测的支持向量机模型和具体发展的跳频。它由六个小说乙肝病毒核苷酸变异,四核心基因。在这里,我们试图解释这些核苷酸标记的原理在跳频的发病机制。
核心蛋白,也称为HBcAg,有183个残基,其中149 n端属于装配域,和34个糖基的rna结合域
HBcAg残留77,有一个g c (Gln Glu)开关2129年核苷酸(Glu77Gln;密码子CAA)棉酚是伴随着电荷的变化从酸性到极地卸货(但没有二级结构的变化),以及一个y (Glu Asp)核苷酸2131(棉酚同性恋)的变化,这是伴随着二级结构的变化从阿尔法螺旋turn-and-loop(但没有变化)。这些G2129C A2131Y变化可能是重要的细胞内潴留的HBV病毒粒子。支持这个假说的证据来自其他工人,伴随变化的观测与Pro79Gln Glu77Gln Ala80Pro, Ser181Pro核心蛋白似乎促进核保留HBcAg [
A2013T变体,有一个从酪氨酸切换到板式换热器(答到达目标时间)。酪氨酸磷酸化和糖基化的,但不是板式换热器。一般来说,磷酸化的氨基酸在信号中所起的作用,而糖基化蛋白质分泌,影响结构的形成,和抗原性。虽然没有改变结构和电荷在A2013T转译后的修改功能的改变可能影响病毒衣壳的装配效率。HBcAg大会的失败可能会导致肝细胞内病毒衣壳的过度积累。
C2048K,相应的残渣38岁,有一个从职业转换到阿拉巴马州/酪氨酸残(有条件现金援助GCT /乙)50,伴随着电荷的变化从极地到非极性。这样一个氨基酸的改变可能会妨碍HBcAg中的turn-and-loop结构的形成。C2048K没有,到目前为止,涉及疾病发病机理,这变种病毒粒子的影响/核心蛋白保留需要进一步调查。此外,C2048K位于辅助T CD4 +抗原表位HBcAg [
C720T变体是相应的表面残留189。这种替换的刺(ACT)与Ile (ATT)与结构变化没有联系但是从极地转向非极性电荷状态。残留169 - 195 96 - 122和残留的HBsAg参与衣壳与核心蛋白质残基67 - 96为了促进一种传染性病毒的形成(
终端(TP)的聚合酶蛋白质域。它作为一种蛋白质病毒DNA合成的引物。TP-epsilon RNA聚合酶的包装需要绑定和pregenomic RNA (pgRNA)成核衣壳
A1896,最常引用的跳频的标志,并不在6变种选择建立支持向量机模型。这可能是由于其预测特异性较低。A1896和跳频之间的联系已经证明在日本的研究(
总之,我们确定了六个乙肝病毒变异(polymerase-TP 4核心,1,在表面和1 / polymerase-RT地区)高度预测和特定的识别跳频的危险的患者。这些病毒变异可能发挥重要作用在疾病进展到跳频导致肝细胞过度积累的病毒衣壳。因此,我们的研究结果支持假设viral-induced细胞死亡的肝免疫攻击,跳频的发病机制的一个重要因素。
作者曾参与本研究宣称他们没有任何披露关于资金或利益冲突的关于这个手稿。
这项研究是由马来亚大学高影响的研究(HIR)授予(UM.C / 625/1 / HIR /邻蒙古/地中海/ 25;E0063)。
图1:使用neighbour-joining方法推断进化历史。的比例复制的树分类群聚集在一起,引导相关测试(1000复制)旁边的树枝上所示。树是按比例画,分支长度在同一单位的进化距离用来推断系统发育树。进化距离的计算方法和使用木村出现在基地的数量的单位替换/网站。分析涉及347个核苷酸序列。所有职位包含漏洞和缺失的数据都消除了。总共有2362个职位在最终的数据集。进化在MEGA7进行了分析。
表1:基因型和地理分布的暴发性和急性乙型肝炎。
表2:前55候选人核苷酸与重型乙型肝炎有关。
表3:排名前25位的列表信息最丰富的核苷酸变异与重型肝炎B组合使用SVM模型生成与蛮力的选择。
表4:前6乙肝病毒分离株的核苷酸变异频率暴发性和急性肝炎。