预测和描述丢失的蛋白质组学数据的脱磷孤菌属寻常的gydF4y2Ba - raybet雷竞app,雷竞技官网下载,雷电竞下载苹果

文摘gydF4y2Ba

蛋白质组学数据集往往是不完整的识别范围和灵敏度问题。它成为重要的开发方法来估计丢失的蛋白质组学数据,允许更好的解释蛋白质组学数据集和代谢机制复杂的生物系统。在这项研究中,我们应用一个人工神经网络近似同源转录组和蛋白质组学数据集之间的关系gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba,来预测蛋白质丰富的蛋白质不是实验检测,根据一些相关预测因子,如mRNA丰富,细胞作用和三重密码子数。的测定结果表明,系数从0.47到0.68不等训练神经网络模型,提供更好的建模比之前几个回归模型。训练神经网络模型的有效性评估使用生物信息(即操纵子)。寻求理解机制导致失踪的蛋白质组学数据,我们使用多元逻辑回归分析,结果表明,一些关键因素,如蛋白质不稳定指数、脂肪指数、mRNA丰富、有效的密码子的数量(gydF4y2Ba)和密码子适应指数(CAI)值可能是归因于一个给定的蛋白质表达是否可以检测到。此外,我们表明,生物解释可以提高利用估算蛋白质组学数据集。gydF4y2Ba

1。介绍gydF4y2Ba

应用各种实验的“组学”工具增强了我们理解复杂的生物系统在过去的十年里(gydF4y2Ba1gydF4y2Ba- - - - - -gydF4y2Ba8gydF4y2Ba]。然而,由于这些高通量技术的技术限制和约束在实验设计上,大多数的这些高通量“组学”数据集仍遭受重大缺失值。不完整的数据已经阻碍了科学家们对细胞代谢中提取正确的信息。来解决这个问题,试图运用计算工具转嫁各种高通量“组学”中的遗漏值数据集了(gydF4y2Ba9gydF4y2Ba- - - - - -gydF4y2Ba11gydF4y2Ba]。最成功的例子,这些努力是为了丢失的转录组数据(gydF4y2Ba12gydF4y2Ba]。gydF4y2Ba

与转录组数据集相比,蛋白质组学数据集遭受更为严重的缺失数据识别范围和灵敏度以来还没有完全比得上转录组测量(gydF4y2Ba13gydF4y2Ba]。特别是,当部分蛋白质组学数据集用于各种集成的“组学”研究,未被发现的蛋白质只是分配一个“零”价值和被排除关系建模,这可能偏见的任何结论导致综合研究(gydF4y2Ba14gydF4y2Ba]。为了克服这个问题,几种方法已经适应从转录组数据的缺失值的估计估计丢失的蛋白质组学其他蛋白质,通过使用可用的测量值等gydF4y2Ba最近邻和贝叶斯主成分分析(BPCA)将缺失的蛋白质组学方法值在凝胶蛋白质组学数据集gydF4y2Ba15gydF4y2Ba,gydF4y2Ba16gydF4y2Ba),通过集成(基因本体)信息进入蛋白质组学数据归责(gydF4y2Ba17gydF4y2Ba]。基于假设的存在有意义的关联两种类型的数据集(gydF4y2Ba14gydF4y2Ba近年来,我们已经开发出Zero-inflatedgydF4y2Ba泊松gydF4y2Ba(ZIP)线性回归模型gydF4y2Ba18gydF4y2Ba)和随机梯度增加树木(GBT)非线性模型(gydF4y2Ba19gydF4y2Ba)发现可能的转录组和蛋白质组数据之间的关系和预测蛋白质丰富的蛋白质不是实验检测。gydF4y2Ba

作为持续努力的一部分开发统计工具对缺失值归责,我们在研究中应用人工神经网络(ANN)方法来预测大量实验发现蛋白质几个同源转录组和蛋白质组学数据集的硫酸盐还原细菌gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba(gydF4y2Ba20.gydF4y2Ba- - - - - -gydF4y2Ba23gydF4y2Ba]。人工神经网络的优点包括应对复杂关系的能力,与缺失值处理噪声数据,和其泛化能力gydF4y2Ba24gydF4y2Ba,gydF4y2Ba25gydF4y2Ba]。方法,多层感知器(MLP)与乙状结肠单隐层的激活函数用于捕获转录组数据之间的非线性关系和蛋白质丰度。排名前十的相关预测蛋白质丰度确定一项研究[gydF4y2Ba19gydF4y2Ba培训向MLP)被用作输入电路的输出延时近似对应的每个基因的蛋白质丰度。中长期规划训练是利用生物信息进行验证。此外,通过使用多元逻辑回归分析,我们量化一些序列的贡献因素,如信使rna,蛋白质不稳定指数,基因长度,密码子的“有效数字”(gydF4y2Ba),CAI(密码子适应指数)值缺少蛋白质组值。我们也证明了生物解释可以提高通过估算蛋白质组学数据集。gydF4y2Ba

2。材料和方法gydF4y2Ba

2.1。数据集gydF4y2Ba

两个数据集gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba分析了在这个研究。数据集覆盖相同的物种,尽管实验条件是不同的,他们是通过两个独立的研究(gydF4y2Ba19gydF4y2Ba- - - - - -gydF4y2Ba23gydF4y2Ba]。原始强度值数据集都是规范化使用分位数正常化R包(脱字符号)可以通过gydF4y2Ba项目(gydF4y2Bahttp://www.r-project.org/gydF4y2Ba)。绝对荧光强度和肽击中被用作转录组和蛋白质组数据丰富,分别为(gydF4y2Ba26gydF4y2Ba]。标记数据集1和2的数据集,这些数据集将在整篇文章中使用。gydF4y2Ba

2.2。基因组信息gydF4y2Ba

基因注释的属性,比如序列长度、蛋白质,分子量,GC含量,三重密码子数,和细胞功能类别的所有基因gydF4y2Bad .寻常的gydF4y2Ba基因组从全面的微生物资源下载(CMR) TIGR (gydF4y2Bahttp://cmr.tigr.orggydF4y2Ba/)(gydF4y2Ba22gydF4y2Ba]。定义操纵子,我们使用了distance-only方法,门槛相对较低,在这项研究中,涵盖更多可能的操纵子。转录方向相同的基因与基因间的地区,不到15碱基对被定义为一个操纵子(gydF4y2Ba19gydF4y2Ba]。gydF4y2Ba

2.3。蛋白质组学建设的关系,并通过人工神经网络信使rnagydF4y2Ba

我们训练了一个人工神经网络学习特定的函数通过调整神经元之间的权重的值。它已经表明,多层感知器和一个隐藏层可以任意精度逼近任意连续函数通过增加隐层神经元的数量(gydF4y2Ba27gydF4y2Ba- - - - - -gydF4y2Ba29日gydF4y2Ba]。权重连接输入信号以及神经元的数量可以确定通过最小化之间的差值的平方之和网络输出和目标为每个输入输出信号。非线性优化方法结合反向传播算法(gydF4y2Ba30.gydF4y2Ba)实施找到最优权重。输入到网络和目标通常是新(−1,1)。网络的输出被新回到近似原规模的目标。在这项工作中,我们训练多层感知器学习转录组和蛋白质组数据之间的非线性关系。转录组数据输入和目标是丰富的蛋白质。gydF4y2Ba

隐层的前馈网络可以以任意精度逼近任意连续函数,它提供了安的权力来处理非线性关系,也打开门过度拟合用于隐层神经元如果过多。为了解决可能的过度拟合,我们实现了一个交叉验证,防止过度拟合。通过这种方法的数据分区gydF4y2Ba相等的部分,gydF4y2Ba集被用来训练模型和另一组是用来计算预测误差(gydF4y2Ba31日gydF4y2Ba]。这是重复的gydF4y2Ba次,因此gydF4y2Ba预测误差值被计算在每一个褶皱。平均和标准偏差可以提取,选择最具代表性的模型对未来的预测。交叉验证是普遍有效的防止过度拟合。旁边交叉验证,防止过度拟合,我们还使用了一些统计工具来诊断所选择的模型。一旦选择最好的模型,基于交叉验证,该模型评估基于其确定系数(gydF4y2Ba)。这个系数代表了变化的解释模型。此外,或者评估模型,我们研究了预测的美好的小集分组基于操纵子的基因信息。为了描述一个数据集内的变化,如“摩尔丰富”的蛋白质在一个操纵子,我们计算变异系数(CV)每组蛋白质。简历被定义为标准差和均值的比值“摩尔丰富”的一组蛋白质(gydF4y2Ba18gydF4y2Ba,gydF4y2Ba19gydF4y2Ba,gydF4y2Ba32gydF4y2Ba简历评分的计算是独立的样本大小。这些系数的变化相比,计算所有操纵子和CVs的排列分布,排列的基因。gydF4y2Ba

2.4。分析的因素归因于缺少蛋白质测量gydF4y2Ba

DNA和蛋白质序列特征,gydF4y2BaBioPerlgydF4y2Ba模块用于批量查询和解析结果ExPASy ProtParam程序,返回“AliphaticIndex”和“InstabilityIndex”。CodonW是用于执行对应分析氨基酸的密码子和用法,返回第一个四轴代表主要趋势(AA_axis1-4氨基酸的使用,CR_axis1-4相对同义密码子的使用)。每个基地第三个密码子的频率位置(t3的网站,被指定为a3, c3作物,和g3),以及两个额外的措施等蛋白质性质大平均水疗法(肉汁)和AROMO,也与CodonW计算。密码子适应指数(CAI)与内部perl脚本使用计算gydF4y2Bad .寻常的gydF4y2Ba核糖体蛋白基因高表达基因提供了参考依据。这些特性的计算与分析是描述在我们之前的一些作品gydF4y2Ba33gydF4y2Ba- - - - - -gydF4y2Ba35gydF4y2Ba]。gydF4y2Ba

逻辑回归模型被用来评估的每个特征属性是否一个给定的蛋白质将被检测到gydF4y2Ba36gydF4y2Ba,gydF4y2Ba37gydF4y2Ba]。假设一个基因的功能gydF4y2Ba是gydF4y2Ba。在逻辑回归、分对数概率的自然对数,未知的概率,gydF4y2Ba,蛋白质是没有检测到被建模为一个线性函数gydF4y2Ba:gydF4y2Ba 模型是等价的gydF4y2Ba 未知系数通常由最大似然估计使用方法共同所有广义线性模型(gydF4y2Ba35gydF4y2Ba]。在模型中,参数gydF4y2Ba的添加剂影响日志赔率为一个单元的变化gydF4y2Ba说明特征变量。也就是说,一个单位的变化特性gydF4y2Ba,也就是说,gydF4y2Ba表示可能性的变化gydF4y2Ba次了。积极的gydF4y2Ba表明蛋白质不会被检测到的概率增加而增加gydF4y2Bath特性。通过使用逻辑回归分析、相关特性的影响蛋白质是否会发现被量化,可以比较。和拟合模型还可以用来预测的机会,任何其他蛋白质不会被检测到。gydF4y2Ba

3所示。结果与讨论gydF4y2Ba

3.1。确定变量重要性和局部变量的依赖gydF4y2Ba

在一项研究中,我们使用梯度增加树木(GBT)模型来衡量的贡献的70个rna蛋白质相关变量的输入变量,和10个顶级变量被确定mRNA表达水平,细胞的作用,和几个密码子用法的三倍gydF4y2Bad .寻常的gydF4y2Ba我们使用数据集(参见表1 Supplmentary材料网上doi: 10.1155 / 2011/780973) (gydF4y2Ba19gydF4y2Ba]。在这项研究中,我们使用相同的十大预测人工神经网络的输入方法。使用的数据集是与之前的工作比较一致。结果表明,对于所有的数据集,我们观察一个平滑的蛋白质丰度之间的关系,丰富相应的信使rna控制其他预测平均值为每一个增长的条件。之间的部分依赖蛋白质和mRNA丰富往往是平滑的丰富mRNA在高范围(图gydF4y2Ba1gydF4y2Ba)。图gydF4y2Ba2gydF4y2Ba显示了建立蛋白质丰富的散点图和信使rna蛋白质检测和未被发现的数据集的数据集1和2,分别。对于这两个数据集,每个增长条件下,有更少的基因与信使核糖核酸或蛋白质丰度很高。这些蛋白质未被发现的大多是很低的预测蛋白质丰度和观察mRNA丰富如图gydF4y2Ba2 (b)gydF4y2Ba和gydF4y2Ba2 (d)gydF4y2Ba对于数据集数据集1和2,分别。蛋白质未被发现有许多较小的方差预测价值尤其是对数据集2如图gydF4y2Ba2 (d)gydF4y2Ba。相比之下,这些检测蛋白质有更大范围的蛋白质丰度和很高的可变性。gydF4y2Ba

(一)gydF4y2Ba

(b)gydF4y2Ba

(一)gydF4y2Ba

(b)gydF4y2Ba

(c)gydF4y2Ba

(d)gydF4y2Ba

图2gydF4y2Ba

预测情节的蛋白质。散点图预测蛋白质的丰度与信使rna蛋白质检测和未被发现的。(一)情节和检测蛋白质基因数据集1;(b)情节和未被发现的蛋白质基因数据集1;(c)情节与检测蛋白质基因数据集2;(d)情节与未被发现的蛋白质的基因数据集2。gydF4y2Ba

在前面的工作使用GBT模型揭示非线性转录组和蛋白质组学数据集之间的关系,一个有趣的模式,观察高原效应,部分依赖图的mRNA丰富与蛋白质丰度高值的信使rna。这可能是由于这一事实蛋白质丰度数据稀疏,高方差,树模型预测中不产生分歧(gydF4y2Ba19gydF4y2Ba]。在神经网络模型中,中长期规划的输出是一个固有的光滑函数网络的输入,因此相对平滑的预测总是得到保证。然而,我们仍然可以看到类似的模式时,曲线变得平坦的方差mRNA丰度高。例如,在该地区的高mRNA值有少量的基因/肽蛋白值范围从(0,40)数据集1和2(0 500)数据集。这可能反映的问题目前蛋白质组学技术的敏感性高丰富蛋白质。gydF4y2Ba

3.2。结构的非线性人工神经网络模型gydF4y2Ba

训练前馈网络和一个隐藏层为每个条件与mRNA丰度数据集和其他因素作为输入和蛋白质丰度作为目标。使用功能的神经网络训练的神经网络工具箱提供的标准软件Matlab (7.0.1)。隐层神经元的激活函数是双曲正切函数,给出的gydF4y2Ba 输出神经元的激活函数是一个纯粹的线性函数,也就是加权和的隐层神经元的输出。最优隐层神经元的数量和最优权重测定使用10倍交叉验证训练一个神经网络。对于每个数据集每个实验条件下,网络与输入相同但不同数量的神经元(从5到12)隐层中每个训练使用交叉验证学习mRNA的特性和蛋白质丰度之间的关系。最优层的神经元数量决定基于一个生成最小平均验证误差。gydF4y2Ba

转录组和蛋白质组数据进行对数转换。对于数据集1,没有缺失值的基因选择了四分之三的复制模型的训练。基因用于培训的数量是354,312,和308 FL,噢,分别和LS条件。对于每个生长条件,多层感知器的输入是十大预测确定之前(gydF4y2Ba19gydF4y2Ba在补充材料(见表1)。最优网络6、6和9的隐层神经元FL,噢,分别和LS条件。系数决定gydF4y2Ba分别为0.47、0.52和0.51 FL,噢,LS条件,分别。数据集2,986,1001,和986个基因没有丢失蛋白质测量被用于模型训练CT0 CT120,分别和ST120条件。为每个条件,多层感知器的输入确定的十大预测之前(gydF4y2Ba19gydF4y2Ba在补充材料(见表1)。最优网络有8、7、6 CT0隐层神经元,CT120,分别和ST120条件。系数的测定gydF4y2Ba分别为0.65、0.62和0.68 CT0, CT120,分别和ST120条件。gydF4y2Ba

3.3。验证通过非线性人工神经网络预测模型gydF4y2Ba

验证模型的预测是通过计算变异系数(CV)条件的每一个操纵子gydF4y2Bad .寻常的gydF4y2Ba所述前(gydF4y2Ba18gydF4y2Ba,gydF4y2Ba19gydF4y2Ba]。操纵子的基因被认为没有比随机分散组基因的基因表达和/或蛋白质丰富,因为他们的内在生物关系。相对较低的阈值操纵子识别节中描述gydF4y2Ba2gydF4y2Ba,共有609个操纵子中确定gydF4y2Bad .寻常的gydF4y2Ba,范围从2到13个基因操纵子。比较这些CV值,我们使用一个排列测试在以下方式:简历是计算值预测蛋白质的数量排列的基因。这一步是通过重采样的不重复基因重复2000次。随机选择的基因数量等于基因群的大小进行比较。对于数据集1,82%到89%的操纵子组CV值小于排列组数据集2,79%到89%的操纵子组CV值小于排列,一般展示良好的性能模型的预测。验证结果总结表gydF4y2Ba1gydF4y2Ba。gydF4y2Ba

数据集1gydF4y2Ba

数据集2gydF4y2Ba

FLgydF4y2Ba

噢gydF4y2Ba

LSgydF4y2Ba

CT0gydF4y2Ba

CT120gydF4y2Ba

ST120gydF4y2Ba

操纵子gydF4y2Ba

简历gydF4y2Ba

PCVgydF4y2Ba

简历gydF4y2Ba

PCVgydF4y2Ba

简历gydF4y2Ba

PCVgydF4y2Ba

简历gydF4y2Ba

PCVgydF4y2Ba

简历gydF4y2Ba

PCVgydF4y2Ba

简历gydF4y2Ba

PCVgydF4y2Ba

1gydF4y2Ba

0.36gydF4y2Ba

0.707gydF4y2Ba

0.6gydF4y2Ba

0.797gydF4y2Ba

0.301gydF4y2Ba

0.901gydF4y2Ba

1.63 *gydF4y2Ba

1.248gydF4y2Ba

0.814gydF4y2Ba

1.186gydF4y2Ba

1.269gydF4y2Ba

1.286gydF4y2Ba

2gydF4y2Ba

1.6 *gydF4y2Ba

0.638gydF4y2Ba

1.564 *gydF4y2Ba

0.725gydF4y2Ba

1.48 *gydF4y2Ba

0.631gydF4y2Ba

0.773gydF4y2Ba

1.102gydF4y2Ba

0.968gydF4y2Ba

1.044gydF4y2Ba

0.702gydF4y2Ba

1.129gydF4y2Ba

3gydF4y2Ba

0.499gydF4y2Ba

0.659gydF4y2Ba

1.04 *gydF4y2Ba

0.766gydF4y2Ba

0.563gydF4y2Ba

0.866gydF4y2Ba

1.295 *gydF4y2Ba

1.134gydF4y2Ba

1.568 *gydF4y2Ba

1.106gydF4y2Ba

1.324 *gydF4y2Ba

1.169gydF4y2Ba

4gydF4y2Ba

0.216gydF4y2Ba

0.648gydF4y2Ba

0.239gydF4y2Ba

0.726gydF4y2Ba

0.323gydF4y2Ba

0.813gydF4y2Ba

0.333gydF4y2Ba

1.106gydF4y2Ba

0.401gydF4y2Ba

1.05gydF4y2Ba

0.453gydF4y2Ba

1.135gydF4y2Ba

5gydF4y2Ba

0.418gydF4y2Ba

0.646gydF4y2Ba

0.559gydF4y2Ba

0.731gydF4y2Ba

0.45gydF4y2Ba

0.794gydF4y2Ba

0.481gydF4y2Ba

1.105gydF4y2Ba

0.398gydF4y2Ba

1.05gydF4y2Ba

0.466gydF4y2Ba

1.122gydF4y2Ba

6gydF4y2Ba

0.18gydF4y2Ba

0.647gydF4y2Ba

0.454gydF4y2Ba

0.745gydF4y2Ba

0.353gydF4y2Ba

0.809gydF4y2Ba

0.495gydF4y2Ba

1.116gydF4y2Ba

0.403gydF4y2Ba

1.042gydF4y2Ba

0.473gydF4y2Ba

1.124gydF4y2Ba

7gydF4y2Ba

0.297gydF4y2Ba

0.651gydF4y2Ba

0.162gydF4y2Ba

0.729gydF4y2Ba

0.312gydF4y2Ba

0.8gydF4y2Ba

0.408gydF4y2Ba

1.101gydF4y2Ba

0.343gydF4y2Ba

1.042gydF4y2Ba

0.69gydF4y2Ba

1.118gydF4y2Ba

8gydF4y2Ba

0.307gydF4y2Ba

0.693gydF4y2Ba

0.292gydF4y2Ba

0.772gydF4y2Ba

0.28gydF4y2Ba

0.908gydF4y2Ba

0.767gydF4y2Ba

1.204gydF4y2Ba

0.502gydF4y2Ba

1.147gydF4y2Ba

0.57gydF4y2Ba

1.236gydF4y2Ba

9gydF4y2Ba

0.389gydF4y2Ba

0.676gydF4y2Ba

0.352gydF4y2Ba

0.764gydF4y2Ba

0.851gydF4y2Ba

0.86gydF4y2Ba

0.884gydF4y2Ba

1.171gydF4y2Ba

0.631gydF4y2Ba

1.098gydF4y2Ba

0.558gydF4y2Ba

1.197gydF4y2Ba

10gydF4y2Ba

0.621gydF4y2Ba

0.624gydF4y2Ba

0.445gydF4y2Ba

0.765gydF4y2Ba

0.74gydF4y2Ba

0.859gydF4y2Ba

0.889gydF4y2Ba

1.166gydF4y2Ba

0.67gydF4y2Ba

1.096gydF4y2Ba

1.087gydF4y2Ba

1.19gydF4y2Ba

11gydF4y2Ba

0.304gydF4y2Ba

0.595gydF4y2Ba

0.231gydF4y2Ba

0.704gydF4y2Ba

0.3gydF4y2Ba

0.773gydF4y2Ba

0.78gydF4y2Ba

1.153gydF4y2Ba

0.816gydF4y2Ba

1.082gydF4y2Ba

0.567gydF4y2Ba

1.182gydF4y2Ba

12gydF4y2Ba

0.599gydF4y2Ba

0.808gydF4y2Ba

0.831gydF4y2Ba

0.908gydF4y2Ba

0.729gydF4y2Ba

1.076gydF4y2Ba

1.201gydF4y2Ba

1.535gydF4y2Ba

1.174gydF4y2Ba

1.366gydF4y2Ba

1.563 *gydF4y2Ba

1.528gydF4y2Ba

13gydF4y2Ba

0.353gydF4y2Ba

0.646gydF4y2Ba

0.435gydF4y2Ba

0.723gydF4y2Ba

0.531gydF4y2Ba

0.826gydF4y2Ba

0.366gydF4y2Ba

1.118gydF4y2Ba

0.532gydF4y2Ba

1.06gydF4y2Ba

0.369gydF4y2Ba

1.124gydF4y2Ba

14gydF4y2Ba

0.359gydF4y2Ba

0.665gydF4y2Ba

0.407gydF4y2Ba

0.73gydF4y2Ba

0.267gydF4y2Ba

0.752gydF4y2Ba

0.653gydF4y2Ba

1.157gydF4y2Ba

0.825gydF4y2Ba

1.087gydF4y2Ba

0.597gydF4y2Ba

1.18gydF4y2Ba

15gydF4y2Ba

0.381gydF4y2Ba

0.717gydF4y2Ba

0.707gydF4y2Ba

0.801gydF4y2Ba

0.78gydF4y2Ba

0.922gydF4y2Ba

0.691gydF4y2Ba

1.246gydF4y2Ba

0.838gydF4y2Ba

1.166gydF4y2Ba

0.674gydF4y2Ba

1.293gydF4y2Ba

16gydF4y2Ba

0.299gydF4y2Ba

0.749gydF4y2Ba

0.538gydF4y2Ba

0.833gydF4y2Ba

0.307gydF4y2Ba

0.989gydF4y2Ba

0.613gydF4y2Ba

1.342gydF4y2Ba

0.456gydF4y2Ba

1.252gydF4y2Ba

1.059gydF4y2Ba

1.372gydF4y2Ba

17gydF4y2Ba

0.321gydF4y2Ba

0.649gydF4y2Ba

0.219gydF4y2Ba

0.726gydF4y2Ba

0.222gydF4y2Ba

0.806gydF4y2Ba

0.657gydF4y2Ba

1.059gydF4y2Ba

0.492gydF4y2Ba

0.943gydF4y2Ba

0.529gydF4y2Ba

1.046gydF4y2Ba

18gydF4y2Ba

0.473gydF4y2Ba

0.645gydF4y2Ba

0.486gydF4y2Ba

0.723gydF4y2Ba

0.628gydF4y2Ba

0.767gydF4y2Ba

0.474gydF4y2Ba

1.164gydF4y2Ba

0.539gydF4y2Ba

1.091gydF4y2Ba

0.578gydF4y2Ba

1.185gydF4y2Ba

19gydF4y2Ba

0.592gydF4y2Ba

0.741gydF4y2Ba

0.479gydF4y2Ba

0.824gydF4y2Ba

0.631gydF4y2Ba

0.982gydF4y2Ba

1.68 *gydF4y2Ba

1.317gydF4y2Ba

1.094gydF4y2Ba

1.248gydF4y2Ba

1.403 *gydF4y2Ba

1.342gydF4y2Ba

20.gydF4y2Ba

0.767 *gydF4y2Ba

0.621gydF4y2Ba

0.586gydF4y2Ba

0.695gydF4y2Ba

0.561gydF4y2Ba

0.752gydF4y2Ba

0.267gydF4y2Ba

1.037gydF4y2Ba

0.288gydF4y2Ba

0.964gydF4y2Ba

0.492gydF4y2Ba

1.053gydF4y2Ba

21gydF4y2Ba

0.389gydF4y2Ba

0.548gydF4y2Ba

0.416gydF4y2Ba

0.693gydF4y2Ba

0.472gydF4y2Ba

0.757gydF4y2Ba

1.034gydF4y2Ba

1.037gydF4y2Ba

0.813gydF4y2Ba

0.978gydF4y2Ba

0.823gydF4y2Ba

1.061gydF4y2Ba

22gydF4y2Ba

0.256gydF4y2Ba

0.654gydF4y2Ba

0.433gydF4y2Ba

0.721gydF4y2Ba

0.49gydF4y2Ba

0.8gydF4y2Ba

0.532gydF4y2Ba

1.095gydF4y2Ba

0.602gydF4y2Ba

1.053gydF4y2Ba

0.569gydF4y2Ba

1.123gydF4y2Ba

23gydF4y2Ba

0.631gydF4y2Ba

0.694gydF4y2Ba

0.707gydF4y2Ba

0.775gydF4y2Ba

0.632gydF4y2Ba

0.877gydF4y2Ba

0.86gydF4y2Ba

1.196gydF4y2Ba

0.677gydF4y2Ba

1.125gydF4y2Ba

0.925gydF4y2Ba

1.242gydF4y2Ba

24gydF4y2Ba

0.376gydF4y2Ba

0.655gydF4y2Ba

0.648gydF4y2Ba

0.655gydF4y2Ba

0.406gydF4y2Ba

0.699gydF4y2Ba

1.23 *gydF4y2Ba

1.099gydF4y2Ba

0.927gydF4y2Ba

1.031gydF4y2Ba

1.138 *gydF4y2Ba

1.123gydF4y2Ba

25gydF4y2Ba

0.869 *gydF4y2Ba

0.674gydF4y2Ba

1 *gydF4y2Ba

0.754gydF4y2Ba

1.194 *gydF4y2Ba

0.85gydF4y2Ba

2.337 *gydF4y2Ba

1.156gydF4y2Ba

2.119 *gydF4y2Ba

1.094gydF4y2Ba

2.303 *gydF4y2Ba

1.185gydF4y2Ba

26gydF4y2Ba

0.657 *gydF4y2Ba

0.618gydF4y2Ba

0.683gydF4y2Ba

0.736gydF4y2Ba

0.747gydF4y2Ba

0.856gydF4y2Ba

0.696gydF4y2Ba

1.151gydF4y2Ba

0.52gydF4y2Ba

1.114gydF4y2Ba

0.7gydF4y2Ba

1.176gydF4y2Ba

27gydF4y2Ba

0.378gydF4y2Ba

0.85gydF4y2Ba

0.452gydF4y2Ba

0.938gydF4y2Ba

0.432gydF4y2Ba

1.104gydF4y2Ba

0.588gydF4y2Ba

1.631gydF4y2Ba

0.667gydF4y2Ba

1.445gydF4y2Ba

0.771gydF4y2Ba

1.629gydF4y2Ba

28gydF4y2Ba

1.013 *gydF4y2Ba

0.67gydF4y2Ba

0.963 *gydF4y2Ba

0.764gydF4y2Ba

1.526 *gydF4y2Ba

0.913gydF4y2Ba

1.255gydF4y2Ba

1.259gydF4y2Ba

1.375 *gydF4y2Ba

1.181gydF4y2Ba

1.332 *gydF4y2Ba

1.282gydF4y2Ba

简历计算SD除以平均预测蛋白质丰度值的一组特定的基因(集团)。由分子量蛋白质预测值归一化计算之前的简历。PCV CV值的均值计算通过排列测试选择的操纵子。gydF4y2Ba
* CV值大于PCV。gydF4y2Ba

进一步说明当前测量色散(CV)相比之下的交换系数的分布变化,我们还计算出百分比分数所有系数的变化,基于同一操纵子基因的生物知识分散应该低于排列的基因集,因此百分比分数将低。计算结果表明,即使简历对于大多数组织小于均值CV值排列的基因集,百分比分数显示,只有一小批这些群体属于百分比小于0.20。组与百分位的百分比分数小于0.2为43%到57%,和57%到61%的数据集数据集1和2,分别。gydF4y2Ba

3.4。比较以前的人工神经网络方法(GBT和ZIP)gydF4y2Ba

类似于GBT方法,人工神经网络方法旨在确定一个未知的和潜在的蛋白质组学和mRNA丰富数据之间的非线性关系,这区别于邮政法,线性假设[zero-inflatedgydF4y2Ba18gydF4y2Ba]。另一个关键的区别是,GBT和基于神经网络方法利用额外的序列信息,如细胞的作用,基因长度、氨基酸用法,和密码子使用翻译效率模型被认为是重要的转录组和蛋白质组学数据集之间的关系,而压缩方法建立蛋白质组之间的关系和mRNA完全基于实验转录组和蛋白质组学数据集。gydF4y2Ba

一些改进的角度观察验证预测的神经网络模型相比,GBT模型。操纵子组与简历的百分比小于排列的简历相比,82%到89%的数据集1 GBT模型的75%到79%。操纵子组与简历的百分比小于变更履历数据集2 79%到89%的神经网络模型相比,75%到82%的GBT模型。数据集1组的百分比,百分比分数小于0.2 43%到57%的神经网络模型相比,36%到50%的GBT模型。数据集2组的百分比,百分比分数小于0.2 57%到61%在神经网络模型相比,32%到54%的GBT模型。数据集的确定系数是0.47到0.58 1和0.62到0.68的数据集2神经网络模型相比,0.39到0.58的两个数据集GBT模型,证明了人工神经网络模型可能是一个不错的选择在失踪的蛋白质组学分析值。gydF4y2Ba

3.5。分析因素归因于缺少蛋白质测量gydF4y2Ba

通过神经网络模型,大多数实验未被发现的蛋白质被预测蛋白质丰度大于1.0肽。这对我们这样诱惑调查可能的因素可以归结为丢失的蛋白值。为此,我们收集了一些蛋白质或信使rna / DNA序列的特性可能影响蛋白质检测能力以及实验转录组数据使用逻辑回归过程来确定它们的相对贡献蛋白质的检测能力gydF4y2Bad . vulagrisgydF4y2Ba基因组。特性/测量我们使用来自以下几个类别:(i)功能相关基因的表现度:实验mRNA丰富数据,gydF4y2Ba和CAI值(gydF4y2Ba33gydF4y2Ba,gydF4y2Ba34gydF4y2Ba),密码子使用如CR_axis1-CR_axis4、t3, c3作物,a3, g3, GC3s, GC含量(gydF4y2Ba35gydF4y2Ba];(2)功能相关的蛋白质和RNA稳定性:蛋白质不稳定指数和AliphaticIndex和最小自由能(MFE)的RNA (gydF4y2Ba35gydF4y2Ba];(3)功能相关蛋白溶解度:蛋白质溶解度大的平均指数等水疗法(肉汁)gydF4y2Ba33gydF4y2Ba];(iv)氨基酸AA_axis1-AA_axis4等使用,和其他如基因长度(gydF4y2Ba35gydF4y2Ba]。SAS软件包中的逻辑回归程序被用于实验的概率模型的蛋白质是否会检测到的基因/蛋白特性和测量。逐步选择法选择那些最有影响力的因素表明缺少蛋白质组学价值。自动删除这些高度相关的特性。0.05意义阈值用于逐步选择。mRNA丰度和基因长度值都log2转换过程中使用。蛋白质稳定指数、aliphaticIndex和gydF4y2Ba值除以10,CAI, N_MFE,肉汁,AA_axis1-AA_axis4, CR_axis1-CR_axis4都乘以10,比例为1。这个标准不会改变结果,但简化的结果。gydF4y2Ba

表gydF4y2Ba2gydF4y2Ba和gydF4y2Ba3gydF4y2Ba现在每个数据集的选择因素的优势比数据集1和2,分别。结果表明,高度相关的一些特性与失踪的蛋白质组的概率值。对于数据集1,发现7个因素的回归模型。积极的特性(即与失踪的蛋白质组的概率值。,when the features/measurement increase), protein instability index which provides an estimate of the stability of a given protein in a test tube [38gydF4y2Ba)被发现是最重要的因素为所有三个生长条件,和aliphaticIndex被认为是一种积极因素增加的球状蛋白质的热稳定性(gydF4y2Ba39gydF4y2Ba),发现了显著的增长条件会和FL,但不是条件LS。此外,AA_axis2和CR_axis3强烈相关肉汁和g3,分别和他们也发现在所有三个重要的增长条件,而对LS N_MFE只是重要条件(表gydF4y2Ba2gydF4y2Ba)。数据集2的特性在回归模型更相同的数据集1中的三个生长条件,表明这些因素在实验平台上可以通用。六个功能重要数据集1也发现所有的条件和影响概率的关键方向相同数据集2包括mRNA丰富,蛋白质不稳定指数,基因长度,gydF4y2Ba、CAI和AA_axis2对应肉汁(表gydF4y2Ba3gydF4y2Ba)。一般来说,较小的分析表明,这些蛋白质mRNA表达值,小gydF4y2Ba价值,更高的蛋白质不稳定指数,或aliphaticIndex价值高,有更大的概率失踪的蛋白质组值gydF4y2Bad .寻常的gydF4y2Ba数据集。在此基础上初步分析,可以应用逻辑回归模型来预测给定的蛋白质是否会或不会被发现通过选择一个合适的阈值对预测概率。gydF4y2Ba


数据集1gydF4y2Ba	噢gydF4y2Ba			FLgydF4y2Ba			LSgydF4y2Ba
效果gydF4y2Ba	点估计gydF4y2Ba	瓦尔德的95%置信区间gydF4y2Ba		点估计gydF4y2Ba	瓦尔德的95%置信区间gydF4y2Ba		点估计gydF4y2Ba	瓦尔德的95%置信区间gydF4y2Ba

log2 mRNA的gydF4y2Ba	0.458gydF4y2Ba	0.405gydF4y2Ba	0.517gydF4y2Ba	0.442gydF4y2Ba	0.392gydF4y2Ba	0.499gydF4y2Ba	0.405gydF4y2Ba	0.348gydF4y2Ba	0.471gydF4y2Ba
蛋白质不稳定指数/ 10gydF4y2Ba	1.628gydF4y2Ba	1.379gydF4y2Ba	1.922gydF4y2Ba	1.493gydF4y2Ba	1.282gydF4y2Ba	1.739gydF4y2Ba	1.539gydF4y2Ba	1.297gydF4y2Ba	1.825gydF4y2Ba
log2基因长度的gydF4y2Ba	0.477gydF4y2Ba	0.373gydF4y2Ba	0.608gydF4y2Ba	0.517gydF4y2Ba	0.415gydF4y2Ba	0.644gydF4y2Ba	0.419gydF4y2Ba	0.324gydF4y2Ba	0.543gydF4y2Ba
数控gydF4y2Ba/ 10gydF4y2Ba	0.465gydF4y2Ba	0.271gydF4y2Ba	0.798gydF4y2Ba	0.446gydF4y2Ba	0.272gydF4y2Ba	0.732gydF4y2Ba	0.314gydF4y2Ba	0.174gydF4y2Ba	0.566gydF4y2Ba
蔡* 10gydF4y2Ba	0.295gydF4y2Ba	0.212gydF4y2Ba	0.410gydF4y2Ba	0.275gydF4y2Ba	0.204gydF4y2Ba	0.370gydF4y2Ba	0.222gydF4y2Ba	0.155gydF4y2Ba	0.319gydF4y2Ba
AA_axis2 * 10gydF4y2Ba	1.368gydF4y2Ba	1.193gydF4y2Ba	1.569gydF4y2Ba	1.326gydF4y2Ba	1.170gydF4y2Ba	1.502gydF4y2Ba	1.323gydF4y2Ba	1.166gydF4y2Ba	1.501gydF4y2Ba
CR_axis3 * 10gydF4y2Ba	1.264gydF4y2Ba	1.046gydF4y2Ba	1.528gydF4y2Ba	1.309gydF4y2Ba	1.112gydF4y2Ba	1.541gydF4y2Ba	1.327gydF4y2Ba	1.092gydF4y2Ba	1.613gydF4y2Ba
N_MFE * 10gydF4y2Ba	- - - - - -gydF4y2Ba	- - - - - -gydF4y2Ba	- - - - - -gydF4y2Ba	- - - - - -gydF4y2Ba	- - - - - -gydF4y2Ba	- - - - - -gydF4y2Ba	1.880gydF4y2Ba	1.178gydF4y2Ba	3.000gydF4y2Ba
AliphaticIndex / 10gydF4y2Ba	1.140gydF4y2Ba	1.013gydF4y2Ba	1.282gydF4y2Ba	1.160gydF4y2Ba	1.040gydF4y2Ba	1.294gydF4y2Ba	- - - - - -gydF4y2Ba	- - - - - -gydF4y2Ba	- - - - - -gydF4y2Ba


数据集2gydF4y2Ba	CT0gydF4y2Ba			CT120gydF4y2Ba			ST120gydF4y2Ba
效果gydF4y2Ba	点估计gydF4y2Ba	瓦尔德的95%置信区间gydF4y2Ba		点估计gydF4y2Ba	瓦尔德的95%置信区间gydF4y2Ba		点估计gydF4y2Ba	瓦尔德的95%置信区间gydF4y2Ba

log2 mRNA的gydF4y2Ba	0.407gydF4y2Ba	0.370gydF4y2Ba	0.448gydF4y2Ba	0.451gydF4y2Ba	0.412gydF4y2Ba	0.494gydF4y2Ba	0.499gydF4y2Ba	0.459gydF4y2Ba	0.542gydF4y2Ba
蛋白质不稳定指数/ 10gydF4y2Ba	1.310gydF4y2Ba	1.161gydF4y2Ba	1.478gydF4y2Ba	1.283gydF4y2Ba	1.140gydF4y2Ba	1.444gydF4y2Ba	1.264gydF4y2Ba	1.124gydF4y2Ba	1.421gydF4y2Ba
log2基因长度的gydF4y2Ba	0.261gydF4y2Ba	0.216gydF4y2Ba	0.315gydF4y2Ba	0.287gydF4y2Ba	0.240gydF4y2Ba	0.345gydF4y2Ba	0.294gydF4y2Ba	0.247gydF4y2Ba	0.352gydF4y2Ba
数控gydF4y2Ba/ 10gydF4y2Ba	0.512gydF4y2Ba	0.336gydF4y2Ba	0.780gydF4y2Ba	0.518gydF4y2Ba	0.343gydF4y2Ba	0.783gydF4y2Ba	0.552gydF4y2Ba	0.374gydF4y2Ba	0.815gydF4y2Ba
肉汁* 10gydF4y2Ba	0.914gydF4y2Ba	0.862gydF4y2Ba	0.970gydF4y2Ba	0.914gydF4y2Ba	0.863gydF4y2Ba	0.968gydF4y2Ba	0.923gydF4y2Ba	0.873gydF4y2Ba	0.977gydF4y2Ba
蔡* 10gydF4y2Ba	0.599gydF4y2Ba	0.421gydF4y2Ba	0.851gydF4y2Ba	0.559gydF4y2Ba	0.398gydF4y2Ba	0.786gydF4y2Ba	0.536gydF4y2Ba	0.384gydF4y2Ba	0.749gydF4y2Ba
AA_axis1 * 10gydF4y2Ba	0.686gydF4y2Ba	0.627gydF4y2Ba	0.750gydF4y2Ba	0.681gydF4y2Ba	0.624gydF4y2Ba	0.744gydF4y2Ba	0.686gydF4y2Ba	0.629gydF4y2Ba	0.749gydF4y2Ba
AA_axis2 * 10gydF4y2Ba	1.811gydF4y2Ba	1.558gydF4y2Ba	2.106gydF4y2Ba	1.721gydF4y2Ba	1.487gydF4y2Ba	1.990gydF4y2Ba	1.674gydF4y2Ba	1.452gydF4y2Ba	1.931gydF4y2Ba
AA_axis4 * 10gydF4y2Ba	0.827gydF4y2Ba	0.747gydF4y2Ba	0.916gydF4y2Ba	0.837gydF4y2Ba	0.757gydF4y2Ba	0.925gydF4y2Ba	0.846gydF4y2Ba	0.767gydF4y2Ba	0.934gydF4y2Ba
CR_axis1 * 10gydF4y2Ba	0.771gydF4y2Ba	0.647gydF4y2Ba	0.919gydF4y2Ba	0.780gydF4y2Ba	0.657gydF4y2Ba	0.925gydF4y2Ba	0.781gydF4y2Ba	0.660gydF4y2Ba	0.923gydF4y2Ba
CR_axis4 * 10gydF4y2Ba	0.716gydF4y2Ba	0.635gydF4y2Ba	0.808gydF4y2Ba	0.706gydF4y2Ba	0.627gydF4y2Ba	0.795gydF4y2Ba	0.725gydF4y2Ba	0.645gydF4y2Ba	0.814gydF4y2Ba

3.6。数据解释使用估算的数据集gydF4y2Ba

总共有308 - 354蛋白实验确定数据集1,和986 - 1001蛋白实验确定了数据集2,略超过整个蛋白质组的10 - 30%gydF4y2Bad .寻常的gydF4y2Ba。通过ANN建模和归责通过整合转录组和蛋白质组数据,我们可以将丰度值分配给大约33 - 3400蛋白(依赖于生长条件),约96 - 98%的整个蛋白质组gydF4y2Bad .寻常的gydF4y2Ba。使用估算的数据集,我们首先分析了蛋白质时参与能量代谢gydF4y2Bad .寻常的gydF4y2Ba生长在三个培养条件(我Lactate-based指数增长阶段;LS: Lactate-based增长在固定相;在指数期FL: Formate-based增长)。如表所示gydF4y2Ba4gydF4y2Ba等蛋白质参与能量代谢,甚至ATP合酶通常表示在相对较高的水平,明显缺少蛋白质组数据仍是明显的在实验数据集,9个国家中只有两个假定的ATP合酶蛋白质实验发现在三个生长条件。通过分析估算蛋白质丰富的所有假定的ATP合酶蛋白,观察差别明显的趋势对这些LS和FL条件与我相比条件,这是符合前面的数据表明乳酸是一种良好的电子供体gydF4y2Bad .寻常的gydF4y2Ba(gydF4y2Ba22gydF4y2Ba]。当比较lactate-based增长与formate-based指数期,我们发现酶甲酸利用预测调节甲酸在增长(表gydF4y2Ba4gydF4y2Ba)。据报道,c -型细胞色素在硫酸盐还原细菌中表达的高度gydF4y2Ba20.gydF4y2Ba),然而,只有少量的c -型细胞色素蛋白质已确定gydF4y2Bad .寻常的gydF4y2Ba蛋白质组(表gydF4y2Ba4gydF4y2Ba),可能由于c -型细胞色素进行复杂的转译后的成熟过程包括共价连接的血红素组(gydF4y2Ba40gydF4y2Ba]。通过ANN模型显著预测在各种细胞色素c的表达蛋白质gydF4y2Bad .寻常的gydF4y2Ba在三个条件下生长。一般来说,细胞色素c蛋白预测有较高的表达在指数期乳酸和formate-based媒体比固定相,符合他们的重要角色在快速增长的电子转移(gydF4y2Ba20.gydF4y2Ba]。两个细胞质氢化酶(电解珩磨和首席运营官)以前分配的假定的功能生成氢在细胞质中gydF4y2Ba20.gydF4y2Ba]。与之前的预测相一致的压缩模式gydF4y2Ba18gydF4y2Ba),ANN模型预测,所有子单元的电解珩磨氢化酶(EchACDE)调节,当所有子单元的首席运营官氢化酶(CooHLUX)对formate-based增长被抑制,表明他们在H微分作用gydF4y2Ba_2gydF4y2Ba一代成长时不同的碳源。我们也使用了估算数据分析时的应激反应gydF4y2Bad .寻常的gydF4y2Ba盐胁迫下细胞治疗。某些蛋白质的分析允许鉴定没有实验发现,然而,被预测调节盐处理条件下(ST120)与控制(CT120)(表gydF4y2Ba5gydF4y2Ba)。其中有多药耐药性转运蛋白和各种蛋白质和一些信号转导蛋白。这个列表的蛋白质可以作为公认的候选人为进一步实验验证。一般来说,我们的分析表明,生物的解释可能受益于使用计算方法将丢失的数据通过整合时间转录组和蛋白质组数据。所有protein-abundance预测蛋白质的完整列表提供了表2的补充材料。gydF4y2Ba


Gene_IDgydF4y2Ba	蛋白质abundance-Predicted-LL条件gydF4y2Ba	RNA abundance-Measured-LL条件gydF4y2Ba	蛋白质abundance-Measured-LL条件gydF4y2Ba	蛋白质abundance-Predicted-LS条件gydF4y2Ba	RNA abundance-Measured-LS条件gydF4y2Ba	蛋白质abundance-Measured-LS条件gydF4y2Ba	蛋白质abundance-Predicted-FL条件gydF4y2Ba	RNA abundance-Measured-FL条件gydF4y2Ba	蛋白质abundance-Measured-FL条件gydF4y2Ba	描述gydF4y2Ba

DVU0918gydF4y2Ba	10.08gydF4y2Ba	2315.20gydF4y2Ba	xgydF4y2Ba	2.46gydF4y2Ba	416.75gydF4y2Ba	xgydF4y2Ba	5.71gydF4y2Ba	1668.90gydF4y2Ba	xgydF4y2Ba	ATP合酶F0、亚基(gydF4y2BaatpBgydF4y2Ba)gydF4y2Ba
DVU0779gydF4y2Ba	6.55gydF4y2Ba	2505.40gydF4y2Ba	xgydF4y2Ba	3.30gydF4y2Ba	497.75gydF4y2Ba	xgydF4y2Ba	5.08gydF4y2Ba	1397.10gydF4y2Ba	xgydF4y2Ba	ATP合酶F0, B亚基gydF4y2Ba
DVU0780gydF4y2Ba	6.62gydF4y2Ba	3156.20gydF4y2Ba	xgydF4y2Ba	3.88gydF4y2Ba	1050.10gydF4y2Ba	xgydF4y2Ba	5.81gydF4y2Ba	2352.70gydF4y2Ba	xgydF4y2Ba	ATP合酶F0, B亚基gydF4y2Ba
DVU0917gydF4y2Ba	7.60gydF4y2Ba	6086.50gydF4y2Ba	xgydF4y2Ba	3.85gydF4y2Ba	1234.90gydF4y2Ba	xgydF4y2Ba	10.85gydF4y2Ba	5944.40gydF4y2Ba	xgydF4y2Ba	ATP合酶F0, C亚基(gydF4y2BaatpEgydF4y2Ba)gydF4y2Ba
DVU0920gydF4y2Ba	3.80gydF4y2Ba	1590.50gydF4y2Ba	xgydF4y2Ba	3.59gydF4y2Ba	947.88gydF4y2Ba	xgydF4y2Ba	5.75gydF4y2Ba	1198.20gydF4y2Ba	xgydF4y2Ba	ATP合酶蛋白I (gydF4y2BaatpIgydF4y2Ba)gydF4y2Ba
DVU0777gydF4y2Ba	39.24gydF4y2Ba	2535.00gydF4y2Ba	20.00gydF4y2Ba	8.40gydF4y2Ba	369.95gydF4y2Ba	8.00gydF4y2Ba	17.76gydF4y2Ba	735.68gydF4y2Ba	17.33gydF4y2Ba	ATP合酶,F1α亚基(gydF4y2BaatpAgydF4y2Ba)gydF4y2Ba
DVU0775gydF4y2Ba	50.11gydF4y2Ba	2228.60gydF4y2Ba	49.33gydF4y2Ba	23.76gydF4y2Ba	711.53gydF4y2Ba	30.33gydF4y2Ba	39.80gydF4y2Ba	1198.40gydF4y2Ba	38.33gydF4y2Ba	ATP合酶,F1β亚基(gydF4y2BaatpDgydF4y2Ba)gydF4y2Ba
DVU0778gydF4y2Ba	4.25gydF4y2Ba	1974.50gydF4y2Ba	xgydF4y2Ba	2.71gydF4y2Ba	374.22gydF4y2Ba	xgydF4y2Ba	3.21gydF4y2Ba	714.57gydF4y2Ba	xgydF4y2Ba	ATP合酶,F1δ亚基(gydF4y2BaatpHgydF4y2Ba)gydF4y2Ba
DVU0774gydF4y2Ba	4.85gydF4y2Ba	2043.70gydF4y2Ba	xgydF4y2Ba	2.32gydF4y2Ba	336.55gydF4y2Ba	xgydF4y2Ba	4.14gydF4y2Ba	1113.40gydF4y2Ba	xgydF4y2Ba	ATP合酶,F1ε亚基(gydF4y2BaatpCgydF4y2Ba)gydF4y2Ba
DVU0702gydF4y2Ba	2.62gydF4y2Ba	288.72gydF4y2Ba	xgydF4y2Ba	2.20gydF4y2Ba	372.82gydF4y2Ba	xgydF4y2Ba	2.05gydF4y2Ba	417.68gydF4y2Ba	1.00gydF4y2Ba	细胞色素c家族蛋白gydF4y2Ba
DVU0922gydF4y2Ba	1.69gydF4y2Ba	66.60gydF4y2Ba	xgydF4y2Ba	1.85gydF4y2Ba	149.38gydF4y2Ba	xgydF4y2Ba	1.49gydF4y2Ba	149.52gydF4y2Ba	xgydF4y2Ba	细胞色素c家族蛋白gydF4y2Ba
DVU1288gydF4y2Ba	3.44gydF4y2Ba	1172.20gydF4y2Ba	xgydF4y2Ba	2.06gydF4y2Ba	298.10gydF4y2Ba	xgydF4y2Ba	3.12gydF4y2Ba	826.90gydF4y2Ba	xgydF4y2Ba	细胞色素c家族蛋白gydF4y2Ba
DVU2483gydF4y2Ba	10.24gydF4y2Ba	456.23gydF4y2Ba	xgydF4y2Ba	3.24gydF4y2Ba	284.22gydF4y2Ba	xgydF4y2Ba	7.36gydF4y2Ba	490.33gydF4y2Ba	xgydF4y2Ba	细胞色素c家族蛋白gydF4y2Ba
DVU2484gydF4y2Ba	5.06gydF4y2Ba	575.50gydF4y2Ba	xgydF4y2Ba	2.39gydF4y2Ba	277.35gydF4y2Ba	xgydF4y2Ba	4.63gydF4y2Ba	665.95gydF4y2Ba	xgydF4y2Ba	细胞色素c家族蛋白gydF4y2Ba
DVU2791gydF4y2Ba	4.77gydF4y2Ba	683.65gydF4y2Ba	xgydF4y2Ba	2.61gydF4y2Ba	530.00gydF4y2Ba	xgydF4y2Ba	3.32gydF4y2Ba	667.05gydF4y2Ba	xgydF4y2Ba	细胞色素c家族蛋白gydF4y2Ba
DVU3107gydF4y2Ba	15.10gydF4y2Ba	1009.30gydF4y2Ba	2.33gydF4y2Ba	2.98gydF4y2Ba	177.15gydF4y2Ba	1.67gydF4y2Ba	13.04gydF4y2Ba	1026.30gydF4y2Ba	3.00gydF4y2Ba	细胞色素c家族蛋白gydF4y2Ba
DVU3144gydF4y2Ba	5.58gydF4y2Ba	297.85gydF4y2Ba	xgydF4y2Ba	3.58gydF4y2Ba	142.45gydF4y2Ba	xgydF4y2Ba	8.24gydF4y2Ba	342.52gydF4y2Ba	xgydF4y2Ba	细胞色素c家族蛋白gydF4y2Ba
DVU0625gydF4y2Ba	30.20gydF4y2Ba	1822.80gydF4y2Ba	xgydF4y2Ba	14.80gydF4y2Ba	764.85gydF4y2Ba	xgydF4y2Ba	16.61gydF4y2Ba	2467.50gydF4y2Ba	xgydF4y2Ba	细胞色素c亚硝酸还原酶,催化亚基NfrAgydF4y2Ba
DVU1815gydF4y2Ba	4.91gydF4y2Ba	439.87gydF4y2Ba	xgydF4y2Ba	2.98gydF4y2Ba	324.93gydF4y2Ba	xgydF4y2Ba	7.12gydF4y2Ba	833.88gydF4y2Ba	xgydF4y2Ba	细胞色素c氧化酶亚基gydF4y2Ba
DVU1812gydF4y2Ba	4.42gydF4y2Ba	304.57gydF4y2Ba	xgydF4y2Ba	2.72gydF4y2Ba	215.70gydF4y2Ba	xgydF4y2Ba	4.63gydF4y2Ba	335.70gydF4y2Ba	xgydF4y2Ba	细胞色素c氧化酶亚基二世gydF4y2Ba
DVU1814gydF4y2Ba	2.53gydF4y2Ba	397.35gydF4y2Ba	xgydF4y2Ba	2.31gydF4y2Ba	283.90gydF4y2Ba	xgydF4y2Ba	3.80gydF4y2Ba	898.67gydF4y2Ba	xgydF4y2Ba	细胞色素c氧化酶亚基IIIgydF4y2Ba
DVU2809gydF4y2Ba	3.11gydF4y2Ba	447.42gydF4y2Ba	xgydF4y2Ba	2.32gydF4y2Ba	395.15gydF4y2Ba	xgydF4y2Ba	2.10gydF4y2Ba	601.50gydF4y2Ba	xgydF4y2Ba	细胞色素c3gydF4y2Ba
DVU3171gydF4y2Ba	13.24gydF4y2Ba	3937.00gydF4y2Ba	3.33gydF4y2Ba	5.24gydF4y2Ba	966.25gydF4y2Ba	xgydF4y2Ba	11.82gydF4y2Ba	5719.20gydF4y2Ba	1.00gydF4y2Ba	细胞色素c3gydF4y2Ba
DVU2524gydF4y2Ba	1.77gydF4y2Ba	114.95gydF4y2Ba	xgydF4y2Ba	2.08gydF4y2Ba	135.07gydF4y2Ba	xgydF4y2Ba	1.61gydF4y2Ba	170.70gydF4y2Ba	xgydF4y2Ba	细胞色素c3,gydF4y2Ba
DVU3041gydF4y2Ba	3.03gydF4y2Ba	894.60gydF4y2Ba	xgydF4y2Ba	2.62gydF4y2Ba	713.10gydF4y2Ba	xgydF4y2Ba	2.73gydF4y2Ba	684.27gydF4y2Ba	xgydF4y2Ba	细胞色素c553gydF4y2Ba
DVU1817gydF4y2Ba	6.34gydF4y2Ba	2280.00gydF4y2Ba	11.67gydF4y2Ba	7.26gydF4y2Ba	1858.20gydF4y2Ba	3.33gydF4y2Ba	9.61gydF4y2Ba	5400.20gydF4y2Ba	12.00gydF4y2Ba	细胞色素c - 553 (gydF4y2BacyfgydF4y2Ba)gydF4y2Ba
DVU1048gydF4y2Ba	2.31gydF4y2Ba	255.07gydF4y2Ba	xgydF4y2Ba	2.14gydF4y2Ba	243.58gydF4y2Ba	xgydF4y2Ba	1.53gydF4y2Ba	185.47gydF4y2Ba	xgydF4y2Ba	细胞色素c -型生物起源蛋白质CcmB (gydF4y2BaccmBgydF4y2Ba)gydF4y2Ba
DVU1047gydF4y2Ba	2.87gydF4y2Ba	435.45gydF4y2Ba	xgydF4y2Ba	2.06gydF4y2Ba	284.87gydF4y2Ba	xgydF4y2Ba	2.23gydF4y2Ba	259.25gydF4y2Ba	xgydF4y2Ba	细胞色素c -型生物起源蛋白质CcmC (gydF4y2BaccmCgydF4y2Ba)gydF4y2Ba
DVU1051gydF4y2Ba	3.30gydF4y2Ba	915.92gydF4y2Ba	xgydF4y2Ba	3.59gydF4y2Ba	769.45gydF4y2Ba	xgydF4y2Ba	4.19gydF4y2Ba	732.07gydF4y2Ba	xgydF4y2Ba	细胞色素c -型生物起源蛋白质CcmE (gydF4y2BaccmEgydF4y2Ba)gydF4y2Ba
DVU1050gydF4y2Ba	7.42gydF4y2Ba	581.02gydF4y2Ba	xgydF4y2Ba	4.03gydF4y2Ba	408.20gydF4y2Ba	xgydF4y2Ba	6.27gydF4y2Ba	463.25gydF4y2Ba	xgydF4y2Ba	细胞色素c -型生物起源蛋白质CcmF (gydF4y2BaccmFgydF4y2Ba)gydF4y2Ba
DVU3271gydF4y2Ba	35.79gydF4y2Ba	8217.80gydF4y2Ba	xgydF4y2Ba	12.15gydF4y2Ba	2295.10gydF4y2Ba	xgydF4y2Ba	11.38gydF4y2Ba	6954.00gydF4y2Ba	xgydF4y2Ba	细胞色素d泛醇氧化酶亚基我(gydF4y2BacydAgydF4y2Ba)gydF4y2Ba
DVU3270gydF4y2Ba	18.09gydF4y2Ba	3877.70gydF4y2Ba	xgydF4y2Ba	5.50gydF4y2Ba	1145.70gydF4y2Ba	xgydF4y2Ba	13.90gydF4y2Ba	3897.10gydF4y2Ba	xgydF4y2Ba	细胞色素d泛醇氧化酶亚基二世(gydF4y2BacydBgydF4y2Ba)gydF4y2Ba
DVU0434gydF4y2Ba	1.28gydF4y2Ba	177.22gydF4y2Ba	xgydF4y2Ba	2.79gydF4y2Ba	168.72gydF4y2Ba	xgydF4y2Ba	5.13gydF4y2Ba	468.00gydF4y2Ba	xgydF4y2Ba	决定自氢化酶亚基EchAgydF4y2Ba
DVU0433gydF4y2Ba	2.10gydF4y2Ba	217.82gydF4y2Ba	xgydF4y2Ba	2.34gydF4y2Ba	166.95gydF4y2Ba	xgydF4y2Ba	2.84gydF4y2Ba	422.28gydF4y2Ba	xgydF4y2Ba	决定自氢化酶亚基EchBgydF4y2Ba
DVU0432gydF4y2Ba	2.11gydF4y2Ba	222.90gydF4y2Ba	xgydF4y2Ba	2.24gydF4y2Ba	133.13gydF4y2Ba	xgydF4y2Ba	3.12gydF4y2Ba	595.60gydF4y2Ba	xgydF4y2Ba	决定自氢化酶亚基EchCgydF4y2Ba
DVU0431gydF4y2Ba	2.20gydF4y2Ba	303.27gydF4y2Ba	xgydF4y2Ba	2.03gydF4y2Ba	215.73gydF4y2Ba	xgydF4y2Ba	3.30gydF4y2Ba	778.70gydF4y2Ba	xgydF4y2Ba	决定自氢化酶亚基EchDgydF4y2Ba
DVU0430gydF4y2Ba	2.68gydF4y2Ba	259.00gydF4y2Ba	xgydF4y2Ba	2.52gydF4y2Ba	199.20gydF4y2Ba	xgydF4y2Ba	4.61gydF4y2Ba	685.78gydF4y2Ba	xgydF4y2Ba	决定自氢化酶亚基EchEgydF4y2Ba
DVU0429gydF4y2Ba	2.24gydF4y2Ba	239.03gydF4y2Ba	xgydF4y2Ba	2.07gydF4y2Ba	201.57gydF4y2Ba	xgydF4y2Ba	2.05gydF4y2Ba	405.30gydF4y2Ba	xgydF4y2Ba	决定自氢化酶亚基EchFgydF4y2Ba
DVU2824gydF4y2Ba	0.90gydF4y2Ba	124.20gydF4y2Ba	xgydF4y2Ba	3.54gydF4y2Ba	106.78gydF4y2Ba	xgydF4y2Ba	9.30gydF4y2Ba	102.10gydF4y2Ba	xgydF4y2Ba	甲酸乙酰转移酶gydF4y2Ba
DVU2272gydF4y2Ba	1.05gydF4y2Ba	97.08gydF4y2Ba	xgydF4y2Ba	3.69gydF4y2Ba	113.33gydF4y2Ba	1.00gydF4y2Ba	16.21gydF4y2Ba	160.88gydF4y2Ba	xgydF4y2Ba	甲酸乙酰转移酶gydF4y2Ba
DVU0578gydF4y2Ba	2.11gydF4y2Ba	154.12gydF4y2Ba	xgydF4y2Ba	2.23gydF4y2Ba	217.48gydF4y2Ba	xgydF4y2Ba	2.03gydF4y2Ba	247.52gydF4y2Ba	xgydF4y2Ba	甲酸脱氢酶蛋白质FdhD配件gydF4y2Ba
DVU0577gydF4y2Ba	2.56gydF4y2Ba	237.93gydF4y2Ba	xgydF4y2Ba	2.29gydF4y2Ba	148.02gydF4y2Ba	xgydF4y2Ba	1.97gydF4y2Ba	513.40gydF4y2Ba	xgydF4y2Ba	甲酸脱氢酶蛋白FdhE形成gydF4y2Ba
DVU2810gydF4y2Ba	3.39gydF4y2Ba	423.00gydF4y2Ba	xgydF4y2Ba	2.27gydF4y2Ba	312.02gydF4y2Ba	xgydF4y2Ba	2.47gydF4y2Ba	510.12gydF4y2Ba	xgydF4y2Ba	甲酸脱氢酶蛋白FdhE形成gydF4y2Ba
DVU0588gydF4y2Ba	0.92gydF4y2Ba	35.70gydF4y2Ba	xgydF4y2Ba	2.65gydF4y2Ba	35.25gydF4y2Ba	xgydF4y2Ba	1.26gydF4y2Ba	79.03gydF4y2Ba	xgydF4y2Ba	甲酸脱氢酶,β亚基gydF4y2Ba
DVU2481gydF4y2Ba	2.39gydF4y2Ba	227.43gydF4y2Ba	xgydF4y2Ba	2.37gydF4y2Ba	304.92gydF4y2Ba	xgydF4y2Ba	2.35gydF4y2Ba	399.82gydF4y2Ba	xgydF4y2Ba	甲酸脱氢酶,β亚基gydF4y2Ba
DVU2811gydF4y2Ba	3.22gydF4y2Ba	335.33gydF4y2Ba	xgydF4y2Ba	2.52gydF4y2Ba	181.45gydF4y2Ba	xgydF4y2Ba	3.13gydF4y2Ba	435.95gydF4y2Ba	xgydF4y2Ba	甲酸脱氢酶,β亚基gydF4y2Ba
DVU2288gydF4y2Ba	2.68gydF4y2Ba	781.45gydF4y2Ba	xgydF4y2Ba	2.24gydF4y2Ba	412.85gydF4y2Ba	xgydF4y2Ba	1.39gydF4y2Ba	139.17gydF4y2Ba	xgydF4y2Ba	氢化酶,冷却单元gydF4y2Ba
DVU2286gydF4y2Ba	16.67gydF4y2Ba	308.33gydF4y2Ba	xgydF4y2Ba	3.29gydF4y2Ba	138.72gydF4y2Ba	xgydF4y2Ba	6.08gydF4y2Ba	81.55gydF4y2Ba	xgydF4y2Ba	氢化酶,锯屑子单元gydF4y2Ba
DVU2290gydF4y2Ba	2.84gydF4y2Ba	703.22gydF4y2Ba	3.00gydF4y2Ba	2.10gydF4y2Ba	316.45gydF4y2Ba	3.00gydF4y2Ba			xgydF4y2Ba	氢化酶,CooU亚基gydF4y2Ba
DVU2289gydF4y2Ba	3.92gydF4y2Ba	823.18gydF4y2Ba	xgydF4y2Ba	2.14gydF4y2Ba	553.33gydF4y2Ba	xgydF4y2Ba	2.36gydF4y2Ba	319.80gydF4y2Ba	xgydF4y2Ba	氢化酶,CooX亚基gydF4y2Ba

*蛋白质丰度在肽;RNA富足是在原始荧光测量微阵列。“x”表示蛋白质未被发现的实验。gydF4y2Ba


Gene_IDgydF4y2Ba	蛋白质abundance-Predicted-CT120gydF4y2Ba	RNA abundance-Measured-CT120gydF4y2Ba	蛋白质abundance-Measured-CT120gydF4y2Ba	蛋白质abundance-Predicted-ST120gydF4y2Ba	RNA abundance-Measured-ST120gydF4y2Ba	蛋白质abundance-Measured-ST120gydF4y2Ba	描述gydF4y2Ba

氨基酸生物合成gydF4y2Ba

DVU0285gydF4y2Ba	5.00gydF4y2Ba	3005.10gydF4y2Ba	xgydF4y2Ba	7.43gydF4y2Ba	4051.50gydF4y2Ba	xgydF4y2Ba	咪唑甘油磷酸合酶(gydF4y2BahisHgydF4y2Ba)gydF4y2Ba
DVU1665gydF4y2Ba	21.82gydF4y2Ba	20264.00gydF4y2Ba	xgydF4y2Ba	50.55gydF4y2Ba	30766.00gydF4y2Ba	xgydF4y2Ba	3-dehydroquinate脱水酶II型(gydF4y2BaaroQgydF4y2Ba)gydF4y2Ba

代数余子式的生物合成,修复组,和运营商gydF4y2Ba

DVU0157gydF4y2Ba	5.45gydF4y2Ba	7559.00gydF4y2Ba	xgydF4y2Ba	6.31gydF4y2Ba	5092.30gydF4y2Ba	xgydF4y2Ba	Thiamin-monophosphate激酶(gydF4y2BathiLgydF4y2Ba)gydF4y2Ba
DVU0931gydF4y2Ba	5.41gydF4y2Ba	1730.40gydF4y2Ba	xgydF4y2Ba	6.87gydF4y2Ba	4401.40gydF4y2Ba	xgydF4y2Ba	Phosphomethylpyrimidine激酶(gydF4y2BathiDgydF4y2Ba)gydF4y2Ba
DVU1200gydF4y2Ba	5.82gydF4y2Ba	5439.20gydF4y2Ba	xgydF4y2Ba	6.75gydF4y2Ba	5079.60gydF4y2Ba	xgydF4y2Ba	核黄素合酶、α亚基(gydF4y2Ba活性离子束腐蚀gydF4y2Ba)gydF4y2Ba
DVU2749gydF4y2Ba	2.85gydF4y2Ba	1427.30gydF4y2Ba	xgydF4y2Ba	3.59gydF4y2Ba	856.35gydF4y2Ba	xgydF4y2Ba	Precorrin-6Y C5, 15-methyltransferase(脱羧基)(gydF4y2BacobLgydF4y2Ba)gydF4y2Ba
DVU3307gydF4y2Ba	14.65gydF4y2Ba	20224.00gydF4y2Ba	xgydF4y2Ba	26.42gydF4y2Ba	30616.00gydF4y2Ba	xgydF4y2Ba	3-octaprenyl-4-hydroxybenzoate carboxy-lyase (gydF4y2BaubiXgydF4y2Ba)gydF4y2Ba

细胞被膜gydF4y2Ba

DVU0294gydF4y2Ba	2.44gydF4y2Ba	1034.50gydF4y2Ba	xgydF4y2Ba	3.15gydF4y2Ba	726.82gydF4y2Ba	xgydF4y2Ba	糖基转移酶,组2家族蛋白gydF4y2Ba
DVU0308gydF4y2Ba	2.97gydF4y2Ba	1552.00gydF4y2Ba	xgydF4y2Ba	7.93gydF4y2Ba	6986.70gydF4y2Ba	xgydF4y2Ba	膜蛋白gydF4y2Ba
DVU0328gydF4y2Ba	8.59gydF4y2Ba	5628.30gydF4y2Ba	xgydF4y2Ba	9.12gydF4y2Ba	5042.40gydF4y2Ba	xgydF4y2Ba	糖基转移酶,蛋白质组1的家庭gydF4y2Ba
DVU0407gydF4y2Ba	26.65gydF4y2Ba	20237.00gydF4y2Ba	xgydF4y2Ba	38.70gydF4y2Ba	32568.00gydF4y2Ba	xgydF4y2Ba	罕见的脂蛋白家族蛋白gydF4y2Ba
DVU1534gydF4y2Ba	2.48gydF4y2Ba	1792.60gydF4y2Ba	xgydF4y2Ba	3.56gydF4y2Ba	2183.30gydF4y2Ba	xgydF4y2Ba	膜蛋白gydF4y2Ba
DVU2053gydF4y2Ba	2.98gydF4y2Ba	2406.60gydF4y2Ba	xgydF4y2Ba	3.85gydF4y2Ba	2507.60gydF4y2Ba	xgydF4y2Ba	膜蛋白gydF4y2Ba
DVU2102gydF4y2Ba	2.91gydF4y2Ba	628.30gydF4y2Ba	xgydF4y2Ba	3.88gydF4y2Ba	843.26gydF4y2Ba	xgydF4y2Ba	外膜蛋白质,OMP85家庭gydF4y2Ba
DVU2356gydF4y2Ba	20.54gydF4y2Ba	6021.30gydF4y2Ba	xgydF4y2Ba	36.26gydF4y2Ba	7883.90gydF4y2Ba	xgydF4y2Ba	膜蛋白gydF4y2Ba
DVU2672gydF4y2Ba	3.30gydF4y2Ba	3253.30gydF4y2Ba	xgydF4y2Ba	4.47gydF4y2Ba	5875.90gydF4y2Ba	xgydF4y2Ba	膜蛋白gydF4y2Ba
DVU2725gydF4y2Ba	5.20gydF4y2Ba	4925.80gydF4y2Ba	xgydF4y2Ba	13.97gydF4y2Ba	8894.70gydF4y2Ba	xgydF4y2Ba	膜蛋白gydF4y2Ba

细胞过程gydF4y2Ba

DVU0302gydF4y2Ba	28.35gydF4y2Ba	22358.00gydF4y2Ba	xgydF4y2Ba	37.21gydF4y2Ba	21180.00gydF4y2Ba	xgydF4y2Ba	趋化性蛋白质CheXgydF4y2Ba
DVU2069gydF4y2Ba	2.18gydF4y2Ba	811.21gydF4y2Ba	xgydF4y2Ba	3.72gydF4y2Ba	658.60gydF4y2Ba	xgydF4y2Ba	DNA处理蛋白质DprAgydF4y2Ba
DVU2816gydF4y2Ba	4.82gydF4y2Ba	539.18gydF4y2Ba	xgydF4y2Ba	8.65gydF4y2Ba	1502.80gydF4y2Ba	xgydF4y2Ba	多药耐药性的蛋白质gydF4y2Ba
DVU2893gydF4y2Ba	4.59gydF4y2Ba	9413.30gydF4y2Ba	xgydF4y2Ba	6.78gydF4y2Ba	9241.60gydF4y2Ba	xgydF4y2Ba	鞭毛基体杆蛋白质gydF4y2Ba
DVU3326gydF4y2Ba	3.13gydF4y2Ba	782.67gydF4y2Ba	xgydF4y2Ba	3.68gydF4y2Ba	2732.60gydF4y2Ba	xgydF4y2Ba	鼻中隔黏膜下切除术后多药耐药性蛋白质家族gydF4y2Ba
DVUA0002gydF4y2Ba	5.53gydF4y2Ba	2257.50gydF4y2Ba	xgydF4y2Ba	12.96gydF4y2Ba	6384.00gydF4y2Ba	xgydF4y2Ba	帕拉家族的蛋白质gydF4y2Ba
DNA代谢gydF4y2Ba

DVU0878gydF4y2Ba	3.20gydF4y2Ba	1967.30gydF4y2Ba	xgydF4y2Ba	7.13gydF4y2Ba	11149.00gydF4y2Ba	xgydF4y2Ba	dnaK抑制蛋白gydF4y2Ba
DVU1353gydF4y2Ba	2.26gydF4y2Ba	1516.00gydF4y2Ba	xgydF4y2Ba	10.31gydF4y2Ba	868.27gydF4y2Ba	xgydF4y2Ba	DNA聚合酶III,α亚基(gydF4y2BadnaEgydF4y2Ba)gydF4y2Ba
DVU1703gydF4y2Ba	1.93gydF4y2Ba	906.31gydF4y2Ba	xgydF4y2Ba	2.69gydF4y2Ba	628.53gydF4y2Ba	xgydF4y2Ba	I型restriction-modification酶,R单元gydF4y2Ba

能量代谢gydF4y2Ba

DVU0080gydF4y2Ba	4.42gydF4y2Ba	2476.60gydF4y2Ba	xgydF4y2Ba	6.45gydF4y2Ba	5175.70gydF4y2Ba	xgydF4y2Ba	延胡索酸酯酶、类二世(gydF4y2BafumCgydF4y2Ba)gydF4y2Ba
DVU0531gydF4y2Ba	6.57gydF4y2Ba	328.82gydF4y2Ba	xgydF4y2Ba	11.02gydF4y2Ba	1157.90gydF4y2Ba	xgydF4y2Ba	Hmc操纵子蛋白6gydF4y2Ba
DVU2137gydF4y2Ba	3.64gydF4y2Ba	389.78gydF4y2Ba	xgydF4y2Ba	4.45gydF4y2Ba	338.82gydF4y2Ba	xgydF4y2Ba	琥珀酰辅酶合酶、β/α亚基(gydF4y2BasucCDgydF4y2Ba)gydF4y2Ba

其他类别gydF4y2Ba

DVU0197gydF4y2Ba	3.46gydF4y2Ba	933.13gydF4y2Ba	xgydF4y2Ba	4.40gydF4y2Ba	285.54gydF4y2Ba	xgydF4y2Ba	λ噬菌体门户蛋白质、家庭gydF4y2Ba
DVU1490gydF4y2Ba	4.72gydF4y2Ba	351.64gydF4y2Ba	xgydF4y2Ba	5.70gydF4y2Ba	372.18gydF4y2Ba	xgydF4y2Ba	尾巴卷尺蛋白质gydF4y2Ba

监管职能gydF4y2Ba

DVU0063gydF4y2Ba	3.74gydF4y2Ba	3823.20gydF4y2Ba	xgydF4y2Ba	4.79gydF4y2Ba	6404.70gydF4y2Ba	xgydF4y2Ba	转录监管机构——马尔家族gydF4y2Ba
DVU1331gydF4y2Ba	7.54gydF4y2Ba	6812.50gydF4y2Ba	xgydF4y2Ba	8.33gydF4y2Ba	11619.00gydF4y2Ba	xgydF4y2Ba	转录监管机构,LysR家庭gydF4y2Ba
DVU1645gydF4y2Ba	7.22gydF4y2Ba	7075.60gydF4y2Ba	xgydF4y2Ba	14.03gydF4y2Ba	23482.00gydF4y2Ba	xgydF4y2Ba	转录监管机构,ArsR家庭gydF4y2Ba
DVU3062gydF4y2Ba	2.34gydF4y2Ba	1205.40gydF4y2Ba	xgydF4y2Ba	2.92gydF4y2Ba	570.26gydF4y2Ba	xgydF4y2Ba	传感器组氨酸激酶/响应监管机构gydF4y2Ba
DVU3095gydF4y2Ba	12.30gydF4y2Ba	17923.00gydF4y2Ba	xgydF4y2Ba	14.86gydF4y2Ba	23528.00gydF4y2Ba	xgydF4y2Ba	转录监管机构,毛皮的家庭gydF4y2Ba
DVU0721gydF4y2Ba	4.20gydF4y2Ba	1085.90gydF4y2Ba	xgydF4y2Ba	7.19gydF4y2Ba	513.28gydF4y2Ba	xgydF4y2Ba	感觉盒子组氨酸激酶gydF4y2Ba
DVU0834gydF4y2Ba	5.73gydF4y2Ba	2795.50gydF4y2Ba	xgydF4y2Ba	12.17gydF4y2Ba	13860.00gydF4y2Ba	xgydF4y2Ba	核糖核酸酶HII (rnhB)gydF4y2Ba
DVU1075gydF4y2Ba	13.63gydF4y2Ba	30772.00gydF4y2Ba	xgydF4y2Ba	15.45gydF4y2Ba	27576.00gydF4y2Ba	xgydF4y2Ba	核糖核酸酶P蛋白组件(rnpA)gydF4y2Ba

运输和结合蛋白gydF4y2Ba

DVU0593gydF4y2Ba	2.58gydF4y2Ba	992.23gydF4y2Ba	xgydF4y2Ba	3.28gydF4y2Ba	1151.30gydF4y2Ba	xgydF4y2Ba	赖氨酸出口国gydF4y2Ba
DVU1068gydF4y2Ba	3.92gydF4y2Ba	301.98gydF4y2Ba	xgydF4y2Ba	5.76gydF4y2Ba	270.52gydF4y2Ba	xgydF4y2Ba	支链氨基酸ABC转运蛋白,通透酶蛋白质gydF4y2Ba
DVU2340gydF4y2Ba	6.00gydF4y2Ba	11276.00gydF4y2Ba	xgydF4y2Ba	7.00gydF4y2Ba	11625.00gydF4y2Ba	xgydF4y2Ba	氨基酸ABC转运蛋白,通透酶蛋白质gydF4y2Ba
DVU2572gydF4y2Ba	3.19gydF4y2Ba	2831.50gydF4y2Ba	xgydF4y2Ba	5.77gydF4y2Ba	7937.50gydF4y2Ba	xgydF4y2Ba	二价铁运输蛋白质gydF4y2Ba
DVU2574gydF4y2Ba	4.62gydF4y2Ba	5005.50gydF4y2Ba	xgydF4y2Ba	8.85gydF4y2Ba	8857.00gydF4y2Ba	xgydF4y2Ba	亚铁离子转运蛋白gydF4y2Ba
DVU2744gydF4y2Ba	17.96gydF4y2Ba	1201.00gydF4y2Ba	xgydF4y2Ba	34.42gydF4y2Ba	3053.50gydF4y2Ba	xgydF4y2Ba	高亲和性支链氨基酸ABC转运蛋白gydF4y2Ba
DVUA0136gydF4y2Ba	3.29gydF4y2Ba	673.57gydF4y2Ba	xgydF4y2Ba	3.89gydF4y2Ba	346.83gydF4y2Ba	xgydF4y2Ba	锌转运体(gydF4y2BazupTgydF4y2Ba)gydF4y2Ba

未知函数gydF4y2Ba

DVU0155gydF4y2Ba	8.35gydF4y2Ba	16519.00gydF4y2Ba	xgydF4y2Ba	12.15gydF4y2Ba	18298.00gydF4y2Ba	xgydF4y2Ba	I型磷酸二酯酶/核苷酸焦磷酸酶家族蛋白质gydF4y2Ba
DVU0938gydF4y2Ba	10.12gydF4y2Ba	15409.00gydF4y2Ba	xgydF4y2Ba	11.76gydF4y2Ba	13138.00gydF4y2Ba	xgydF4y2Ba	异淀粉酶n端结构域的蛋白质gydF4y2Ba
DVU1023gydF4y2Ba	7.26gydF4y2Ba	123.66gydF4y2Ba	xgydF4y2Ba	8.15gydF4y2Ba	144.26gydF4y2Ba	xgydF4y2Ba	菱形家族蛋白质gydF4y2Ba
DVU1202gydF4y2Ba	5.39gydF4y2Ba	3480.30gydF4y2Ba	xgydF4y2Ba	5.92gydF4y2Ba	5395.40gydF4y2Ba	xgydF4y2Ba	胞嘧啶核苷/ deoxycytidylate脱氨酶家族蛋白gydF4y2Ba
DVU1558gydF4y2Ba	5.77gydF4y2Ba	189.07gydF4y2Ba	xgydF4y2Ba	6.47gydF4y2Ba	234.72gydF4y2Ba	xgydF4y2Ba	Cysteine-rich域/ iron-sulfur cluster-binding域蛋白质gydF4y2Ba
DVU1730gydF4y2Ba	3.16gydF4y2Ba	1288.70gydF4y2Ba	xgydF4y2Ba	3.74gydF4y2Ba	4503.10gydF4y2Ba	xgydF4y2Ba	dna结合蛋白质gydF4y2Ba
DVU1745gydF4y2Ba	6.55gydF4y2Ba	319.33gydF4y2Ba	xgydF4y2Ba	7.58gydF4y2Ba	182.38gydF4y2Ba	xgydF4y2Ba	dna结合蛋白质gydF4y2Ba
DVU1747gydF4y2Ba	5.08gydF4y2Ba	258.33gydF4y2Ba	xgydF4y2Ba	12.80gydF4y2Ba	230.72gydF4y2Ba	xgydF4y2Ba	atp酶、组氨酸激酶- DNA促旋酶B -, HSP90-like domainsproteingydF4y2Ba
DVU2036gydF4y2Ba	4.27gydF4y2Ba	1086.70gydF4y2Ba	xgydF4y2Ba	5.07gydF4y2Ba	350.61gydF4y2Ba	xgydF4y2Ba	Helix-turn-helix蛋白质,CopG家庭gydF4y2Ba
DVUA0039gydF4y2Ba	3.75gydF4y2Ba	269.47gydF4y2Ba	xgydF4y2Ba	4.27gydF4y2Ba	261.42gydF4y2Ba	xgydF4y2Ba	链长行列式家族蛋白gydF4y2Ba

*蛋白质丰度在肽;RNA富足是在原始荧光测量微阵列。“x”表示蛋白质未被发现的实验。gydF4y2Ba

总之,缺失值在大规模蛋白质组分析是一个频繁的问题,在某些情况下,它创造了困难为蛋白质组学数据的准确解释复杂的生物系统。然而,尽管它的明显的重要性,方法处理丢失的蛋白质组学数据仍远远落后的方法进行转录组分析。在这项研究中,我们应用人工神经网络方法近似同源转录组和蛋白质组学数据集之间的关系gydF4y2Bad .寻常的gydF4y2Ba,来预测蛋白质丰富的蛋白质不是实验检测到基于相关预测因子,如mRNA丰富,细胞作用,三重密码子数。结果表明,训练神经网络模型的系数测定范围从0.47到0.68,提供更好的描述比之前几个模型(gydF4y2Ba18gydF4y2Ba,gydF4y2Ba19gydF4y2Ba]。试图找出可能原因丢失蛋白质组值,逻辑回归分析各种实验测量和序列特征进行了实验发现蛋白质但高预测蛋白质丰度值。虽然结果总体上符合先前的知识,较低的蛋白质可能表达能力和高的不稳定会有更高的机会错过了,在这项研究中,我们首次量化的优势比每一个可能的因素gydF4y2Bad .寻常的gydF4y2Ba数据集。此外,在我们的初步分析表明,生物解释可以改善通过估算蛋白质组学数据集。最后,尽管该模型验证统计,要小心谨慎,当解释实验数据的基础上预测蛋白表达的价值观,因为预测的丰度值限制蛋白质组学实验数据作为输入的质量,和缺乏大规模的定量预测,可以包括在模型中。然而,最初的成功应用ANN方法是鼓励和模型可以作为基础发展更复杂的模型来进一步提高生物学解释。gydF4y2Ba

承认gydF4y2Ba

j·乔和w·张的研究工作是由中国国家基础研究计划(2011 cba00803)。本文反映了f·李的观点和l .聂不应被解释为代表FDA的观点或政策。gydF4y2Ba

补充材料gydF4y2Ba

补充表1:中国十大排名相对变量重要性措施变量(后删除基因mRNA高值)(从Torres-Garcia et al .,gydF4y2Ba生物信息学gydF4y2Ba,2009年,25:1905 - 1914)。gydF4y2Ba

补充表2:所有基因预测的值在不同的条件。gydF4y2Ba

补充材料gydF4y2Ba

引用gydF4y2Ba

d . Medini d . Serruto j . Parkhill et al .,“后基因时代,微生物学”gydF4y2Ba自然评论微生物学gydF4y2Ba》第六卷,没有。6,419 - 430年,2008页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
n . c . Kyrpides“十五年的微生物基因组学:会议的挑战和实现梦想,“gydF4y2Ba自然生物技术gydF4y2Ba,27卷,不。7,627 - 632年,2009页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
o . Fiehn”,结合基因组学、代谢组分析和生化造型理解代谢网络,”gydF4y2Ba比较和功能基因组学gydF4y2Ba,卷2,不。3、155 - 168年,2001页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
o . v .辛格和n s Nagaraj转录组、蛋白质组学和interactomics:独特的方法来跟踪生物修复的见解,“gydF4y2Ba简报在功能基因组学和蛋白质组学gydF4y2Ba,4卷,不。4、355 - 362年,2006页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
j·林和j .钱“比较基因组学、系统生物学方法综合”gydF4y2Ba蛋白质组学的专家审查gydF4y2Ba,4卷,不。1,第119 - 107页,2007。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
r·p·Kandpal萨维奥拉,j·费尔顿,“组学无限的,”的时代gydF4y2Ba生物学技术gydF4y2Ba,46卷,不。5,351 - 355年,2009页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
n Ishii和m .获利,”Multi-omics数据驱动的系统生物学gydF4y2Ba大肠杆菌gydF4y2Ba,“在gydF4y2Ba系统生物学和生物技术的大肠杆菌gydF4y2Bay s . Lee,艾德,pp, 41-57 Springer,多德雷赫特,荷兰,2009年。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
y . j .唐·h·g·马丁,迈尔斯,s·罗德里格斯·e·e·k·Baidoo和j·d·科斯林”的进步通过微生物代谢通量分析gydF4y2Ba $^{13gydF4y2Ba} CgydF4y2Ba$ 同位素标记”,gydF4y2Ba质谱分析评论gydF4y2Ba,28卷,不。2、362 - 375年,2009页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
j·l·DeRisi v r·艾耶和p . o .布朗,“探索代谢和遗传控制基因表达在基因组范围内,“gydF4y2Ba科学gydF4y2Ba,卷278,不。5338年,第686 - 680页,1997年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
p . t .首位,g .夏洛克李奉儒Zhang et al .,“全面识别细胞cycle-regulated基因的酵母gydF4y2Ba酿酒酵母gydF4y2Ba通过微阵列杂交。”gydF4y2Ba细胞的分子生物学gydF4y2Ba,9卷,不。12日,第3297 - 3273页,1998年。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
a . a . Alizadeh m . b . Elsen r·e·戴维斯et al .,“不同类型的弥漫型大b细胞淋巴瘤的基因表达分析,“gydF4y2Ba自然gydF4y2Ba,卷403,不。6769年,第511 - 503页,2000年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
t . Aittokallio”大规模研究中处理缺失值:微阵列数据归责,“gydF4y2Ba简报的生物信息学gydF4y2Ba,11卷,不。2、253 - 264年,2009页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
j·m·r·威尔金斯·r·d·佩尔·e·范·Eyk et al .,”指导方针,下一个十年的蛋白质组学,”gydF4y2Ba蛋白质组学gydF4y2Ba》第六卷,没有。1,4 - 8人,2006页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
d . e . l .聂g . Wu Culley, j . c . m . Scholten和w·张,“转录组和蛋白质组数据综合分析:挑战,解决方案和应用程序,”gydF4y2Ba生物技术的关键评论gydF4y2Ba,27卷,不。2、63 - 75年,2007页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
k·荣格,a . Gannoun服务,h·e·迈耶k . Stauhler和w·Urfer“动态蛋白质表达数据的分析,gydF4y2BaRevStat:统计期刊gydF4y2Ba,3卷,第111 - 99页,2005年。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
r . Pedreschi m·l·a·t·m·Hertog Carpentier s . c . et al .,“处理缺失值的凝胶蛋白质组学数据的多元统计分析,“gydF4y2Ba蛋白质组学gydF4y2Ba,8卷,不。7,1371 - 1383年,2008页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
l . l . j . Tuikkala值得信赖,o . s . Nevalainen和t . Aittokallio”缺失值归责提高基因表达微阵列数据的聚类和解释,“gydF4y2BaBMC生物信息学gydF4y2Ba第202条,卷。9日,2008年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
f·j·l·聂g . Wu布洛克曼和w·张,“转录组和蛋白质组数据的综合分析gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba:zero-inflated泊松回归模型预测大量的未被发现的蛋白质,”gydF4y2Ba生物信息学gydF4y2Ba,22卷,不。13日,1641 - 1647年,2006页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
w·Torres-Garcia w·张,g . c .响,r·h·约翰逊和d . r . Meldrum转录组和蛋白质组数据的综合分析gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba:一个非线性模型来预测大量的未被发现的蛋白质,”gydF4y2Ba生物信息学gydF4y2Ba,25卷,不。15日,第1914 - 1905页,2009年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
j . f .海德堡r·瑟哈德里s a Haveman et al .,“厌氧的基因组序列,硫酸盐还原细菌gydF4y2Ba脱磷孤菌属寻常的gydF4y2BaHildenborough。”gydF4y2Ba自然生物技术gydF4y2Ba,22卷,不。5,554 - 559年,2004页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
w·张,m . A . Gritsenko r . j .摩尔et al。”蛋白质组的观点gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba新陈代谢由液相色谱加上串联质谱,”gydF4y2Ba蛋白质组学gydF4y2Ba》第六卷,没有。15日,第4299 - 4286页,2006年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
d . e . w . Zhang Culley, j . c . m . Scholten m·霍根l . Vitiritti f·j·布洛克曼,“全球转录组的分析gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba在不同的电子给体”,gydF4y2Ba安东尼·范·列文虎克国际通用和分子微生物学杂志》上gydF4y2Ba,卷89,不。2、221 - 237年,2006页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
a . Mukhopadhyay, z, e . j . Alm et al .,“盐压力gydF4y2Ba脱磷孤菌属寻常的gydF4y2Bahildenborough:一个完整的基因组学的方法,”gydF4y2Ba细菌学期刊gydF4y2Ba,卷188,不。11日,第4078 - 4068页,2006年。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
l . j .兰开夏郡,c . Lemetre g . r .球”介绍人工神经网络在bioinformatics-application复杂的微阵列和质谱数据集在癌症研究中,“gydF4y2Ba简报的生物信息学gydF4y2Ba,10卷,不。3、315 - 329年,2009页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
w·s·麦克洛克和w·皮特,”一个逻辑微积分思想内在的神经活动,“gydF4y2Ba数学生物物理学的公告gydF4y2Ba,5卷,不。4、115 - 133年,1943页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
m . w . j .钱t . Liu e·梦露et al .,“概率评估肽和蛋白质的识别从串联质谱和SEQUEST分析:人类蛋白质组,“gydF4y2Ba蛋白质组研究期刊》的研究gydF4y2Ba,4卷,不。1,53 - 62年,2005页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
k . Hornik m . Stinchcombe和h白色,“多层前馈网络普遍接近者,”gydF4y2Ba神经网络gydF4y2Ba,卷2,不。5,359 - 366年,1989页。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
k . i Funahashi”近似实现连续映射的神经网络,”gydF4y2Ba神经网络gydF4y2Ba,卷2,不。3、183 - 192年,1989页。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
g . Cybenko“近似s型函数,通过叠加”gydF4y2Ba数学的控制、信号和系统gydF4y2Ba,卷2,不。4、303 - 314年,1989页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba|gydF4y2BaZentralblatt数学gydF4y2Ba|gydF4y2BaMathSciNetgydF4y2Ba
d . e . Rumelhart、g·e·辛顿和r . j·威廉姆斯,“学习back-propagating错误的陈述,”gydF4y2Ba自然gydF4y2Ba,卷323,不。6088年,第536 - 533页,1986年。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
t . Hastie r . Tibshirani和j·弗里德曼,gydF4y2Ba统计学习资料的元素采矿、推理、预测gydF4y2Ba施普林格,纽约,纽约,美国,第二版,2009年版。gydF4y2Ba
r·a·约翰逊,gydF4y2Ba米勒和弗洛伊德的概率和统计工程师gydF4y2Ba美国新泽西,Prentice Hall,恩格尔伍德悬崖,2005。gydF4y2Ba
l . g . Wu聂,w·张,“mRNA表达和序列信息之间的关系gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba:上游监管图案组合贡献和信使rna编码序列特性变化丰富,“gydF4y2Ba生物化学和生物物理研究通信gydF4y2Ba,卷344,不。1,第121 - 114页,2006。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
d . e . g . Wu Culley,和w·张,“预测基因的高表达基因链霉菌属coelicolor和链霉菌属avermitilis和代谢的影响,“gydF4y2Ba微生物学gydF4y2Ba,卷151,不。7,2175 - 2187年,2005页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
l .聂和w·张,”g . Wu mRNA表达和蛋白质丰度的相关性受多个序列特性与转化效率有关gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba:一个定量分析”,gydF4y2Ba遗传学gydF4y2Ba,卷174,不。4、2229 - 2243年,2006页。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
a . AgrestigydF4y2Ba分类数据分析gydF4y2BaWiley-Interscience,纽约,纽约,美国,2002年。gydF4y2Ba
d . w . Hosmer和s . LemeshowgydF4y2Ba应用逻辑回归gydF4y2Ba威利奇切斯特,英国,第二版,2000年版。gydF4y2Ba
k . Guruprasad b . v . b . Reddy, m·w·潘迪特“稳定的蛋白质之间的相关性及其二肽组成:一个新颖的方法预测体内一种蛋白质的稳定性的主要序列,”gydF4y2Ba蛋白质工程gydF4y2Ba,4卷,不。2、155 - 161年,1990页。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
a . Ikai“球状蛋白质的热稳定性和脂肪指数”,gydF4y2Ba生物化学杂志gydF4y2Ba,卷88,不。6,1895 - 1898年,1980页。gydF4y2Ba视图:gydF4y2Ba谷歌学术搜索gydF4y2Ba
C .《g .勒罗伊·比安科大肠森林,m . Bruschi和a . Dolla”特征的细胞色素C脱磷孤菌属desulfuricans G201,”gydF4y2Ba生物化学和生物物理研究通信gydF4y2Ba,卷242,不。1,第218 - 213页,1998。gydF4y2Ba视图:gydF4y2Ba出版商的网站gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

国际基因组学杂志gydF4y2Ba

丢失的蛋白质组学数据的预测和描述gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba

文摘gydF4y2Ba

1。介绍gydF4y2Ba

2。材料和方法gydF4y2Ba

2.1。数据集gydF4y2Ba

2.2。基因组信息gydF4y2Ba

2.3。蛋白质组学建设的关系,并通过人工神经网络信使rnagydF4y2Ba

2.4。分析的因素归因于缺少蛋白质测量gydF4y2Ba

3所示。结果与讨论gydF4y2Ba

3.1。确定变量重要性和局部变量的依赖gydF4y2Ba

3.2。结构的非线性人工神经网络模型gydF4y2Ba

3.3。验证通过非线性人工神经网络预测模型gydF4y2Ba

3.4。比较以前的人工神经网络方法(GBT和ZIP)gydF4y2Ba

3.5。分析因素归因于缺少蛋白质测量gydF4y2Ba

3.6。数据解释使用估算的数据集gydF4y2Ba

承认gydF4y2Ba

补充材料gydF4y2Ba

引用gydF4y2Ba

版权gydF4y2Ba

更多相关文章gydF4y2Ba

相关文章gydF4y2Ba