蛋白质组学数据集往往是不完整的识别范围和灵敏度问题。它成为重要的开发方法来估计丢失的蛋白质组学数据,允许更好的解释蛋白质组学数据集和代谢机制复杂的生物系统。在这项研究中,我们应用一个人工神经网络近似同源转录组和蛋白质组学数据集之间的关系gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba ,来预测蛋白质丰富的蛋白质不是实验检测,根据一些相关预测因子,如mRNA丰富,细胞作用和三重密码子数。的测定结果表明,系数从0.47到0.68不等训练神经网络模型,提供更好的建模比之前几个回归模型。训练神经网络模型的有效性评估使用生物信息(即操纵子)。寻求理解机制导致失踪的蛋白质组学数据,我们使用多元逻辑回归分析,结果表明,一些关键因素,如蛋白质不稳定指数、脂肪指数、mRNA丰富、有效的密码子的数量(gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
)和密码子适应指数(CAI)值可能是归因于一个给定的蛋白质表达是否可以检测到。此外,我们表明,生物解释可以提高利用估算蛋白质组学数据集。gydF4y2Ba
1。介绍gydF4y2Ba
应用各种实验的“组学”工具增强了我们理解复杂的生物系统在过去的十年里(gydF4y2Ba1gydF4y2Ba - - - - - -gydF4y2Ba8gydF4y2Ba ]。然而,由于这些高通量技术的技术限制和约束在实验设计上,大多数的这些高通量“组学”数据集仍遭受重大缺失值。不完整的数据已经阻碍了科学家们对细胞代谢中提取正确的信息。来解决这个问题,试图运用计算工具转嫁各种高通量“组学”中的遗漏值数据集了(gydF4y2Ba9gydF4y2Ba - - - - - -gydF4y2Ba11gydF4y2Ba ]。最成功的例子,这些努力是为了丢失的转录组数据(gydF4y2Ba12gydF4y2Ba ]。gydF4y2Ba
与转录组数据集相比,蛋白质组学数据集遭受更为严重的缺失数据识别范围和灵敏度以来还没有完全比得上转录组测量(gydF4y2Ba13gydF4y2Ba ]。特别是,当部分蛋白质组学数据集用于各种集成的“组学”研究,未被发现的蛋白质只是分配一个“零”价值和被排除关系建模,这可能偏见的任何结论导致综合研究(gydF4y2Ba14gydF4y2Ba ]。为了克服这个问题,几种方法已经适应从转录组数据的缺失值的估计估计丢失的蛋白质组学其他蛋白质,通过使用可用的测量值等gydF4y2Ba
gydF4y2Ba
最近邻和贝叶斯主成分分析(BPCA)将缺失的蛋白质组学方法值在凝胶蛋白质组学数据集gydF4y2Ba15gydF4y2Ba ,gydF4y2Ba16gydF4y2Ba ),通过集成(基因本体)信息进入蛋白质组学数据归责(gydF4y2Ba17gydF4y2Ba ]。基于假设的存在有意义的关联两种类型的数据集(gydF4y2Ba14gydF4y2Ba 近年来,我们已经开发出Zero-inflatedgydF4y2Ba泊松gydF4y2Ba (ZIP)线性回归模型gydF4y2Ba18gydF4y2Ba )和随机梯度增加树木(GBT)非线性模型(gydF4y2Ba19gydF4y2Ba )发现可能的转录组和蛋白质组数据之间的关系和预测蛋白质丰富的蛋白质不是实验检测。gydF4y2Ba
作为持续努力的一部分开发统计工具对缺失值归责,我们在研究中应用人工神经网络(ANN)方法来预测大量实验发现蛋白质几个同源转录组和蛋白质组学数据集的硫酸盐还原细菌gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba (gydF4y2Ba20.gydF4y2Ba - - - - - -gydF4y2Ba23gydF4y2Ba ]。人工神经网络的优点包括应对复杂关系的能力,与缺失值处理噪声数据,和其泛化能力gydF4y2Ba24gydF4y2Ba ,gydF4y2Ba25gydF4y2Ba ]。方法,多层感知器(MLP)与乙状结肠单隐层的激活函数用于捕获转录组数据之间的非线性关系和蛋白质丰度。排名前十的相关预测蛋白质丰度确定一项研究[gydF4y2Ba19gydF4y2Ba 培训向MLP)被用作输入电路的输出延时近似对应的每个基因的蛋白质丰度。中长期规划训练是利用生物信息进行验证。此外,通过使用多元逻辑回归分析,我们量化一些序列的贡献因素,如信使rna,蛋白质不稳定指数,基因长度,密码子的“有效数字”(gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
),CAI(密码子适应指数)值缺少蛋白质组值。我们也证明了生物解释可以提高通过估算蛋白质组学数据集。gydF4y2Ba
2。材料和方法gydF4y2Ba
2.1。数据集gydF4y2Ba
两个数据集gydF4y2Ba脱磷孤菌属寻常的gydF4y2Ba 分析了在这个研究。数据集覆盖相同的物种,尽管实验条件是不同的,他们是通过两个独立的研究(gydF4y2Ba19gydF4y2Ba - - - - - -gydF4y2Ba23gydF4y2Ba ]。原始强度值数据集都是规范化使用分位数正常化R包(脱字符号)可以通过gydF4y2Ba
gydF4y2Ba
项目(gydF4y2Bahttp://www.r-project.org/gydF4y2Ba )。绝对荧光强度和肽击中被用作转录组和蛋白质组数据丰富,分别为(gydF4y2Ba26gydF4y2Ba ]。标记数据集1和2的数据集,这些数据集将在整篇文章中使用。gydF4y2Ba
2.2。基因组信息gydF4y2Ba
基因注释的属性,比如序列长度、蛋白质,分子量,GC含量,三重密码子数,和细胞功能类别的所有基因gydF4y2Bad .寻常的gydF4y2Ba 基因组从全面的微生物资源下载(CMR) TIGR (gydF4y2Bahttp://cmr.tigr.orggydF4y2Ba /)(gydF4y2Ba22gydF4y2Ba ]。定义操纵子,我们使用了distance-only方法,门槛相对较低,在这项研究中,涵盖更多可能的操纵子。转录方向相同的基因与基因间的地区,不到15碱基对被定义为一个操纵子(gydF4y2Ba19gydF4y2Ba ]。gydF4y2Ba
2.3。蛋白质组学建设的关系,并通过人工神经网络信使rnagydF4y2Ba
我们训练了一个人工神经网络学习特定的函数通过调整神经元之间的权重的值。它已经表明,多层感知器和一个隐藏层可以任意精度逼近任意连续函数通过增加隐层神经元的数量(gydF4y2Ba27gydF4y2Ba - - - - - -gydF4y2Ba29日gydF4y2Ba ]。权重连接输入信号以及神经元的数量可以确定通过最小化之间的差值的平方之和网络输出和目标为每个输入输出信号。非线性优化方法结合反向传播算法(gydF4y2Ba30.gydF4y2Ba )实施找到最优权重。输入到网络和目标通常是新(−1,1)。网络的输出被新回到近似原规模的目标。在这项工作中,我们训练多层感知器学习转录组和蛋白质组数据之间的非线性关系。转录组数据输入和目标是丰富的蛋白质。gydF4y2Ba
隐层的前馈网络可以以任意精度逼近任意连续函数,它提供了安的权力来处理非线性关系,也打开门过度拟合用于隐层神经元如果过多。为了解决可能的过度拟合,我们实现了一个交叉验证,防止过度拟合。通过这种方法的数据分区gydF4y2Ba
gydF4y2Ba
相等的部分,gydF4y2Ba
gydF4y2Ba
−gydF4y2Ba
1gydF4y2Ba
集被用来训练模型和另一组是用来计算预测误差(gydF4y2Ba31日gydF4y2Ba ]。这是重复的gydF4y2Ba
gydF4y2Ba
次,因此gydF4y2Ba
gydF4y2Ba
预测误差值被计算在每一个褶皱。平均和标准偏差可以提取,选择最具代表性的模型对未来的预测。交叉验证是普遍有效的防止过度拟合。旁边交叉验证,防止过度拟合,我们还使用了一些统计工具来诊断所选择的模型。一旦选择最好的模型,基于交叉验证,该模型评估基于其确定系数(gydF4y2Ba
gydF4y2Ba
2gydF4y2Ba
)。这个系数代表了变化的解释模型。此外,或者评估模型,我们研究了预测的美好的小集分组基于操纵子的基因信息。为了描述一个数据集内的变化,如“摩尔丰富”的蛋白质在一个操纵子,我们计算变异系数(CV)每组蛋白质。简历被定义为标准差和均值的比值“摩尔丰富”的一组蛋白质(gydF4y2Ba18gydF4y2Ba ,gydF4y2Ba19gydF4y2Ba ,gydF4y2Ba32gydF4y2Ba 简历评分的计算是独立的样本大小。这些系数的变化相比,计算所有操纵子和CVs的排列分布,排列的基因。gydF4y2Ba
2.4。分析的因素归因于缺少蛋白质测量gydF4y2Ba
DNA和蛋白质序列特征,gydF4y2BaBioPerlgydF4y2Ba 模块用于批量查询和解析结果ExPASy ProtParam程序,返回“AliphaticIndex”和“InstabilityIndex”。CodonW是用于执行对应分析氨基酸的密码子和用法,返回第一个四轴代表主要趋势(AA_axis1-4氨基酸的使用,CR_axis1-4相对同义密码子的使用)。每个基地第三个密码子的频率位置(t3的网站,被指定为a3, c3作物,和g3),以及两个额外的措施等蛋白质性质大平均水疗法(肉汁)和AROMO,也与CodonW计算。密码子适应指数(CAI)与内部perl脚本使用计算gydF4y2Bad .寻常的gydF4y2Ba 核糖体蛋白基因高表达基因提供了参考依据。这些特性的计算与分析是描述在我们之前的一些作品gydF4y2Ba33gydF4y2Ba - - - - - -gydF4y2Ba35gydF4y2Ba ]。gydF4y2Ba
逻辑回归模型被用来评估的每个特征属性是否一个给定的蛋白质将被检测到gydF4y2Ba36gydF4y2Ba ,gydF4y2Ba37gydF4y2Ba ]。假设一个基因的功能gydF4y2Ba
gydF4y2Ba
是gydF4y2Ba
gydF4y2Ba
1gydF4y2Ba
gydF4y2Ba
,gydF4y2Ba
…gydF4y2Ba
,gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
。在逻辑回归、分对数概率的自然对数,未知的概率,gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
,蛋白质是没有检测到被建模为一个线性函数gydF4y2Ba
gydF4y2Ba
1gydF4y2Ba
gydF4y2Ba
,gydF4y2Ba
…gydF4y2Ba
,gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
:gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
lgydF4y2Ba
ogydF4y2Ba
ggydF4y2Ba
我gydF4y2Ba
tgydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
=gydF4y2Ba
lgydF4y2Ba
ngydF4y2Ba
gydF4y2Ba
1gydF4y2Ba
−gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
=gydF4y2Ba
gydF4y2Ba
0gydF4y2Ba
+gydF4y2Ba
gydF4y2Ba
1gydF4y2Ba
gydF4y2Ba
1gydF4y2Ba
gydF4y2Ba
+gydF4y2Ba
⋯gydF4y2Ba
+gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
。gydF4y2Ba
(gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
模型是等价的gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
=gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
pgydF4y2Ba
0gydF4y2Ba
+gydF4y2Ba
gydF4y2Ba
1gydF4y2Ba
gydF4y2Ba
1gydF4y2Ba
gydF4y2Ba
+gydF4y2Ba
⋯gydF4y2Ba
+gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
pgydF4y2Ba
0gydF4y2Ba
+gydF4y2Ba
gydF4y2Ba
1gydF4y2Ba
gydF4y2Ba
1gydF4y2Ba
gydF4y2Ba
+gydF4y2Ba
⋯gydF4y2Ba
+gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
+gydF4y2Ba
1gydF4y2Ba
。gydF4y2Ba
(gydF4y2Ba
2gydF4y2Ba
)gydF4y2Ba
未知系数通常由最大似然估计使用方法共同所有广义线性模型(gydF4y2Ba35gydF4y2Ba ]。在模型中,参数gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
的添加剂影响日志赔率为一个单元的变化gydF4y2Ba
gydF4y2Ba
说明特征变量。也就是说,一个单位的变化特性gydF4y2Ba
gydF4y2Ba
,也就是说,gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
表示可能性的变化gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
次了。积极的gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
表明蛋白质不会被检测到的概率增加而增加gydF4y2Ba
gydF4y2Ba
th特性。通过使用逻辑回归分析、相关特性的影响蛋白质是否会发现被量化,可以比较。和拟合模型还可以用来预测的机会,任何其他蛋白质不会被检测到。gydF4y2Ba
3所示。结果与讨论gydF4y2Ba
3.1。确定变量重要性和局部变量的依赖gydF4y2Ba
在一项研究中,我们使用梯度增加树木(GBT)模型来衡量的贡献的70个rna蛋白质相关变量的输入变量,和10个顶级变量被确定mRNA表达水平,细胞的作用,和几个密码子用法的三倍gydF4y2Bad .寻常的gydF4y2Ba 我们使用数据集(参见表1 Supplmentary材料网上doi: 10.1155 / 2011/780973) (gydF4y2Ba19gydF4y2Ba ]。在这项研究中,我们使用相同的十大预测人工神经网络的输入方法。使用的数据集是与之前的工作比较一致。结果表明,对于所有的数据集,我们观察一个平滑的蛋白质丰度之间的关系,丰富相应的信使rna控制其他预测平均值为每一个增长的条件。之间的部分依赖蛋白质和mRNA丰富往往是平滑的丰富mRNA在高范围(图gydF4y2Ba1gydF4y2Ba )。图gydF4y2Ba2gydF4y2Ba 显示了建立蛋白质丰富的散点图和信使rna蛋白质检测和未被发现的数据集的数据集1和2,分别。对于这两个数据集,每个增长条件下,有更少的基因与信使核糖核酸或蛋白质丰度很高。这些蛋白质未被发现的大多是很低的预测蛋白质丰度和观察mRNA丰富如图gydF4y2Ba2 (b)gydF4y2Ba 和gydF4y2Ba2 (d)gydF4y2Ba 对于数据集数据集1和2,分别。蛋白质未被发现有许多较小的方差预测价值尤其是对数据集2如图gydF4y2Ba2 (d)gydF4y2Ba 。相比之下,这些检测蛋白质有更大范围的蛋白质丰度和很高的可变性。gydF4y2Ba
(一)gydF4y2Ba
(b)gydF4y2Ba
(c)gydF4y2Ba
(d)gydF4y2Ba
在前面的工作使用GBT模型揭示非线性转录组和蛋白质组学数据集之间的关系,一个有趣的模式,观察高原效应,部分依赖图的mRNA丰富与蛋白质丰度高值的信使rna。这可能是由于这一事实蛋白质丰度数据稀疏,高方差,树模型预测中不产生分歧(gydF4y2Ba19gydF4y2Ba ]。在神经网络模型中,中长期规划的输出是一个固有的光滑函数网络的输入,因此相对平滑的预测总是得到保证。然而,我们仍然可以看到类似的模式时,曲线变得平坦的方差mRNA丰度高。例如,在该地区的高mRNA值有少量的基因/肽蛋白值范围从(0,40)数据集1和2(0 500)数据集。这可能反映的问题目前蛋白质组学技术的敏感性高丰富蛋白质。gydF4y2Ba
3.2。结构的非线性人工神经网络模型gydF4y2Ba
训练前馈网络和一个隐藏层为每个条件与mRNA丰度数据集和其他因素作为输入和蛋白质丰度作为目标。使用功能的神经网络训练的神经网络工具箱提供的标准软件Matlab (7.0.1)。隐层神经元的激活函数是双曲正切函数,给出的gydF4y2Ba
gydF4y2Ba
(gydF4y2Ba
gydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
−gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
pgydF4y2Ba
(gydF4y2Ba
−gydF4y2Ba
gydF4y2Ba
)gydF4y2Ba
1gydF4y2Ba
+gydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
pgydF4y2Ba
(gydF4y2Ba
−gydF4y2Ba
gydF4y2Ba
)gydF4y2Ba
。gydF4y2Ba
(gydF4y2Ba
3gydF4y2Ba
)gydF4y2Ba
输出神经元的激活函数是一个纯粹的线性函数,也就是加权和的隐层神经元的输出。最优隐层神经元的数量和最优权重测定使用10倍交叉验证训练一个神经网络。对于每个数据集每个实验条件下,网络与输入相同但不同数量的神经元(从5到12)隐层中每个训练使用交叉验证学习mRNA的特性和蛋白质丰度之间的关系。最优层的神经元数量决定基于一个生成最小平均验证误差。gydF4y2Ba
转录组和蛋白质组数据进行对数转换。对于数据集1,没有缺失值的基因选择了四分之三的复制模型的训练。基因用于培训的数量是354,312,和308 FL,噢,分别和LS条件。对于每个生长条件,多层感知器的输入是十大预测确定之前(gydF4y2Ba19gydF4y2Ba 在补充材料(见表1)。最优网络6、6和9的隐层神经元FL,噢,分别和LS条件。系数决定gydF4y2Ba
gydF4y2Ba
2gydF4y2Ba
分别为0.47、0.52和0.51 FL,噢,LS条件,分别。数据集2,986,1001,和986个基因没有丢失蛋白质测量被用于模型训练CT0 CT120,分别和ST120条件。为每个条件,多层感知器的输入确定的十大预测之前(gydF4y2Ba19gydF4y2Ba 在补充材料(见表1)。最优网络有8、7、6 CT0隐层神经元,CT120,分别和ST120条件。系数的测定gydF4y2Ba
gydF4y2Ba
2gydF4y2Ba
分别为0.65、0.62和0.68 CT0, CT120,分别和ST120条件。gydF4y2Ba
3.3。验证通过非线性人工神经网络预测模型gydF4y2Ba
验证模型的预测是通过计算变异系数(CV)条件的每一个操纵子gydF4y2Bad .寻常的gydF4y2Ba 所述前(gydF4y2Ba18gydF4y2Ba ,gydF4y2Ba19gydF4y2Ba ]。操纵子的基因被认为没有比随机分散组基因的基因表达和/或蛋白质丰富,因为他们的内在生物关系。相对较低的阈值操纵子识别节中描述gydF4y2Ba2gydF4y2Ba ,共有609个操纵子中确定gydF4y2Bad .寻常的gydF4y2Ba ,范围从2到13个基因操纵子。比较这些CV值,我们使用一个排列测试在以下方式:简历是计算值预测蛋白质的数量排列的基因。这一步是通过重采样的不重复基因重复2000次。随机选择的基因数量等于基因群的大小进行比较。对于数据集1,82%到89%的操纵子组CV值小于排列组数据集2,79%到89%的操纵子组CV值小于排列,一般展示良好的性能模型的预测。验证结果总结表gydF4y2Ba1gydF4y2Ba 。gydF4y2Ba
数据集1gydF4y2Ba
数据集2gydF4y2Ba
FLgydF4y2Ba
噢gydF4y2Ba
LSgydF4y2Ba
CT0gydF4y2Ba
CT120gydF4y2Ba
ST120gydF4y2Ba
操纵子gydF4y2Ba
简历gydF4y2Ba
PCVgydF4y2Ba
简历gydF4y2Ba
PCVgydF4y2Ba
简历gydF4y2Ba
PCVgydF4y2Ba
简历gydF4y2Ba
PCVgydF4y2Ba
简历gydF4y2Ba
PCVgydF4y2Ba
简历gydF4y2Ba
PCVgydF4y2Ba
1gydF4y2Ba
0.36gydF4y2Ba
0.707gydF4y2Ba
0.6gydF4y2Ba
0.797gydF4y2Ba
0.301gydF4y2Ba
0.901gydF4y2Ba
1.63 *gydF4y2Ba
1.248gydF4y2Ba
0.814gydF4y2Ba
1.186gydF4y2Ba
1.269gydF4y2Ba
1.286gydF4y2Ba
2gydF4y2Ba
1.6 *gydF4y2Ba
0.638gydF4y2Ba
1.564 *gydF4y2Ba
0.725gydF4y2Ba
1.48 *gydF4y2Ba
0.631gydF4y2Ba
0.773gydF4y2Ba
1.102gydF4y2Ba
0.968gydF4y2Ba
1.044gydF4y2Ba
0.702gydF4y2Ba
1.129gydF4y2Ba
3gydF4y2Ba
0.499gydF4y2Ba
0.659gydF4y2Ba
1.04 *gydF4y2Ba
0.766gydF4y2Ba
0.563gydF4y2Ba
0.866gydF4y2Ba
1.295 *gydF4y2Ba
1.134gydF4y2Ba
1.568 *gydF4y2Ba
1.106gydF4y2Ba
1.324 *gydF4y2Ba
1.169gydF4y2Ba
4gydF4y2Ba
0.216gydF4y2Ba
0.648gydF4y2Ba
0.239gydF4y2Ba
0.726gydF4y2Ba
0.323gydF4y2Ba
0.813gydF4y2Ba
0.333gydF4y2Ba
1.106gydF4y2Ba
0.401gydF4y2Ba
1.05gydF4y2Ba
0.453gydF4y2Ba
1.135gydF4y2Ba
5gydF4y2Ba
0.418gydF4y2Ba
0.646gydF4y2Ba
0.559gydF4y2Ba
0.731gydF4y2Ba
0.45gydF4y2Ba
0.794gydF4y2Ba
0.481gydF4y2Ba
1.105gydF4y2Ba
0.398gydF4y2Ba
1.05gydF4y2Ba
0.466gydF4y2Ba
1.122gydF4y2Ba
6gydF4y2Ba
0.18gydF4y2Ba
0.647gydF4y2Ba
0.454gydF4y2Ba
0.745gydF4y2Ba
0.353gydF4y2Ba
0.809gydF4y2Ba
0.495gydF4y2Ba
1.116gydF4y2Ba
0.403gydF4y2Ba
1.042gydF4y2Ba
0.473gydF4y2Ba
1.124gydF4y2Ba
7gydF4y2Ba
0.297gydF4y2Ba
0.651gydF4y2Ba
0.162gydF4y2Ba
0.729gydF4y2Ba
0.312gydF4y2Ba
0.8gydF4y2Ba
0.408gydF4y2Ba
1.101gydF4y2Ba
0.343gydF4y2Ba
1.042gydF4y2Ba
0.69gydF4y2Ba
1.118gydF4y2Ba
8gydF4y2Ba
0.307gydF4y2Ba
0.693gydF4y2Ba
0.292gydF4y2Ba
0.772gydF4y2Ba
0.28gydF4y2Ba
0.908gydF4y2Ba
0.767gydF4y2Ba
1.204gydF4y2Ba
0.502gydF4y2Ba
1.147gydF4y2Ba
0.57gydF4y2Ba
1.236gydF4y2Ba
9gydF4y2Ba
0.389gydF4y2Ba
0.676gydF4y2Ba
0.352gydF4y2Ba
0.764gydF4y2Ba
0.851gydF4y2Ba
0.86gydF4y2Ba
0.884gydF4y2Ba
1.171gydF4y2Ba
0.631gydF4y2Ba
1.098gydF4y2Ba
0.558gydF4y2Ba
1.197gydF4y2Ba
10gydF4y2Ba
0.621gydF4y2Ba
0.624gydF4y2Ba
0.445gydF4y2Ba
0.765gydF4y2Ba
0.74gydF4y2Ba
0.859gydF4y2Ba
0.889gydF4y2Ba
1.166gydF4y2Ba
0.67gydF4y2Ba
1.096gydF4y2Ba
1.087gydF4y2Ba
1.19gydF4y2Ba
11gydF4y2Ba
0.304gydF4y2Ba
0.595gydF4y2Ba
0.231gydF4y2Ba
0.704gydF4y2Ba
0.3gydF4y2Ba
0.773gydF4y2Ba
0.78gydF4y2Ba
1.153gydF4y2Ba
0.816gydF4y2Ba
1.082gydF4y2Ba
0.567gydF4y2Ba
1.182gydF4y2Ba
12gydF4y2Ba
0.599gydF4y2Ba
0.808gydF4y2Ba
0.831gydF4y2Ba
0.908gydF4y2Ba
0.729gydF4y2Ba
1.076gydF4y2Ba
1.201gydF4y2Ba
1.535gydF4y2Ba
1.174gydF4y2Ba
1.366gydF4y2Ba
1.563 *gydF4y2Ba
1.528gydF4y2Ba
13gydF4y2Ba
0.353gydF4y2Ba
0.646gydF4y2Ba
0.435gydF4y2Ba
0.723gydF4y2Ba
0.531gydF4y2Ba
0.826gydF4y2Ba
0.366gydF4y2Ba
1.118gydF4y2Ba
0.532gydF4y2Ba
1.06gydF4y2Ba
0.369gydF4y2Ba
1.124gydF4y2Ba
14gydF4y2Ba
0.359gydF4y2Ba
0.665gydF4y2Ba
0.407gydF4y2Ba
0.73gydF4y2Ba
0.267gydF4y2Ba
0.752gydF4y2Ba
0.653gydF4y2Ba
1.157gydF4y2Ba
0.825gydF4y2Ba
1.087gydF4y2Ba
0.597gydF4y2Ba
1.18gydF4y2Ba
15gydF4y2Ba
0.381gydF4y2Ba
0.717gydF4y2Ba
0.707gydF4y2Ba
0.801gydF4y2Ba
0.78gydF4y2Ba
0.922gydF4y2Ba
0.691gydF4y2Ba
1.246gydF4y2Ba
0.838gydF4y2Ba
1.166gydF4y2Ba
0.674gydF4y2Ba
1.293gydF4y2Ba
16gydF4y2Ba
0.299gydF4y2Ba
0.749gydF4y2Ba
0.538gydF4y2Ba
0.833gydF4y2Ba
0.307gydF4y2Ba
0.989gydF4y2Ba
0.613gydF4y2Ba
1.342gydF4y2Ba
0.456gydF4y2Ba
1.252gydF4y2Ba
1.059gydF4y2Ba
1.372gydF4y2Ba
17gydF4y2Ba
0.321gydF4y2Ba
0.649gydF4y2Ba
0.219gydF4y2Ba
0.726gydF4y2Ba
0.222gydF4y2Ba
0.806gydF4y2Ba
0.657gydF4y2Ba
1.059gydF4y2Ba
0.492gydF4y2Ba
0.943gydF4y2Ba
0.529gydF4y2Ba
1.046gydF4y2Ba
18gydF4y2Ba
0.473gydF4y2Ba
0.645gydF4y2Ba
0.486gydF4y2Ba
0.723gydF4y2Ba
0.628gydF4y2Ba
0.767gydF4y2Ba
0.474gydF4y2Ba
1.164gydF4y2Ba
0.539gydF4y2Ba
1.091gydF4y2Ba
0.578gydF4y2Ba
1.185gydF4y2Ba
19gydF4y2Ba
0.592gydF4y2Ba
0.741gydF4y2Ba
0.479gydF4y2Ba
0.824gydF4y2Ba
0.631gydF4y2Ba
0.982gydF4y2Ba
1.68 *gydF4y2Ba
1.317gydF4y2Ba
1.094gydF4y2Ba
1.248gydF4y2Ba
1.403 *gydF4y2Ba
1.342gydF4y2Ba
20.gydF4y2Ba
0.767 *gydF4y2Ba
0.621gydF4y2Ba
0.586gydF4y2Ba
0.695gydF4y2Ba
0.561gydF4y2Ba
0.752gydF4y2Ba
0.267gydF4y2Ba
1.037gydF4y2Ba
0.288gydF4y2Ba
0.964gydF4y2Ba
0.492gydF4y2Ba
1.053gydF4y2Ba
21gydF4y2Ba
0.389gydF4y2Ba
0.548gydF4y2Ba
0.416gydF4y2Ba
0.693gydF4y2Ba
0.472gydF4y2Ba
0.757gydF4y2Ba
1.034gydF4y2Ba
1.037gydF4y2Ba
0.813gydF4y2Ba
0.978gydF4y2Ba
0.823gydF4y2Ba
1.061gydF4y2Ba
22gydF4y2Ba
0.256gydF4y2Ba
0.654gydF4y2Ba
0.433gydF4y2Ba
0.721gydF4y2Ba
0.49gydF4y2Ba
0.8gydF4y2Ba
0.532gydF4y2Ba
1.095gydF4y2Ba
0.602gydF4y2Ba
1.053gydF4y2Ba
0.569gydF4y2Ba
1.123gydF4y2Ba
23gydF4y2Ba
0.631gydF4y2Ba
0.694gydF4y2Ba
0.707gydF4y2Ba
0.775gydF4y2Ba
0.632gydF4y2Ba
0.877gydF4y2Ba
0.86gydF4y2Ba
1.196gydF4y2Ba
0.677gydF4y2Ba
1.125gydF4y2Ba
0.925gydF4y2Ba
1.242gydF4y2Ba
24gydF4y2Ba
0.376gydF4y2Ba
0.655gydF4y2Ba
0.648gydF4y2Ba
0.655gydF4y2Ba
0.406gydF4y2Ba
0.699gydF4y2Ba
1.23 *gydF4y2Ba
1.099gydF4y2Ba
0.927gydF4y2Ba
1.031gydF4y2Ba
1.138 *gydF4y2Ba
1.123gydF4y2Ba
25gydF4y2Ba
0.869 *gydF4y2Ba
0.674gydF4y2Ba
1 *gydF4y2Ba
0.754gydF4y2Ba
1.194 *gydF4y2Ba
0.85gydF4y2Ba
2.337 *gydF4y2Ba
1.156gydF4y2Ba
2.119 *gydF4y2Ba
1.094gydF4y2Ba
2.303 *gydF4y2Ba
1.185gydF4y2Ba
26gydF4y2Ba
0.657 *gydF4y2Ba
0.618gydF4y2Ba
0.683gydF4y2Ba
0.736gydF4y2Ba
0.747gydF4y2Ba
0.856gydF4y2Ba
0.696gydF4y2Ba
1.151gydF4y2Ba
0.52gydF4y2Ba
1.114gydF4y2Ba
0.7gydF4y2Ba
1.176gydF4y2Ba
27gydF4y2Ba
0.378gydF4y2Ba
0.85gydF4y2Ba
0.452gydF4y2Ba
0.938gydF4y2Ba
0.432gydF4y2Ba
1.104gydF4y2Ba
0.588gydF4y2Ba
1.631gydF4y2Ba
0.667gydF4y2Ba
1.445gydF4y2Ba
0.771gydF4y2Ba
1.629gydF4y2Ba
28gydF4y2Ba
1.013 *gydF4y2Ba
0.67gydF4y2Ba
0.963 *gydF4y2Ba
0.764gydF4y2Ba
1.526 *gydF4y2Ba
0.913gydF4y2Ba
1.255gydF4y2Ba
1.259gydF4y2Ba
1.375 *gydF4y2Ba
1.181gydF4y2Ba
1.332 *gydF4y2Ba
1.282gydF4y2Ba
简历计算SD除以平均预测蛋白质丰度值的一组特定的基因(集团)。由分子量蛋白质预测值归一化计算之前的简历。PCV CV值的均值计算通过排列测试选择的操纵子。gydF4y2Ba * CV值大于PCV。gydF4y2Ba
进一步说明当前测量色散(CV)相比之下的交换系数的分布变化,我们还计算出百分比分数所有系数的变化,基于同一操纵子基因的生物知识分散应该低于排列的基因集,因此百分比分数将低。计算结果表明,即使简历对于大多数组织小于均值CV值排列的基因集,百分比分数显示,只有一小批这些群体属于百分比小于0.20。组与百分位的百分比分数小于0.2为43%到57%,和57%到61%的数据集数据集1和2,分别。gydF4y2Ba
3.4。比较以前的人工神经网络方法(GBT和ZIP)gydF4y2Ba
类似于GBT方法,人工神经网络方法旨在确定一个未知的和潜在的蛋白质组学和mRNA丰富数据之间的非线性关系,这区别于邮政法,线性假设[zero-inflatedgydF4y2Ba18gydF4y2Ba ]。另一个关键的区别是,GBT和基于神经网络方法利用额外的序列信息,如细胞的作用,基因长度、氨基酸用法,和密码子使用翻译效率模型被认为是重要的转录组和蛋白质组学数据集之间的关系,而压缩方法建立蛋白质组之间的关系和mRNA完全基于实验转录组和蛋白质组学数据集。gydF4y2Ba
一些改进的角度观察验证预测的神经网络模型相比,GBT模型。操纵子组与简历的百分比小于排列的简历相比,82%到89%的数据集1 GBT模型的75%到79%。操纵子组与简历的百分比小于变更履历数据集2 79%到89%的神经网络模型相比,75%到82%的GBT模型。数据集1组的百分比,百分比分数小于0.2 43%到57%的神经网络模型相比,36%到50%的GBT模型。数据集2组的百分比,百分比分数小于0.2 57%到61%在神经网络模型相比,32%到54%的GBT模型。数据集的确定系数是0.47到0.58 1和0.62到0.68的数据集2神经网络模型相比,0.39到0.58的两个数据集GBT模型,证明了人工神经网络模型可能是一个不错的选择在失踪的蛋白质组学分析值。gydF4y2Ba
3.5。分析因素归因于缺少蛋白质测量gydF4y2Ba
通过神经网络模型,大多数实验未被发现的蛋白质被预测蛋白质丰度大于1.0肽。这对我们这样诱惑调查可能的因素可以归结为丢失的蛋白值。为此,我们收集了一些蛋白质或信使rna / DNA序列的特性可能影响蛋白质检测能力以及实验转录组数据使用逻辑回归过程来确定它们的相对贡献蛋白质的检测能力gydF4y2Bad . vulagrisgydF4y2Ba 基因组。特性/测量我们使用来自以下几个类别:(i)功能相关基因的表现度:实验mRNA丰富数据,gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
和CAI值(gydF4y2Ba33gydF4y2Ba ,gydF4y2Ba34gydF4y2Ba ),密码子使用如CR_axis1-CR_axis4、t3, c3作物,a3, g3, GC3s, GC含量(gydF4y2Ba35gydF4y2Ba ];(2)功能相关的蛋白质和RNA稳定性:蛋白质不稳定指数和AliphaticIndex和最小自由能(MFE)的RNA (gydF4y2Ba35gydF4y2Ba ];(3)功能相关蛋白溶解度:蛋白质溶解度大的平均指数等水疗法(肉汁)gydF4y2Ba33gydF4y2Ba ];(iv)氨基酸AA_axis1-AA_axis4等使用,和其他如基因长度(gydF4y2Ba35gydF4y2Ba ]。SAS软件包中的逻辑回归程序被用于实验的概率模型的蛋白质是否会检测到的基因/蛋白特性和测量。逐步选择法选择那些最有影响力的因素表明缺少蛋白质组学价值。自动删除这些高度相关的特性。0.05意义阈值用于逐步选择。mRNA丰度和基因长度值都log2转换过程中使用。蛋白质稳定指数、aliphaticIndex和gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
值除以10,CAI, N_MFE,肉汁,AA_axis1-AA_axis4, CR_axis1-CR_axis4都乘以10,比例为1。这个标准不会改变结果,但简化的结果。gydF4y2Ba
表gydF4y2Ba2gydF4y2Ba 和gydF4y2Ba3gydF4y2Ba 现在每个数据集的选择因素的优势比数据集1和2,分别。结果表明,高度相关的一些特性与失踪的蛋白质组的概率值。对于数据集1,发现7个因素的回归模型。积极的特性(即与失踪的蛋白质组的概率值。,when the features/measurement increase), protein instability index which provides an estimate of the stability of a given protein in a test tube [38gydF4y2Ba )被发现是最重要的因素为所有三个生长条件,和aliphaticIndex被认为是一种积极因素增加的球状蛋白质的热稳定性(gydF4y2Ba39gydF4y2Ba ),发现了显著的增长条件会和FL,但不是条件LS。此外,AA_axis2和CR_axis3强烈相关肉汁和g3,分别和他们也发现在所有三个重要的增长条件,而对LS N_MFE只是重要条件(表gydF4y2Ba2gydF4y2Ba )。数据集2的特性在回归模型更相同的数据集1中的三个生长条件,表明这些因素在实验平台上可以通用。六个功能重要数据集1也发现所有的条件和影响概率的关键方向相同数据集2包括mRNA丰富,蛋白质不稳定指数,基因长度,gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
、CAI和AA_axis2对应肉汁(表gydF4y2Ba3gydF4y2Ba )。一般来说,较小的分析表明,这些蛋白质mRNA表达值,小gydF4y2Ba
gydF4y2Ba
gydF4y2Ba
价值,更高的蛋白质不稳定指数,或aliphaticIndex价值高,有更大的概率失踪的蛋白质组值gydF4y2Bad .寻常的gydF4y2Ba 数据集。在此基础上初步分析,可以应用逻辑回归模型来预测给定的蛋白质是否会或不会被发现通过选择一个合适的阈值对预测概率。gydF4y2Ba
数据集1gydF4y2Ba
噢gydF4y2Ba
FLgydF4y2Ba
LSgydF4y2Ba
效果gydF4y2Ba
点估计gydF4y2Ba
瓦尔德的95%置信区间gydF4y2Ba
点估计gydF4y2Ba
瓦尔德的95%置信区间gydF4y2Ba
点估计gydF4y2Ba
瓦尔德的95%置信区间gydF4y2Ba
log2 mRNA的gydF4y2Ba
0.458gydF4y2Ba
0.405gydF4y2Ba
0.517gydF4y2Ba
0.442gydF4y2Ba
0.392gydF4y2Ba
0.499gydF4y2Ba
0.405gydF4y2Ba
0.348gydF4y2Ba
0.471gydF4y2Ba
蛋白质不稳定指数/ 10gydF4y2Ba
1.628gydF4y2Ba
1.379gydF4y2Ba
1.922gydF4y2Ba
1.493gydF4y2Ba
1.282gydF4y2Ba
1.739gydF4y2Ba
1.539gydF4y2Ba
1.297gydF4y2Ba
1.825gydF4y2Ba
log2基因长度的gydF4y2Ba
0.477gydF4y2Ba
0.373gydF4y2Ba
0.608gydF4y2Ba
0.517gydF4y2Ba
0.415gydF4y2Ba
0.644gydF4y2Ba
0.419gydF4y2Ba
0.324gydF4y2Ba
0.543gydF4y2Ba
数控gydF4y2Ba / 10gydF4y2Ba
0.465gydF4y2Ba
0.271gydF4y2Ba
0.798gydF4y2Ba
0.446gydF4y2Ba
0.272gydF4y2Ba
0.732gydF4y2Ba
0.314gydF4y2Ba
0.174gydF4y2Ba
0.566gydF4y2Ba
蔡* 10gydF4y2Ba
0.295gydF4y2Ba
0.212gydF4y2Ba
0.410gydF4y2Ba
0.275gydF4y2Ba
0.204gydF4y2Ba
0.370gydF4y2Ba
0.222gydF4y2Ba
0.155gydF4y2Ba
0.319gydF4y2Ba
AA_axis2 * 10gydF4y2Ba
1.368gydF4y2Ba
1.193gydF4y2Ba
1.569gydF4y2Ba
1.326gydF4y2Ba
1.170gydF4y2Ba
1.502gydF4y2Ba
1.323gydF4y2Ba
1.166gydF4y2Ba
1.501gydF4y2Ba
CR_axis3 * 10gydF4y2Ba
1.264gydF4y2Ba
1.046gydF4y2Ba
1.528gydF4y2Ba
1.309gydF4y2Ba
1.112gydF4y2Ba
1.541gydF4y2Ba
1.327gydF4y2Ba
1.092gydF4y2Ba
1.613gydF4y2Ba
N_MFE * 10gydF4y2Ba
- - - - - -gydF4y2Ba
- - - - - -gydF4y2Ba
- - - - - -gydF4y2Ba
- - - - - -gydF4y2Ba
- - - - - -gydF4y2Ba
- - - - - -gydF4y2Ba
1.880gydF4y2Ba
1.178gydF4y2Ba
3.000gydF4y2Ba
AliphaticIndex / 10gydF4y2Ba
1.140gydF4y2Ba
1.013gydF4y2Ba
1.282gydF4y2Ba
1.160gydF4y2Ba
1.040gydF4y2Ba
1.294gydF4y2Ba
- - - - - -gydF4y2Ba
- - - - - -gydF4y2Ba
- - - - - -gydF4y2Ba
数据集2gydF4y2Ba
CT0gydF4y2Ba
CT120gydF4y2Ba
ST120gydF4y2Ba
效果gydF4y2Ba
点估计gydF4y2Ba
瓦尔德的95%置信区间gydF4y2Ba
点估计gydF4y2Ba
瓦尔德的95%置信区间gydF4y2Ba
点估计gydF4y2Ba
瓦尔德的95%置信区间gydF4y2Ba
log2 mRNA的gydF4y2Ba
0.407gydF4y2Ba
0.370gydF4y2Ba
0.448gydF4y2Ba
0.451gydF4y2Ba
0.412gydF4y2Ba
0.494gydF4y2Ba
0.499gydF4y2Ba
0.459gydF4y2Ba
0.542gydF4y2Ba
蛋白质不稳定指数/ 10gydF4y2Ba
1.310gydF4y2Ba
1.161gydF4y2Ba
1.478gydF4y2Ba
1.283gydF4y2Ba
1.140gydF4y2Ba
1.444gydF4y2Ba
1.264gydF4y2Ba
1.124gydF4y2Ba
1.421gydF4y2Ba
log2基因长度的gydF4y2Ba
0.261gydF4y2Ba
0.216gydF4y2Ba
0.315gydF4y2Ba
0.287gydF4y2Ba
0.240gydF4y2Ba
0.345gydF4y2Ba
0.294gydF4y2Ba
0.247gydF4y2Ba
0.352gydF4y2Ba
数控gydF4y2Ba / 10gydF4y2Ba
0.512gydF4y2Ba
0.336gydF4y2Ba
0.780gydF4y2Ba
0.518gydF4y2Ba
0.343gydF4y2Ba
0.783gydF4y2Ba
0.552gydF4y2Ba
0.374gydF4y2Ba
0.815gydF4y2Ba
肉汁* 10gydF4y2Ba
0.914gydF4y2Ba
0.862gydF4y2Ba
0.970gydF4y2Ba
0.914gydF4y2Ba
0.863gydF4y2Ba
0.968gydF4y2Ba
0.923gydF4y2Ba
0.873gydF4y2Ba
0.977gydF4y2Ba
蔡* 10gydF4y2Ba
0.599gydF4y2Ba
0.421gydF4y2Ba
0.851gydF4y2Ba
0.559gydF4y2Ba
0.398gydF4y2Ba
0.786gydF4y2Ba
0.536gydF4y2Ba
0.384gydF4y2Ba
0.749gydF4y2Ba
AA_axis1 * 10gydF4y2Ba
0.686gydF4y2Ba
0.627gydF4y2Ba
0.750gydF4y2Ba
0.681gydF4y2Ba
0.624gydF4y2Ba
0.744gydF4y2Ba
0.686gydF4y2Ba
0.629gydF4y2Ba
0.749gydF4y2Ba
AA_axis2 * 10gydF4y2Ba
1.811gydF4y2Ba
1.558gydF4y2Ba
2.106gydF4y2Ba
1.721gydF4y2Ba
1.487gydF4y2Ba
1.990gydF4y2Ba
1.674gydF4y2Ba
1.452gydF4y2Ba
1.931gydF4y2Ba
AA_axis4 * 10gydF4y2Ba
0.827gydF4y2Ba
0.747gydF4y2Ba
0.916gydF4y2Ba
0.837gydF4y2Ba
0.757gydF4y2Ba
0.925gydF4y2Ba
0.846gydF4y2Ba
0.767gydF4y2Ba
0.934gydF4y2Ba
CR_axis1 * 10gydF4y2Ba
0.771gydF4y2Ba
0.647gydF4y2Ba
0.919gydF4y2Ba
0.780gydF4y2Ba
0.657gydF4y2Ba
0.925gydF4y2Ba
0.781gydF4y2Ba
0.660gydF4y2Ba
0.923gydF4y2Ba
CR_axis4 * 10gydF4y2Ba
0.716gydF4y2Ba
0.635gydF4y2Ba
0.808gydF4y2Ba
0.706gydF4y2Ba
0.627gydF4y2Ba
0.795gydF4y2Ba
0.725gydF4y2Ba
0.645gydF4y2Ba
0.814gydF4y2Ba
3.6。数据解释使用估算的数据集gydF4y2Ba
总共有308 - 354蛋白实验确定数据集1,和986 - 1001蛋白实验确定了数据集2,略超过整个蛋白质组的10 - 30%gydF4y2Bad .寻常的gydF4y2Ba 。通过ANN建模和归责通过整合转录组和蛋白质组数据,我们可以将丰度值分配给大约33 - 3400蛋白(依赖于生长条件),约96 - 98%的整个蛋白质组gydF4y2Bad .寻常的gydF4y2Ba 。使用估算的数据集,我们首先分析了蛋白质时参与能量代谢gydF4y2Bad .寻常的gydF4y2Ba 生长在三个培养条件(我Lactate-based指数增长阶段;LS: Lactate-based增长在固定相;在指数期FL: Formate-based增长)。如表所示gydF4y2Ba4gydF4y2Ba 等蛋白质参与能量代谢,甚至ATP合酶通常表示在相对较高的水平,明显缺少蛋白质组数据仍是明显的在实验数据集,9个国家中只有两个假定的ATP合酶蛋白质实验发现在三个生长条件。通过分析估算蛋白质丰富的所有假定的ATP合酶蛋白,观察差别明显的趋势对这些LS和FL条件与我相比条件,这是符合前面的数据表明乳酸是一种良好的电子供体gydF4y2Bad .寻常的gydF4y2Ba (gydF4y2Ba22gydF4y2Ba ]。当比较lactate-based增长与formate-based指数期,我们发现酶甲酸利用预测调节甲酸在增长(表gydF4y2Ba4gydF4y2Ba )。据报道,c -型细胞色素在硫酸盐还原细菌中表达的高度gydF4y2Ba20.gydF4y2Ba ),然而,只有少量的c -型细胞色素蛋白质已确定gydF4y2Bad .寻常的gydF4y2Ba 蛋白质组(表gydF4y2Ba4gydF4y2Ba ),可能由于c -型细胞色素进行复杂的转译后的成熟过程包括共价连接的血红素组(gydF4y2Ba40gydF4y2Ba ]。通过ANN模型显著预测在各种细胞色素c的表达蛋白质gydF4y2Bad .寻常的gydF4y2Ba 在三个条件下生长。一般来说,细胞色素c蛋白预测有较高的表达在指数期乳酸和formate-based媒体比固定相,符合他们的重要角色在快速增长的电子转移(gydF4y2Ba20.gydF4y2Ba ]。两个细胞质氢化酶(电解珩磨和首席运营官)以前分配的假定的功能生成氢在细胞质中gydF4y2Ba20.gydF4y2Ba ]。与之前的预测相一致的压缩模式gydF4y2Ba18gydF4y2Ba ),ANN模型预测,所有子单元的电解珩磨氢化酶(EchACDE)调节,当所有子单元的首席运营官氢化酶(CooHLUX)对formate-based增长被抑制,表明他们在H微分作用gydF4y2Ba2gydF4y2Ba 一代成长时不同的碳源。我们也使用了估算数据分析时的应激反应gydF4y2Bad .寻常的gydF4y2Ba 盐胁迫下细胞治疗。某些蛋白质的分析允许鉴定没有实验发现,然而,被预测调节盐处理条件下(ST120)与控制(CT120)(表gydF4y2Ba5gydF4y2Ba )。其中有多药耐药性转运蛋白和各种蛋白质和一些信号转导蛋白。这个列表的蛋白质可以作为公认的候选人为进一步实验验证。一般来说,我们的分析表明,生物的解释可能受益于使用计算方法将丢失的数据通过整合时间转录组和蛋白质组数据。所有protein-abundance预测蛋白质的完整列表提供了表2的补充材料。gydF4y2Ba
Gene_IDgydF4y2Ba
蛋白质abundance-Predicted-LL条件gydF4y2Ba
RNA abundance-Measured-LL条件gydF4y2Ba
蛋白质abundance-Measured-LL条件gydF4y2Ba
蛋白质abundance-Predicted-LS条件gydF4y2Ba
RNA abundance-Measured-LS条件gydF4y2Ba
蛋白质abundance-Measured-LS条件gydF4y2Ba
蛋白质abundance-Predicted-FL条件gydF4y2Ba
RNA abundance-Measured-FL条件gydF4y2Ba
蛋白质abundance-Measured-FL条件gydF4y2Ba
描述gydF4y2Ba
DVU0918gydF4y2Ba
10.08gydF4y2Ba
2315.20gydF4y2Ba
xgydF4y2Ba
2.46gydF4y2Ba
416.75gydF4y2Ba
xgydF4y2Ba
5.71gydF4y2Ba
1668.90gydF4y2Ba
xgydF4y2Ba
ATP合酶F0、亚基(gydF4y2BaatpBgydF4y2Ba )gydF4y2Ba
DVU0779gydF4y2Ba
6.55gydF4y2Ba
2505.40gydF4y2Ba
xgydF4y2Ba
3.30gydF4y2Ba
497.75gydF4y2Ba
xgydF4y2Ba
5.08gydF4y2Ba
1397.10gydF4y2Ba
xgydF4y2Ba
ATP合酶F0, B亚基gydF4y2Ba
DVU0780gydF4y2Ba
6.62gydF4y2Ba
3156.20gydF4y2Ba
xgydF4y2Ba
3.88gydF4y2Ba
1050.10gydF4y2Ba
xgydF4y2Ba
5.81gydF4y2Ba
2352.70gydF4y2Ba
xgydF4y2Ba
ATP合酶F0, B亚基gydF4y2Ba
DVU0917gydF4y2Ba
7.60gydF4y2Ba
6086.50gydF4y2Ba
xgydF4y2Ba
3.85gydF4y2Ba
1234.90gydF4y2Ba
xgydF4y2Ba
10.85gydF4y2Ba
5944.40gydF4y2Ba
xgydF4y2Ba
ATP合酶F0, C亚基(gydF4y2BaatpEgydF4y2Ba )gydF4y2Ba
DVU0920gydF4y2Ba
3.80gydF4y2Ba
1590.50gydF4y2Ba
xgydF4y2Ba
3.59gydF4y2Ba
947.88gydF4y2Ba
xgydF4y2Ba
5.75gydF4y2Ba
1198.20gydF4y2Ba
xgydF4y2Ba
ATP合酶蛋白I (gydF4y2BaatpIgydF4y2Ba )gydF4y2Ba
DVU0777gydF4y2Ba
39.24gydF4y2Ba
2535.00gydF4y2Ba
20.00gydF4y2Ba
8.40gydF4y2Ba
369.95gydF4y2Ba
8.00gydF4y2Ba
17.76gydF4y2Ba
735.68gydF4y2Ba
17.33gydF4y2Ba
ATP合酶,F1α亚基(gydF4y2BaatpAgydF4y2Ba )gydF4y2Ba
DVU0775gydF4y2Ba
50.11gydF4y2Ba
2228.60gydF4y2Ba
49.33gydF4y2Ba
23.76gydF4y2Ba
711.53gydF4y2Ba
30.33gydF4y2Ba
39.80gydF4y2Ba
1198.40gydF4y2Ba
38.33gydF4y2Ba
ATP合酶,F1β亚基(gydF4y2BaatpDgydF4y2Ba )gydF4y2Ba
DVU0778gydF4y2Ba
4.25gydF4y2Ba
1974.50gydF4y2Ba
xgydF4y2Ba
2.71gydF4y2Ba
374.22gydF4y2Ba
xgydF4y2Ba
3.21gydF4y2Ba
714.57gydF4y2Ba
xgydF4y2Ba
ATP合酶,F1δ亚基(gydF4y2BaatpHgydF4y2Ba )gydF4y2Ba
DVU0774gydF4y2Ba
4.85gydF4y2Ba
2043.70gydF4y2Ba
xgydF4y2Ba
2.32gydF4y2Ba
336.55gydF4y2Ba
xgydF4y2Ba
4.14gydF4y2Ba
1113.40gydF4y2Ba
xgydF4y2Ba
ATP合酶,F1ε亚基(gydF4y2BaatpCgydF4y2Ba )gydF4y2Ba
DVU0702gydF4y2Ba
2.62gydF4y2Ba
288.72gydF4y2Ba
xgydF4y2Ba
2.20gydF4y2Ba
372.82gydF4y2Ba
xgydF4y2Ba
2.05gydF4y2Ba
417.68gydF4y2Ba
1.00gydF4y2Ba
细胞色素c家族蛋白gydF4y2Ba
DVU0922gydF4y2Ba
1.69gydF4y2Ba
66.60gydF4y2Ba
xgydF4y2Ba
1.85gydF4y2Ba
149.38gydF4y2Ba
xgydF4y2Ba
1.49gydF4y2Ba
149.52gydF4y2Ba
xgydF4y2Ba
细胞色素c家族蛋白gydF4y2Ba
DVU1288gydF4y2Ba
3.44gydF4y2Ba
1172.20gydF4y2Ba
xgydF4y2Ba
2.06gydF4y2Ba
298.10gydF4y2Ba
xgydF4y2Ba
3.12gydF4y2Ba
826.90gydF4y2Ba
xgydF4y2Ba
细胞色素c家族蛋白gydF4y2Ba
DVU2483gydF4y2Ba
10.24gydF4y2Ba
456.23gydF4y2Ba
xgydF4y2Ba
3.24gydF4y2Ba
284.22gydF4y2Ba
xgydF4y2Ba
7.36gydF4y2Ba
490.33gydF4y2Ba
xgydF4y2Ba
细胞色素c家族蛋白gydF4y2Ba
DVU2484gydF4y2Ba
5.06gydF4y2Ba
575.50gydF4y2Ba
xgydF4y2Ba
2.39gydF4y2Ba
277.35gydF4y2Ba
xgydF4y2Ba
4.63gydF4y2Ba
665.95gydF4y2Ba
xgydF4y2Ba
细胞色素c家族蛋白gydF4y2Ba
DVU2791gydF4y2Ba
4.77gydF4y2Ba
683.65gydF4y2Ba
xgydF4y2Ba
2.61gydF4y2Ba
530.00gydF4y2Ba
xgydF4y2Ba
3.32gydF4y2Ba
667.05gydF4y2Ba
xgydF4y2Ba
细胞色素c家族蛋白gydF4y2Ba
DVU3107gydF4y2Ba
15.10gydF4y2Ba
1009.30gydF4y2Ba
2.33gydF4y2Ba
2.98gydF4y2Ba
177.15gydF4y2Ba
1.67gydF4y2Ba
13.04gydF4y2Ba
1026.30gydF4y2Ba
3.00gydF4y2Ba
细胞色素c家族蛋白gydF4y2Ba
DVU3144gydF4y2Ba
5.58gydF4y2Ba
297.85gydF4y2Ba
xgydF4y2Ba
3.58gydF4y2Ba
142.45gydF4y2Ba
xgydF4y2Ba
8.24gydF4y2Ba
342.52gydF4y2Ba
xgydF4y2Ba
细胞色素c家族蛋白gydF4y2Ba
DVU0625gydF4y2Ba
30.20gydF4y2Ba
1822.80gydF4y2Ba
xgydF4y2Ba
14.80gydF4y2Ba
764.85gydF4y2Ba
xgydF4y2Ba
16.61gydF4y2Ba
2467.50gydF4y2Ba
xgydF4y2Ba
细胞色素c亚硝酸还原酶,催化亚基NfrAgydF4y2Ba
DVU1815gydF4y2Ba
4.91gydF4y2Ba
439.87gydF4y2Ba
xgydF4y2Ba
2.98gydF4y2Ba
324.93gydF4y2Ba
xgydF4y2Ba
7.12gydF4y2Ba
833.88gydF4y2Ba
xgydF4y2Ba
细胞色素c氧化酶亚基gydF4y2Ba
DVU1812gydF4y2Ba
4.42gydF4y2Ba
304.57gydF4y2Ba
xgydF4y2Ba
2.72gydF4y2Ba
215.70gydF4y2Ba
xgydF4y2Ba
4.63gydF4y2Ba
335.70gydF4y2Ba
xgydF4y2Ba
细胞色素c氧化酶亚基二世gydF4y2Ba
DVU1814gydF4y2Ba
2.53gydF4y2Ba
397.35gydF4y2Ba
xgydF4y2Ba
2.31gydF4y2Ba
283.90gydF4y2Ba
xgydF4y2Ba
3.80gydF4y2Ba
898.67gydF4y2Ba
xgydF4y2Ba
细胞色素c氧化酶亚基IIIgydF4y2Ba
DVU2809gydF4y2Ba
3.11gydF4y2Ba
447.42gydF4y2Ba
xgydF4y2Ba
2.32gydF4y2Ba
395.15gydF4y2Ba
xgydF4y2Ba
2.10gydF4y2Ba
601.50gydF4y2Ba
xgydF4y2Ba
细胞色素c3gydF4y2Ba
DVU3171gydF4y2Ba
13.24gydF4y2Ba
3937.00gydF4y2Ba
3.33gydF4y2Ba
5.24gydF4y2Ba
966.25gydF4y2Ba
xgydF4y2Ba
11.82gydF4y2Ba
5719.20gydF4y2Ba
1.00gydF4y2Ba
细胞色素c3gydF4y2Ba
DVU2524gydF4y2Ba
1.77gydF4y2Ba
114.95gydF4y2Ba
xgydF4y2Ba
2.08gydF4y2Ba
135.07gydF4y2Ba
xgydF4y2Ba
1.61gydF4y2Ba
170.70gydF4y2Ba
xgydF4y2Ba
细胞色素c3,gydF4y2Ba
DVU3041gydF4y2Ba
3.03gydF4y2Ba
894.60gydF4y2Ba
xgydF4y2Ba
2.62gydF4y2Ba
713.10gydF4y2Ba
xgydF4y2Ba
2.73gydF4y2Ba
684.27gydF4y2Ba
xgydF4y2Ba
细胞色素c553gydF4y2Ba
DVU1817gydF4y2Ba
6.34gydF4y2Ba
2280.00gydF4y2Ba
11.67gydF4y2Ba
7.26gydF4y2Ba
1858.20gydF4y2Ba
3.33gydF4y2Ba
9.61gydF4y2Ba
5400.20gydF4y2Ba
12.00gydF4y2Ba
细胞色素c - 553 (gydF4y2BacyfgydF4y2Ba )gydF4y2Ba
DVU1048gydF4y2Ba
2.31gydF4y2Ba
255.07gydF4y2Ba
xgydF4y2Ba
2.14gydF4y2Ba
243.58gydF4y2Ba
xgydF4y2Ba
1.53gydF4y2Ba
185.47gydF4y2Ba
xgydF4y2Ba
细胞色素c -型生物起源蛋白质CcmB (gydF4y2BaccmBgydF4y2Ba )gydF4y2Ba
DVU1047gydF4y2Ba
2.87gydF4y2Ba
435.45gydF4y2Ba
xgydF4y2Ba
2.06gydF4y2Ba
284.87gydF4y2Ba
xgydF4y2Ba
2.23gydF4y2Ba
259.25gydF4y2Ba
xgydF4y2Ba
细胞色素c -型生物起源蛋白质CcmC (gydF4y2BaccmCgydF4y2Ba )gydF4y2Ba
DVU1051gydF4y2Ba
3.30gydF4y2Ba
915.92gydF4y2Ba
xgydF4y2Ba
3.59gydF4y2Ba
769.45gydF4y2Ba
xgydF4y2Ba
4.19gydF4y2Ba
732.07gydF4y2Ba
xgydF4y2Ba
细胞色素c -型生物起源蛋白质CcmE (gydF4y2BaccmEgydF4y2Ba )gydF4y2Ba
DVU1050gydF4y2Ba
7.42gydF4y2Ba
581.02gydF4y2Ba
xgydF4y2Ba
4.03gydF4y2Ba
408.20gydF4y2Ba
xgydF4y2Ba
6.27gydF4y2Ba
463.25gydF4y2Ba
xgydF4y2Ba
细胞色素c -型生物起源蛋白质CcmF (gydF4y2BaccmFgydF4y2Ba )gydF4y2Ba
DVU3271gydF4y2Ba
35.79gydF4y2Ba
8217.80gydF4y2Ba
xgydF4y2Ba
12.15gydF4y2Ba
2295.10gydF4y2Ba
xgydF4y2Ba
11.38gydF4y2Ba
6954.00gydF4y2Ba
xgydF4y2Ba
细胞色素d泛醇氧化酶亚基我(gydF4y2BacydAgydF4y2Ba )gydF4y2Ba
DVU3270gydF4y2Ba
18.09gydF4y2Ba
3877.70gydF4y2Ba
xgydF4y2Ba
5.50gydF4y2Ba
1145.70gydF4y2Ba
xgydF4y2Ba
13.90gydF4y2Ba
3897.10gydF4y2Ba
xgydF4y2Ba
细胞色素d泛醇氧化酶亚基二世(gydF4y2BacydBgydF4y2Ba )gydF4y2Ba
DVU0434gydF4y2Ba
1.28gydF4y2Ba
177.22gydF4y2Ba
xgydF4y2Ba
2.79gydF4y2Ba
168.72gydF4y2Ba
xgydF4y2Ba
5.13gydF4y2Ba
468.00gydF4y2Ba
xgydF4y2Ba
决定自氢化酶亚基EchAgydF4y2Ba
DVU0433gydF4y2Ba
2.10gydF4y2Ba
217.82gydF4y2Ba
xgydF4y2Ba
2.34gydF4y2Ba
166.95gydF4y2Ba
xgydF4y2Ba
2.84gydF4y2Ba
422.28gydF4y2Ba
xgydF4y2Ba
决定自氢化酶亚基EchBgydF4y2Ba
DVU0432gydF4y2Ba
2.11gydF4y2Ba
222.90gydF4y2Ba
xgydF4y2Ba
2.24gydF4y2Ba
133.13gydF4y2Ba
xgydF4y2Ba
3.12gydF4y2Ba
595.60gydF4y2Ba
xgydF4y2Ba
决定自氢化酶亚基EchCgydF4y2Ba
DVU0431gydF4y2Ba
2.20gydF4y2Ba
303.27gydF4y2Ba
xgydF4y2Ba
2.03gydF4y2Ba
215.73gydF4y2Ba
xgydF4y2Ba
3.30gydF4y2Ba
778.70gydF4y2Ba
xgydF4y2Ba
决定自氢化酶亚基EchDgydF4y2Ba
DVU0430gydF4y2Ba
2.68gydF4y2Ba
259.00gydF4y2Ba
xgydF4y2Ba
2.52gydF4y2Ba
199.20gydF4y2Ba
xgydF4y2Ba
4.61gydF4y2Ba
685.78gydF4y2Ba
xgydF4y2Ba
决定自氢化酶亚基EchEgydF4y2Ba
DVU0429gydF4y2Ba
2.24gydF4y2Ba
239.03gydF4y2Ba
xgydF4y2Ba
2.07gydF4y2Ba
201.57gydF4y2Ba
xgydF4y2Ba
2.05gydF4y2Ba
405.30gydF4y2Ba
xgydF4y2Ba
决定自氢化酶亚基EchFgydF4y2Ba
DVU2824gydF4y2Ba
0.90gydF4y2Ba
124.20gydF4y2Ba
xgydF4y2Ba
3.54gydF4y2Ba
106.78gydF4y2Ba
xgydF4y2Ba
9.30gydF4y2Ba
102.10gydF4y2Ba
xgydF4y2Ba
甲酸乙酰转移酶gydF4y2Ba
DVU2272gydF4y2Ba
1.05gydF4y2Ba
97.08gydF4y2Ba
xgydF4y2Ba
3.69gydF4y2Ba
113.33gydF4y2Ba
1.00gydF4y2Ba
16.21gydF4y2Ba
160.88gydF4y2Ba
xgydF4y2Ba
甲酸乙酰转移酶gydF4y2Ba
DVU0578gydF4y2Ba
2.11gydF4y2Ba
154.12gydF4y2Ba
xgydF4y2Ba
2.23gydF4y2Ba
217.48gydF4y2Ba
xgydF4y2Ba
2.03gydF4y2Ba
247.52gydF4y2Ba
xgydF4y2Ba
甲酸脱氢酶蛋白质FdhD配件gydF4y2Ba
DVU0577gydF4y2Ba
2.56gydF4y2Ba
237.93gydF4y2Ba
xgydF4y2Ba
2.29gydF4y2Ba
148.02gydF4y2Ba
xgydF4y2Ba
1.97gydF4y2Ba
513.40gydF4y2Ba
xgydF4y2Ba
甲酸脱氢酶蛋白FdhE形成gydF4y2Ba
DVU2810gydF4y2Ba
3.39gydF4y2Ba
423.00gydF4y2Ba
xgydF4y2Ba
2.27gydF4y2Ba
312.02gydF4y2Ba
xgydF4y2Ba
2.47gydF4y2Ba
510.12gydF4y2Ba
xgydF4y2Ba
甲酸脱氢酶蛋白FdhE形成gydF4y2Ba
DVU0588gydF4y2Ba
0.92gydF4y2Ba
35.70gydF4y2Ba
xgydF4y2Ba
2.65gydF4y2Ba
35.25gydF4y2Ba
xgydF4y2Ba
1.26gydF4y2Ba
79.03gydF4y2Ba
xgydF4y2Ba
甲酸脱氢酶,β亚基gydF4y2Ba
DVU2481gydF4y2Ba
2.39gydF4y2Ba
227.43gydF4y2Ba
xgydF4y2Ba
2.37gydF4y2Ba
304.92gydF4y2Ba
xgydF4y2Ba
2.35gydF4y2Ba
399.82gydF4y2Ba
xgydF4y2Ba
甲酸脱氢酶,β亚基gydF4y2Ba
DVU2811gydF4y2Ba
3.22gydF4y2Ba
335.33gydF4y2Ba
xgydF4y2Ba
2.52gydF4y2Ba
181.45gydF4y2Ba
xgydF4y2Ba
3.13gydF4y2Ba
435.95gydF4y2Ba
xgydF4y2Ba
甲酸脱氢酶,β亚基gydF4y2Ba
DVU2288gydF4y2Ba
2.68gydF4y2Ba
781.45gydF4y2Ba
xgydF4y2Ba
2.24gydF4y2Ba
412.85gydF4y2Ba
xgydF4y2Ba
1.39gydF4y2Ba
139.17gydF4y2Ba
xgydF4y2Ba
氢化酶,冷却单元gydF4y2Ba
DVU2286gydF4y2Ba
16.67gydF4y2Ba
308.33gydF4y2Ba
xgydF4y2Ba
3.29gydF4y2Ba
138.72gydF4y2Ba
xgydF4y2Ba
6.08gydF4y2Ba
81.55gydF4y2Ba
xgydF4y2Ba
氢化酶,锯屑子单元gydF4y2Ba
DVU2290gydF4y2Ba
2.84gydF4y2Ba
703.22gydF4y2Ba
3.00gydF4y2Ba
2.10gydF4y2Ba
316.45gydF4y2Ba
3.00gydF4y2Ba
xgydF4y2Ba
氢化酶,CooU亚基gydF4y2Ba
DVU2289gydF4y2Ba
3.92gydF4y2Ba
823.18gydF4y2Ba
xgydF4y2Ba
2.14gydF4y2Ba
553.33gydF4y2Ba
xgydF4y2Ba
2.36gydF4y2Ba
319.80gydF4y2Ba
xgydF4y2Ba
氢化酶,CooX亚基gydF4y2Ba
*蛋白质丰度在肽;RNA富足是在原始荧光测量微阵列。“x”表示蛋白质未被发现的实验。gydF4y2Ba
Gene_IDgydF4y2Ba
蛋白质abundance-Predicted-CT120gydF4y2Ba
RNA abundance-Measured-CT120gydF4y2Ba
蛋白质abundance-Measured-CT120gydF4y2Ba
蛋白质abundance-Predicted-ST120gydF4y2Ba
RNA abundance-Measured-ST120gydF4y2Ba
蛋白质abundance-Measured-ST120gydF4y2Ba
描述gydF4y2Ba
氨基酸生物合成gydF4y2Ba
DVU0285gydF4y2Ba
5.00gydF4y2Ba
3005.10gydF4y2Ba
xgydF4y2Ba
7.43gydF4y2Ba
4051.50gydF4y2Ba
xgydF4y2Ba
咪唑甘油磷酸合酶(gydF4y2BahisHgydF4y2Ba )gydF4y2Ba
DVU1665gydF4y2Ba
21.82gydF4y2Ba
20264.00gydF4y2Ba
xgydF4y2Ba
50.55gydF4y2Ba
30766.00gydF4y2Ba
xgydF4y2Ba
3-dehydroquinate脱水酶II型(gydF4y2BaaroQgydF4y2Ba )gydF4y2Ba
代数余子式的生物合成,修复组,和运营商gydF4y2Ba
DVU0157gydF4y2Ba
5.45gydF4y2Ba
7559.00gydF4y2Ba
xgydF4y2Ba
6.31gydF4y2Ba
5092.30gydF4y2Ba
xgydF4y2Ba
Thiamin-monophosphate激酶(gydF4y2BathiLgydF4y2Ba )gydF4y2Ba
DVU0931gydF4y2Ba
5.41gydF4y2Ba
1730.40gydF4y2Ba
xgydF4y2Ba
6.87gydF4y2Ba
4401.40gydF4y2Ba
xgydF4y2Ba
Phosphomethylpyrimidine激酶(gydF4y2BathiDgydF4y2Ba )gydF4y2Ba
DVU1200gydF4y2Ba
5.82gydF4y2Ba
5439.20gydF4y2Ba
xgydF4y2Ba
6.75gydF4y2Ba
5079.60gydF4y2Ba
xgydF4y2Ba
核黄素合酶、α亚基(gydF4y2Ba活性离子束腐蚀gydF4y2Ba )gydF4y2Ba
DVU2749gydF4y2Ba
2.85gydF4y2Ba
1427.30gydF4y2Ba
xgydF4y2Ba
3.59gydF4y2Ba
856.35gydF4y2Ba
xgydF4y2Ba
Precorrin-6Y C5, 15-methyltransferase(脱羧基)(gydF4y2BacobLgydF4y2Ba )gydF4y2Ba
DVU3307gydF4y2Ba
14.65gydF4y2Ba
20224.00gydF4y2Ba
xgydF4y2Ba
26.42gydF4y2Ba
30616.00gydF4y2Ba
xgydF4y2Ba
3-octaprenyl-4-hydroxybenzoate carboxy-lyase (gydF4y2BaubiXgydF4y2Ba )gydF4y2Ba
细胞被膜gydF4y2Ba
DVU0294gydF4y2Ba
2.44gydF4y2Ba
1034.50gydF4y2Ba
xgydF4y2Ba
3.15gydF4y2Ba
726.82gydF4y2Ba
xgydF4y2Ba
糖基转移酶,组2家族蛋白gydF4y2Ba
DVU0308gydF4y2Ba
2.97gydF4y2Ba
1552.00gydF4y2Ba
xgydF4y2Ba
7.93gydF4y2Ba
6986.70gydF4y2Ba
xgydF4y2Ba
膜蛋白gydF4y2Ba
DVU0328gydF4y2Ba
8.59gydF4y2Ba
5628.30gydF4y2Ba
xgydF4y2Ba
9.12gydF4y2Ba
5042.40gydF4y2Ba
xgydF4y2Ba
糖基转移酶,蛋白质组1的家庭gydF4y2Ba
DVU0407gydF4y2Ba
26.65gydF4y2Ba
20237.00gydF4y2Ba
xgydF4y2Ba
38.70gydF4y2Ba
32568.00gydF4y2Ba
xgydF4y2Ba
罕见的脂蛋白家族蛋白gydF4y2Ba
DVU1534gydF4y2Ba
2.48gydF4y2Ba
1792.60gydF4y2Ba
xgydF4y2Ba
3.56gydF4y2Ba
2183.30gydF4y2Ba
xgydF4y2Ba
膜蛋白gydF4y2Ba
DVU2053gydF4y2Ba
2.98gydF4y2Ba
2406.60gydF4y2Ba
xgydF4y2Ba
3.85gydF4y2Ba
2507.60gydF4y2Ba
xgydF4y2Ba
膜蛋白gydF4y2Ba
DVU2102gydF4y2Ba
2.91gydF4y2Ba
628.30gydF4y2Ba
xgydF4y2Ba
3.88gydF4y2Ba
843.26gydF4y2Ba
xgydF4y2Ba
外膜蛋白质,OMP85家庭gydF4y2Ba
DVU2356gydF4y2Ba
20.54gydF4y2Ba
6021.30gydF4y2Ba
xgydF4y2Ba
36.26gydF4y2Ba
7883.90gydF4y2Ba
xgydF4y2Ba
膜蛋白gydF4y2Ba
DVU2672gydF4y2Ba
3.30gydF4y2Ba
3253.30gydF4y2Ba
xgydF4y2Ba
4.47gydF4y2Ba
5875.90gydF4y2Ba
xgydF4y2Ba
膜蛋白gydF4y2Ba
DVU2725gydF4y2Ba
5.20gydF4y2Ba
4925.80gydF4y2Ba
xgydF4y2Ba
13.97gydF4y2Ba
8894.70gydF4y2Ba
xgydF4y2Ba
膜蛋白gydF4y2Ba
细胞过程gydF4y2Ba
DVU0302gydF4y2Ba
28.35gydF4y2Ba
22358.00gydF4y2Ba
xgydF4y2Ba
37.21gydF4y2Ba
21180.00gydF4y2Ba
xgydF4y2Ba
趋化性蛋白质CheXgydF4y2Ba
DVU2069gydF4y2Ba
2.18gydF4y2Ba
811.21gydF4y2Ba
xgydF4y2Ba
3.72gydF4y2Ba
658.60gydF4y2Ba
xgydF4y2Ba
DNA处理蛋白质DprAgydF4y2Ba
DVU2816gydF4y2Ba
4.82gydF4y2Ba
539.18gydF4y2Ba
xgydF4y2Ba
8.65gydF4y2Ba
1502.80gydF4y2Ba
xgydF4y2Ba
多药耐药性的蛋白质gydF4y2Ba
DVU2893gydF4y2Ba
4.59gydF4y2Ba
9413.30gydF4y2Ba
xgydF4y2Ba
6.78gydF4y2Ba
9241.60gydF4y2Ba
xgydF4y2Ba
鞭毛基体杆蛋白质gydF4y2Ba
DVU3326gydF4y2Ba
3.13gydF4y2Ba
782.67gydF4y2Ba
xgydF4y2Ba
3.68gydF4y2Ba
2732.60gydF4y2Ba
xgydF4y2Ba
鼻中隔黏膜下切除术后多药耐药性蛋白质家族gydF4y2Ba
DVUA0002gydF4y2Ba
5.53gydF4y2Ba
2257.50gydF4y2Ba
xgydF4y2Ba
12.96gydF4y2Ba
6384.00gydF4y2Ba
xgydF4y2Ba
帕拉家族的蛋白质gydF4y2Ba
DNA代谢gydF4y2Ba
DVU0878gydF4y2Ba
3.20gydF4y2Ba
1967.30gydF4y2Ba
xgydF4y2Ba
7.13gydF4y2Ba
11149.00gydF4y2Ba
xgydF4y2Ba
dnaK抑制蛋白gydF4y2Ba
DVU1353gydF4y2Ba
2.26gydF4y2Ba
1516.00gydF4y2Ba
xgydF4y2Ba
10.31gydF4y2Ba
868.27gydF4y2Ba
xgydF4y2Ba
DNA聚合酶III,α亚基(gydF4y2BadnaEgydF4y2Ba )gydF4y2Ba
DVU1703gydF4y2Ba
1.93gydF4y2Ba
906.31gydF4y2Ba
xgydF4y2Ba
2.69gydF4y2Ba
628.53gydF4y2Ba
xgydF4y2Ba
I型restriction-modification酶,R单元gydF4y2Ba
能量代谢gydF4y2Ba
DVU0080gydF4y2Ba
4.42gydF4y2Ba
2476.60gydF4y2Ba
xgydF4y2Ba
6.45gydF4y2Ba
5175.70gydF4y2Ba
xgydF4y2Ba
延胡索酸酯酶、类二世(gydF4y2BafumCgydF4y2Ba )gydF4y2Ba
DVU0531gydF4y2Ba
6.57gydF4y2Ba
328.82gydF4y2Ba
xgydF4y2Ba
11.02gydF4y2Ba
1157.90gydF4y2Ba
xgydF4y2Ba
Hmc操纵子蛋白6gydF4y2Ba
DVU2137gydF4y2Ba
3.64gydF4y2Ba
389.78gydF4y2Ba
xgydF4y2Ba
4.45gydF4y2Ba
338.82gydF4y2Ba
xgydF4y2Ba
琥珀酰辅酶合酶、β/α亚基(gydF4y2BasucCDgydF4y2Ba )gydF4y2Ba
其他类别gydF4y2Ba
DVU0197gydF4y2Ba
3.46gydF4y2Ba
933.13gydF4y2Ba
xgydF4y2Ba
4.40gydF4y2Ba
285.54gydF4y2Ba
xgydF4y2Ba
λ噬菌体门户蛋白质、家庭gydF4y2Ba
DVU1490gydF4y2Ba
4.72gydF4y2Ba
351.64gydF4y2Ba
xgydF4y2Ba
5.70gydF4y2Ba
372.18gydF4y2Ba
xgydF4y2Ba
尾巴卷尺蛋白质gydF4y2Ba
监管职能gydF4y2Ba
DVU0063gydF4y2Ba
3.74gydF4y2Ba
3823.20gydF4y2Ba
xgydF4y2Ba
4.79gydF4y2Ba
6404.70gydF4y2Ba
xgydF4y2Ba
转录监管机构——马尔家族gydF4y2Ba
DVU1331gydF4y2Ba
7.54gydF4y2Ba
6812.50gydF4y2Ba
xgydF4y2Ba
8.33gydF4y2Ba
11619.00gydF4y2Ba
xgydF4y2Ba
转录监管机构,LysR家庭gydF4y2Ba
DVU1645gydF4y2Ba
7.22gydF4y2Ba
7075.60gydF4y2Ba
xgydF4y2Ba
14.03gydF4y2Ba
23482.00gydF4y2Ba
xgydF4y2Ba
转录监管机构,ArsR家庭gydF4y2Ba
DVU3062gydF4y2Ba
2.34gydF4y2Ba
1205.40gydF4y2Ba
xgydF4y2Ba
2.92gydF4y2Ba
570.26gydF4y2Ba
xgydF4y2Ba
传感器组氨酸激酶/响应监管机构gydF4y2Ba
DVU3095gydF4y2Ba
12.30gydF4y2Ba
17923.00gydF4y2Ba
xgydF4y2Ba
14.86gydF4y2Ba
23528.00gydF4y2Ba
xgydF4y2Ba
转录监管机构,毛皮的家庭gydF4y2Ba
DVU0721gydF4y2Ba
4.20gydF4y2Ba
1085.90gydF4y2Ba
xgydF4y2Ba
7.19gydF4y2Ba
513.28gydF4y2Ba
xgydF4y2Ba
感觉盒子组氨酸激酶gydF4y2Ba
DVU0834gydF4y2Ba
5.73gydF4y2Ba
2795.50gydF4y2Ba
xgydF4y2Ba
12.17gydF4y2Ba
13860.00gydF4y2Ba
xgydF4y2Ba
核糖核酸酶HII (rnhB)gydF4y2Ba
DVU1075gydF4y2Ba
13.63gydF4y2Ba
30772.00gydF4y2Ba
xgydF4y2Ba
15.45gydF4y2Ba
27576.00gydF4y2Ba
xgydF4y2Ba
核糖核酸酶P蛋白组件(rnpA)gydF4y2Ba
运输和结合蛋白gydF4y2Ba
DVU0593gydF4y2Ba
2.58gydF4y2Ba
992.23gydF4y2Ba
xgydF4y2Ba
3.28gydF4y2Ba
1151.30gydF4y2Ba
xgydF4y2Ba
赖氨酸出口国gydF4y2Ba
DVU1068gydF4y2Ba
3.92gydF4y2Ba
301.98gydF4y2Ba
xgydF4y2Ba
5.76gydF4y2Ba
270.52gydF4y2Ba
xgydF4y2Ba
支链氨基酸ABC转运蛋白,通透酶蛋白质gydF4y2Ba
DVU2340gydF4y2Ba
6.00gydF4y2Ba
11276.00gydF4y2Ba
xgydF4y2Ba
7.00gydF4y2Ba
11625.00gydF4y2Ba
xgydF4y2Ba
氨基酸ABC转运蛋白,通透酶蛋白质gydF4y2Ba
DVU2572gydF4y2Ba
3.19gydF4y2Ba
2831.50gydF4y2Ba
xgydF4y2Ba
5.77gydF4y2Ba
7937.50gydF4y2Ba
xgydF4y2Ba
二价铁运输蛋白质gydF4y2Ba
DVU2574gydF4y2Ba
4.62gydF4y2Ba
5005.50gydF4y2Ba
xgydF4y2Ba
8.85gydF4y2Ba
8857.00gydF4y2Ba
xgydF4y2Ba
亚铁离子转运蛋白gydF4y2Ba
DVU2744gydF4y2Ba
17.96gydF4y2Ba
1201.00gydF4y2Ba
xgydF4y2Ba
34.42gydF4y2Ba
3053.50gydF4y2Ba
xgydF4y2Ba
高亲和性支链氨基酸ABC转运蛋白gydF4y2Ba
DVUA0136gydF4y2Ba
3.29gydF4y2Ba
673.57gydF4y2Ba
xgydF4y2Ba
3.89gydF4y2Ba
346.83gydF4y2Ba
xgydF4y2Ba
锌转运体(gydF4y2BazupTgydF4y2Ba )gydF4y2Ba
未知函数gydF4y2Ba
DVU0155gydF4y2Ba
8.35gydF4y2Ba
16519.00gydF4y2Ba
xgydF4y2Ba
12.15gydF4y2Ba
18298.00gydF4y2Ba
xgydF4y2Ba
I型磷酸二酯酶/核苷酸焦磷酸酶家族蛋白质gydF4y2Ba
DVU0938gydF4y2Ba
10.12gydF4y2Ba
15409.00gydF4y2Ba
xgydF4y2Ba
11.76gydF4y2Ba
13138.00gydF4y2Ba
xgydF4y2Ba
异淀粉酶n端结构域的蛋白质gydF4y2Ba
DVU1023gydF4y2Ba
7.26gydF4y2Ba
123.66gydF4y2Ba
xgydF4y2Ba
8.15gydF4y2Ba
144.26gydF4y2Ba
xgydF4y2Ba
菱形家族蛋白质gydF4y2Ba
DVU1202gydF4y2Ba
5.39gydF4y2Ba
3480.30gydF4y2Ba
xgydF4y2Ba
5.92gydF4y2Ba
5395.40gydF4y2Ba
xgydF4y2Ba
胞嘧啶核苷/ deoxycytidylate脱氨酶家族蛋白gydF4y2Ba
DVU1558gydF4y2Ba
5.77gydF4y2Ba
189.07gydF4y2Ba
xgydF4y2Ba
6.47gydF4y2Ba
234.72gydF4y2Ba
xgydF4y2Ba
Cysteine-rich域/ iron-sulfur cluster-binding域蛋白质gydF4y2Ba
DVU1730gydF4y2Ba
3.16gydF4y2Ba
1288.70gydF4y2Ba
xgydF4y2Ba
3.74gydF4y2Ba
4503.10gydF4y2Ba
xgydF4y2Ba
dna结合蛋白质gydF4y2Ba
DVU1745gydF4y2Ba
6.55gydF4y2Ba
319.33gydF4y2Ba
xgydF4y2Ba
7.58gydF4y2Ba
182.38gydF4y2Ba
xgydF4y2Ba
dna结合蛋白质gydF4y2Ba
DVU1747gydF4y2Ba
5.08gydF4y2Ba
258.33gydF4y2Ba
xgydF4y2Ba
12.80gydF4y2Ba
230.72gydF4y2Ba
xgydF4y2Ba
atp酶、组氨酸激酶- DNA促旋酶B -, HSP90-like domainsproteingydF4y2Ba
DVU2036gydF4y2Ba
4.27gydF4y2Ba
1086.70gydF4y2Ba
xgydF4y2Ba
5.07gydF4y2Ba
350.61gydF4y2Ba
xgydF4y2Ba
Helix-turn-helix蛋白质,CopG家庭gydF4y2Ba
DVUA0039gydF4y2Ba
3.75gydF4y2Ba
269.47gydF4y2Ba
xgydF4y2Ba
4.27gydF4y2Ba
261.42gydF4y2Ba
xgydF4y2Ba
链长行列式家族蛋白gydF4y2Ba
*蛋白质丰度在肽;RNA富足是在原始荧光测量微阵列。“x”表示蛋白质未被发现的实验。gydF4y2Ba
总之,缺失值在大规模蛋白质组分析是一个频繁的问题,在某些情况下,它创造了困难为蛋白质组学数据的准确解释复杂的生物系统。然而,尽管它的明显的重要性,方法处理丢失的蛋白质组学数据仍远远落后的方法进行转录组分析。在这项研究中,我们应用人工神经网络方法近似同源转录组和蛋白质组学数据集之间的关系gydF4y2Bad .寻常的gydF4y2Ba ,来预测蛋白质丰富的蛋白质不是实验检测到基于相关预测因子,如mRNA丰富,细胞作用,三重密码子数。结果表明,训练神经网络模型的系数测定范围从0.47到0.68,提供更好的描述比之前几个模型(gydF4y2Ba18gydF4y2Ba ,gydF4y2Ba19gydF4y2Ba ]。试图找出可能原因丢失蛋白质组值,逻辑回归分析各种实验测量和序列特征进行了实验发现蛋白质但高预测蛋白质丰度值。虽然结果总体上符合先前的知识,较低的蛋白质可能表达能力和高的不稳定会有更高的机会错过了,在这项研究中,我们首次量化的优势比每一个可能的因素gydF4y2Bad .寻常的gydF4y2Ba 数据集。此外,在我们的初步分析表明,生物解释可以改善通过估算蛋白质组学数据集。最后,尽管该模型验证统计,要小心谨慎,当解释实验数据的基础上预测蛋白表达的价值观,因为预测的丰度值限制蛋白质组学实验数据作为输入的质量,和缺乏大规模的定量预测,可以包括在模型中。然而,最初的成功应用ANN方法是鼓励和模型可以作为基础发展更复杂的模型来进一步提高生物学解释。gydF4y2Ba
承认gydF4y2Ba
j·乔和w·张的研究工作是由中国国家基础研究计划(2011 cba00803)。本文反映了f·李的观点和l .聂不应被解释为代表FDA的观点或政策。gydF4y2Ba
补充材料gydF4y2Ba
补充表1:中国十大排名相对变量重要性措施变量(后删除基因mRNA高值)(从Torres-Garcia et al .,gydF4y2Ba生物信息学gydF4y2Ba ,2009年,25:1905 - 1914)。gydF4y2Ba
补充表2:所有基因预测的值在不同的条件。gydF4y2Ba
补充材料gydF4y2Ba