文摘
二硫键一般不用于稳定蛋白在细菌或真核细胞的胞质部分,由于化学减少这些环境的性质。相比之下,某些嗜热古菌使用蛋白质稳定的二硫键的主要机制。在这里,我们提供一个当前的调查完全基因组测序,应用计算方法来估计整个古生菌二硫键的使用。微生物属于Crenarchaeal分支,本质上是所有hyperthermophilic,普遍富含二硫键而较小程度的二硫键被发现在高温Euryarchaea,不包括那些产甲烷。结果帮助澄清的哪些部分热点血统可能会产生更多的例子和额外的特定蛋白质二硫键的数据,提高基因组测序的努力。
1。介绍
古生菌非常多样化的居住环境(1]。许多物种茁壮成长在温度超过100°C。生长在如此高的温度下提出了特殊的挑战,其中最严重的是在本地稳定细胞蛋白质折叠问题的配置。许多蛋白质的折叠配置仅略有青睐积极而展开的状态(2],高温不可逆地展开绝大多数蛋白质来源于生物体生活在温和的温度。嗜热蛋白是如何稳定的问题因此多年来[引起了相当大的关注3,4]。
大量研究得出结论,嗜热蛋白稳定广泛的力量和效果,这似乎出现不同程度在不同的蛋白质和生物(3,5- - - - - -8]。增加原子包装(9,10],疏水相互作用[11],离子相互作用[9,12- - - - - -14),和更短的循环15)都被表示为提供额外的嗜热蛋白共价的稳定。更意想不到的是意识到二硫化bonding-a更强,共价武力可能发挥重要作用在某些生物(16,17]。一个引人注目的线索时酶的结构从hyperthermophilic adenylosuccinate裂合酶Pyrobaculum aerophilum显示六个半胱氨酸的蛋白质链配对形成三个二硫键(17]。这促使发展Mallick et al。16基因组的计算,支持这个想法,一些嗜热微生物使用稳定蛋白二硫键作为主要机制(16,18,19]。随后的蛋白质组学实验p . aerophilum验证这种说法(20.),最近出版的结构(21- - - - - -23]和生化研究[24- - - - - -26从各种hyperthermophilic古生菌的蛋白质。
二硫键的使用是一种意外,因为在研究生物细胞内环境化学减少,因此有利于硫醇的半胱氨酸的二硫形式(了27])。虽然二硫键是一种常见的稳定机制的蛋白质分泌或驻留在氧化extracytosolic隔间,热力学考虑防止二硫键赋予蛋白质稳定性降低的条件下。这是一个一般规则,尽管存在不同的胞质蛋白二硫键形成瞬变或可逆,作为细胞氧化还原信号机制的一部分,例如[28- - - - - -30.]。普遍使用的二硫化因此提出新的质疑古生菌的胞内环境,形成蛋白质二硫键的分子机制在胞质内。比较基因组学研究表明,蛋白质被称为蛋白质二硫氧化还原酶(PDO)出现在嗜热菌,和选择性的生物将富含细胞内二硫键(18,31日]。这帮助关注PDO作为假定的关键球员在细胞内蛋白质二硫键(了32- - - - - -34]),这个角色是一致的体外研究从多个嗜热菌PDO (35- - - - - -37]。
二硫键的重要性嗜热菌出现完整的基因组以只有25时独特的原核生物,其中7例古生菌(16]。目前有1031个原核基因组的完整测序伴随蛋白质组在国家生物技术信息中心web服务器。尽管热点构成一个不幸的是一小部分- 90 1031 -他们越来越多的更新提供了一个机会评估嗜热蛋白二硫键的重要,生命之树的不同分支。
2。结果与讨论
蛋白质序列从90年从UniProt获得完整的古细菌蛋白质组集是web服务器,释放2011 - 4。序列也检索几个病毒感染硫化叶菌物种,和病毒感染Pyrobaculum aerophilum,海床abyssi,Thermoproteus tenax以及数据五个中度嗜热真细菌:Thermotoga maritima,Aquifex aeolicus,乳酸链球菌,Thermosipho melanesiensis,和Thermobaculum terrenum。此外,宏基因组序列数据archaeal-rich微生物群落取样在黄石国家公园的地热温泉得到从主持人等。38]。
我们应用这两种方法引入Mallick et al。16]分析二硫键在当前研究中。第一个是基于枚举的蛋白质有偶数和奇数的半胱氨酸残基。如果生物体有强烈倾向全部或大部分的半胱氨酸配对成二硫键,然后可以看到一个群体与偶数个半胱氨酸的蛋白质。事实上,这种趋势是明确的几个hyperthermophilic古生菌检查(图1)。没有这样的偏好在控制计算涉及nonthermophilic细菌基因组,只要是注意过滤从胞质蛋白出口;二硫键的形成在氧化环境中细菌的周质已被广泛研究,事实上,偶数和奇数半胱氨酸的分析被用来说明大量的二硫键在细菌分泌蛋白质或那些注定周质(39,40]。尽管简单的半胱氨酸计数方法明确本研究结果的超嗜热菌,一些生物的模式是不太清楚,包括一些的硫化叶菌物种,尽管早些时候的数据表明应该丰富(二硫化18]。值得注意的是,一些古菌,包括硫化叶菌,相对丰富的金属离子41),其金属网站通常是由半胱氨酸协调,可能阻碍二硫化的准确预测丰富基于一个简单的计数的半胱氨酸残基。这促使另一种分析基于序列结构映射。
(一)
(b)
第二个二硫键的方法分析依赖于已知的蛋白质三维结构的可用性,而不是特定基因的蛋白质,但同源蛋白质与其他生物(图2)。最基本的原理是,如果一个给定的蛋白质序列(从hyperthermophilic archaeon)有两个半胱氨酸折叠形成二硫键的配置,当查询序列映射或覆盖到结构的同源蛋白质,查询中两个半胱氨酸序列应该附近的空间中,将被要求如果债券之间的礼物(16]。特定的值,,我们在目前的研究报告是分数的半胱氨酸残基(其中),可以映射到结构),属于8 (C-alpha C-alpha)了一些其他的半胱氨酸残基的建模结构。我们称这个分数,丰富,预测二硫化参数。而患有半胱氨酸计数方法过于简单化的概念,所有的半胱氨酸蛋白质二硫键,序列结构映射方法提出了其他的困难。只有部分覆盖可以预期,因为许多查询蛋白质序列将不会由PDB同源结构。此外,在同源结构可用的情况下,大量的进化趋异查询和靶蛋白之间可能导致不可靠的校准以及善意的结构性差异,这两种倾向于降低半胱氨酸的可能性将会出现在附近。然而,该方法在三维空间中提供了特异性的优点。
当应用于基因组数据的收集,序列结构映射二硫化的方法提供了一个清晰的迹象,丰富的嗜热古菌(图3;网上见表1-Supplementary材料http://dx.doi.org/10.1155/2011/409156)。这也是的硫化叶菌物种上面提到的分析已经被简单的半胱氨酸不清楚计算方法。,大约33古细菌基因组(不包括密切相关的菌株相同的属)被认为有大量的二硫键(),而较小的子集(21基因组显示更高的值,8)(见补充表S1)。此外,不同寻常的,中度嗜热真细菌检测但更低的分数比古细菌嗜热菌的半胱氨酸的二硫键,除了Aquifex aeolicus,在这个群体中脱颖而出。这个结果是按照以往的研究强调这一点Aquifex有更高的分数与古细菌的蛋白质的嗜热微生物比其他任何nonthermophilic真细菌(42]。最后高温序列的来源,我们进行了一个初步分析,应考虑初步(见部分4),宏基因组序列数据来源于archaeal-rich温泉在黄石国家公园(38]。总的来说,这些数据显示二硫键的强有力的证据。细胞的DNA样本的仙女湖(网站10,2009年8月),是0.29,而样本坑山(2009年9月),值为0.35,与最高的值分别获得基因组测序。
特定的情况下研究了二硫键在基因组序列结构明显的映射方法,但错过了半胱氨酸计数方法。数的蛋白质硫化叶菌islandicus应变M.14.25到底三个半胱氨酸残基被检查。771年的序列,可以映射到PDB同系物,92有三个半胱氨酸可以映射到结构。其中,53个预测二硫键,和一个半胱氨酸硫醇分离。映射结构的分析表明,半胱氨酸自由往往是参与一个假定的metal-binding网站或表面上。后者场景暗示潜在的分子间二硫键。假说是强化三分之一病例的观察,暴露出半胱氨酸常发生在低聚物的结构。两个说明性的应用涉及可能涉及一个可能的分子间二硫和金属绑定网站如图4。这些情况突出关键困难与半胱氨酸计数方法:蛋白质有奇数个半胱氨酸可能实际上代表阳性病例的二硫键。此外,甚至在免费(减少)半胱氨酸二硫化丰富生物硫醇系统地减少,奇数的半胱氨酸可能存在于蛋白质形成分子间二硫键。蛋白质组学实验p . aerophilum,使用氧化和减少2 d SDS凝胶电泳,凸显了丰富的在生物(分子间二硫键20.]。从其他嗜热微生物的蛋白质晶体结构进一步支持这一点(23,43,44]。
(一)
(b)
预测的丰富的蛋白质二硫古生菌与系统发育强烈相关部门,但也有明显的趋势在特定分支(图3)。基本上所有的Crenarchaea展示高水平的蛋白质二硫键。相比之下,二硫键发生在较低的水平,更有选择性,在Euryarchaea。更具体地说,几乎是缺席的嗜盐菌的影响,但在一些高温Euryarchaea。存在与否的重要二硫键在高温Euryarchaea似乎强烈关联与甲烷生成的缺失。这一趋势可以反映二硫键的不相容,减少所需的氧化还原电位氧化碳甲烷,或oxidation-prone酶和辅助因子,进行甲烷生成(45]。除了研究crenarchaeal euryarchaea,微生物基因组序列已经代表三大古代或高度发散热点分支(图3)。其中两个,Nanoarchaeum equitans和Candidatus Korarchaeum cryptofilum嗜热;的两个,n equitans显示了更大程度的二硫键。
我们也调查了几个嗜热古菌感染的病毒。nonexhaustive列表分析病毒的报道。半胱氨酸的总数,可以映射到结构(二硫化)提供的估计参数(丰度):硫化叶菌islandicus杆状病毒1 (,),硫化叶菌islandicus丝状病毒(,),硫化叶菌病毒1 (,),硫化叶菌病毒堪察加半岛(,),硫化叶菌的二十面体病毒(,),硫化叶菌病毒的破山(,),Pyrobaculum球形病毒(,),硫化叶菌病毒STSV1 (,),硫化叶菌纺锤状病毒4 (,)。二硫的存在硫化叶菌病毒已经在报道中强调晶体结构和半胱氨酸的计数46- - - - - -48]。有趣的是,病毒的感染disulfide-rich嗜热古菌,大多数似乎编码蛋白质,含有二硫键。结果对个人病毒基因组进行解释时应特别谨慎,然而,大部分的病毒已经报道的特点硫化叶菌物种,由单个病毒蛋白质编码的总数很小,难以统计上显著的结论。
原因已经指出,讨论的计算方法只给出大致的措施真正的二硫丰富的蛋白质从给定基因组。期间产生的错误和偏差序列结构比较和解释分子间二硫键的挑战都倾向于导致低估实际的二硫化丰富;即使所有从一些基因组中的半胱氨酸蛋白质二硫键,只有一小部分会成功地识别序列结构的映射方法。幸运的是,一些高温和hyperthermophilic微生物结构研究一直受欢迎的目标。已报告情况下,许多蛋白质结构从单一生物提供了一个机会评估二硫直接丰富,假设结构报道相当整个基因组的代表。研究沉积蛋白质结构从几个选择生物,我们直接评估分数的半胱氨酸参与二硫键。我们表示这个分数,因为它的意义相似之处顺序结构的映射方法,但基于仅计算实际的报告结构。通过这种方法,Pyrobaculum aerophilum站在上面,;这个值是两倍的价值预测的序列结构映射。硫化叶菌solfataricus,海床abyssi,海床furiosus和细菌Thermotoga Maritima给值0.37,0.23,0.23和0.091,分别。除了Pyrobaculum,独特的报道相对较少的结构(25)可以解释这个反常的高价值的值,非常相关的估计,,通过基因组序列结构映射方法(图5)。这么高的使用价值的相关性提供了额外的支持作为一个指示器的二硫化基因组测序的丰富性。
3所示。结论
日益增长的测序的基因组数据库计算分析令人信服地表明,蛋白质二硫嗜热古菌中无处不在。Crenarchaea尤其如此,它们几乎所有hyperthermophilic,似乎普遍富含二硫。二硫键和更少的多变量Euryarchaea,主要出现在nonmethanogenic嗜热微生物。目前基于单一基因组序列可用,古代Nanoarchaeal分支似乎也是hyperthermophilic二硫化和富有。
在多个研究,实验二硫键蛋白从嗜热微生物已经证实,正如所料,那些二硫键在稳定中发挥着重要的作用对展开折叠结构和聚合(22- - - - - -26]。蛋白质和酶来源于嗜热菌已经公认的效用在工业应用8,49]。特定的蛋白质或特定的同系物,有一个或多个预测二硫键可以对这类应用程序尤其有吸引力的选择,尤其是环境条件通常是氧化。越来越多的disulfide-rich生物将继续为此增加酶同源的可用性。
最后,加速古生菌基因组数据的采集,尤其是沿着Crenarchaeal分支,可能产生重大影响的长期存在的问题从序列预测蛋白质三维结构数据。除了一个相当狭窄的目标集团为例,非常小,主要是α螺旋proteins-accurate新创蛋白质结构预测是不可靠的(50]。然而,额外的信息甚至几个空间约束的形式可能导致结构预测算法在目前的障碍。Crenarchaeal蛋白质代表的情况下,这样的空间约束可能从序列数据合理推断。Crenarchaea为蛋白质与同系物,正确预测结构倾向于将在接近半胱氨酸残基二硫键,而没有这样的趋势预计将错误的结构预测。研究目前正在沿着这条线在我们的实验室。
4所示。材料和方法
4.1。蛋白质组数据集
中使用的完整的蛋白质组分析是提取UniProtKB _04释放2011。查询关键字“完全蛋白质组”返回90古细菌蛋白质组收集213232个蛋白质序列和FASTA格式的储备构成的数据集。为宏基因组数据从黄石国家公园的温泉,细胞DNA序列包括从最近的样品在两个地点,坑山(1152蛋白质序列样本ID CH0909)和仙女湖网站10(1762蛋白质序列样本ID NL10_0908),随着病毒的DNA序列(共有161个蛋白质序列从四个网站:CH, NL10, NL17,和NL18)。重叠群装配了贝尔gsAssembler v 2.3(98%核苷酸身份和50个基点重叠)和翻译使用Blastx动态结构映射过程。介绍了DNA序列的来源(38]。
4.2。过滤Extracytoplasmic和金属离子
作为第一步,蛋白质序列,不包含至少两个半胱氨酸被排除在分析之外。此外,大大避免偏见的计算由于半胱氨酸可以参与金属结合位点,半胱氨酸下降5内残留的彼此并不认为,基于这样的观察:金属结合位点通常(但不总是)形成的残留物紧密间隔的序列。我们也过滤去除或周质的蛋白质分泌这些超出了我们的研究范围;它已经认识到蛋白质在这些隔间通常富含二硫。PREDISI程序用于执行此过滤步骤中,使用缺省参数(51]。
4.3。顺序结构映射
每个蛋白质从数据集处理匹配一个同源结构在PDB (52]。两两对齐UniProtKB序列和PDB序列是由爆炸。如果用一个冲击E值< 0.0001被发现,序列映射到结构。很多PDB序列之间的差异被发现出现在爆炸在相应的数据库和序列报告PDB条目。因此,为了获得一个正确的映射,映射残留的位置通过一个完整的动态规划重新计算两个序列之间的对齐使用裁缝和温斯迟算法[53]。
4.4。二硫键丰富的计算参数,
两个半胱氨酸残基被认为代表一个可能的二硫键如果他们C-alpha原子空间小于8Å当他们被映射到一个同源结构。在这种情况下,每个参与的半胱氨酸将被视为打击;如果一个给定的半胱氨酸在截止距离超过一个半胱氨酸,它是只统计一次。对于每个蛋白质,分数的预测可以计算半胱氨酸形成二硫键。随后,在蛋白质组水平,将代表总数的比率和映射的半胱氨酸的总数。
4.5。菌株筛选
在我们的报告中,由于多个冗余序列相似的菌株相同的物种被移除。对于一个给定的物种,被多个应变变化如果他们显示出类似的结果(例如,数量的映射内蛋白质+ /−亲本菌株的10%)。
4.6。控制数据集
选择物种的蛋白质结构提取的蛋白质数据库(PDB)。半胱氨酸残基参与二硫键被推导出它们的存在在PDB SSBOND记录条目链接记录中发现而不考虑,因为这些通常代表半胱氨酸参与绑定金属或其他配体。蛋白质和锌、铁被排除在分析。基于提取的PDB文件为一个特定的生物,所涉及的部分半胱氨酸二硫键,基于同样的原理,计算用于计算在序列结构映射的方法。
4.7。系统发育分析
系统发育树(图3)是建立基于web的工具ITOL [54后,修改原始postscript输出说明二硫化温度和计算参数的变厚度。最佳生长温度用于圆形情节从德国获取资源生物材料中心网站(http://www.dsmz.de/)和文学。
利益冲突
作者声明没有竞争的经济利益。
确认
作者感谢马克年轻的和本Bolduc他们帮助执行黄石宏基因组数据的初步分析。本文得到了美国能源部科学办公室的系统程序。
补充材料
显示了预测蛋白质二硫丰富与完整的古细菌微生物基因组序列。表和图将这些值与最适生长温度和生物体的表型。