文摘

多元化生活的起源至今仍是个谜,尽管相当大的努力致力于解开宇宙生命之树的根部。这里我们重建的发展史,描述分子功能的进化和物种的进化直接从基因组基因本体普查(去)定义。我们抽样249只在基因组的跨越生物在生命的三个超界,古生菌,细菌和真核生物,使用大量的去的分子特征产生的系统发育树。结果显示早期嗜热古菌的起源,其次是基因组减少微生物超界发生的事件。Eukaryal基因组显示非凡的功能多样性和丰富了数以百计的小说akaryotic中没有检测到微生物细胞分子活动。值得注意的是,大部分的这些小说功能出现很晚在进化过程中,同步的多样化eukaryal超界。在超界方面证实,古生菌的分布似乎是最简单和最古老的形式的细胞生命,而真核生物是最多样化的和最近的。

1。介绍

细胞的三方性质良好,与生物体分成三个不同的生命形式:古生菌,细菌和真核生物。总的来说,这些团体也被称为三个“域”或“超界”的生活1,2]。古生菌和细菌是单细胞akaryotic微生物普遍缺乏细胞核,线粒体,一些膜结合细胞器常见的真核细胞。尽管相当大的形态相似性古生菌和细菌,它们被认为是不同的超界由于独特的核糖体蛋白的存在3),差异细胞壁成分和立体化学的脂质(glycerol-ether古生菌和细菌glycerol-ester) (4,5),和不同的DNA复制器6与其他细胞[]、栖息地和交互7]。古细菌超界的成员通常是发现在极端环境如高温和/或盐碱条件(例如,Methanopyrus kandleri即。,capable of surviving at 122°C [8])。相反,细菌种类更加广泛,常见的病原体。超界真核生物包括种类繁多的单细胞和多细胞生物,包含许多膜结合细胞器(如细胞核)和复杂的胞质结构(例如,细胞骨架)。除了三个公认超界,最近的研究还指出,第四个“超群”的存在与大中型基因组组成的病毒(例如,米米病毒和megaviruses [9])。因此巨型病毒可以代表一个古老的细胞的生活方式明显不同于现存细胞生命形式(10]。

尽管细胞生活的物种三域分类分类被广泛接受,三个超界之间的进化关系在很大程度上仍未解决。最初的系统发育研究提出了一个基于古代paralogous基因妹妹古细菌和真核生物之间的关系,都来源于基底细菌群。事实上这种“规范”生根的生命之树(ToL)已经恢复的系统发育研究基于基因序列(例如,atp酶(11和延伸率的因素12])。在全球系统发育分析基因序列的使用,然而,受到了挑战因为他们无法完全解决ToL很深的基础关系(例如,看到13)和引用)。相比之下,分子结构比基因序列(守恒和健壮14]。例如,系统发育研究涉及更多的守恒的进化特征如蛋白质结构域(15- - - - - -19],tRNA [20.,21),5 s rRNA [22],核糖核酸酶P [23],tRNA假字[24- - - - - -27),和最近的分子功能(28,29日]一致认为古菌是最古老的超界,而细菌和真核生物形成的派生妹妹组。

在这里,我们回顾三超界之间的进化关系重建的发展史使用小说和相对可以理解系统发育的字符集。我们利用基因产物的功能信息定义的基因本体论(去)数据库(30.,31日)作为分子字符区分细胞物种已经完全测序。的结构主要分为三个层次:(i)分子功能(二)生物过程,(iii)蜂窝组件。这些层次结构陷入多个层面形式的有向无环图(无进取心的人),孩子去哪里术语可以与多个父术语,反之亦然。GO术语在更高层级通常表示更广泛的功能(例如,“催化活性[去:0003824]”),而在较低和终端水平代表了更专业的活动(“ferredoxin-NADP +还原酶活动(去:0004324)”)。因此,层次结构符合公认的假设古生代分子与广泛的特异性(即多功能。,与更高的水平上),而现代分子代表高度专业化的功能(终端去计算)(32- - - - - -34]。因此,层次结构和他们亲密的结构与生物体生理机能使他们强大的候选人使用在系统发育研究[35]。然而结构化术语,熟练的技艺,因此容易趋同进化作为一个孩子可以有多个父母。这个因素可能使系统复杂化的推论当去作为系统字符。尽量减少这样的影响的非进化过程结构化熟练的技艺,我们只采样的终端去条款分子功能层次结构(以下简称去TMF计算)(图1),因为它们代表了大多数专业分子细胞的活动和提供关于生物生理学的综合意见。进一步的保护水平基因转移(HGT)被认为发生在微生物物种高频(36),我们排除了去TMF从分析被识别为高度可能的主题。小说描述的分析产生的发展史和分布模式进化的细胞,并兼容传统的分类,从而支持的选择TMF届分子进化研究中的人物。结果显示早期嗜热古细菌超界的起源,基因组的全球趋势减少微生物超界,在进化后期eukaryal多样性和显著扩张。

2。材料和方法

2.1。数据检索和操作

最近,在一个与历史无关的(也就是我们使用术语。,non-evolutionary) and phylogenomic exercise to report the evolution of modern cells [28,29日]。在这里,我们重用推断得出的数据集来确认(28,29日)进行具体分析的起源和传播方面在现代细胞。数据提取和操作细节可以在找到28,29日]。具体来说,我们下载基因本体协会(果)文件共有1595个有机体从欧洲生物信息学研究所网站(http://www.ebi.ac.uk/GOA/proteomes2009年11月)。我们生物过滤多余地存在,排除多个菌株相同的细菌物种只保留菌株类型,和50%的覆盖率(即使用一个阈值。、蛋白质的数量分配TMF术语除以总数量的蛋白质)排除低质量的基因组分析。我们也排除果阿文件生物体表现出兼性寄生或寄生的生活方式,因为它们与宿主共同进化和偏见引入全球phylogenomic分析(17,18]。生物的生活方式进行了研究使用各种网络资源,如基因组在线数据库(黄金)37,38和先前公布的数据39]。这减少了数据集249独立生存的生物,包括45古生菌,183个细菌,真核生物(见表21 S1在网上补充材料http://dx.doi.org/10.1155/2014/706468)。总共有2039 nonredundant走TMF条款中发现这些生物的基因组。

2.2。排除HGT-Acquired去TMF条款

我们确认72古细菌和细菌的基因组数据集跨境上市的水平基因转移数据库(HGT-DB) [40]。从这些基因组蛋白质序列从HGT-DB检索并与相应的果阿的文件。具体来说,我们提取的水平去注释转移蛋白(htp)共同在果阿文件和HGT-DB基因组。这组去TMF条款可能被高度收购。

为了确认,我们执行一个统计超几何分布测试来确定HGT-acquired走TMF条款大大丰富我们的数据集(见[35,41]详情)。这导致了115年的识别TMF潜在候选人HGT条款。排除HGT-acquired走TMF条款导致的最终数据集249年独立生存的基因组和曲目1924TMF条款。我们注意到生成的数据集可能是最低限度受高度影响(和其他非进化过程)因为寄生生物和走TMF方面最有可能获得通过高度被排除在分析之外。此外,系统和网络的研究证实,一旦HGT-derived字符被排除在外,由此导致的发展史进行方法优于传统的基于树和有最小的冲突29日]。然而保留数据集内共生的进化深proteome-shaping影响事件可能定制的真核细胞。

2.3。Phylogenomic分析

我们使用前面描述的方法来重建树的函数(ToFs)和工具描述,分别去的进化TMF条款和物种(19,29日,35,42]。我们首先计算每个去的次数TMF术语出现在每一个基因组和生成矩阵代表人口普查的分子功能基因组(图1)。原始项的基因丰度TMF在每个基因组( )对数转换为不平等的基因组大小和异构的方差,然后除以最大丰度值( 在矩阵。标准化的数量然后新从0到31日使用字母数字(0 - 9和动静脉)格式允许与PAUP系统发育重建软件(版本的兼容性。4.0 b10)(图1)[43]。下面的方程描述了数据操作过程(16,19]:

最大的吝啬(MP)被用来寻找最吝啬的树描述的进化ToFs和工具以最小的可能的角色变化。我们注意到议员执行优于最大似然在处理多态系统角色演变下不同的进化率(44)(例如,走了TMF在基因组方面,积累了不同的进化率)。此外,标准化和尺度改变原始丰度值为32个字符可能国家确保兼容PAUP *和减少趋同进化的可能性。系统发育树使用Lundberg方法本质上扎根,根在最吝啬的位置没有任何外类群规范(45]。

ToFs,我们认为最丰富的分子最先出现在进化(即函数。我们的树,最大值在矩阵通过指定V祖先的角色状态)(35]。相比之下,工具是根植于矩阵(即最小的值。,character state 0) under the assumption that the ancestral genome had very limited functional capabilities and it progressively enhanced its repertoire of molecular functions [17,18,29日]。系统发育树的可靠性评估了1000年。使用Dendroscope版本树可视化。3.2.7 [46]。

2.4。估计去的起源TMF条款

从ToF,我们每一个分类单元的距离(即计算。,去TMF术语)从根通过计算节点的数量从一个给定的位置基地和除以分类单元的总数。这个节点距离(nd)被用来估计的相对时代去TMF项规模从0(最古老的)到1(最近的)。的nd已经成功地利用以前在蛋白质域结构的进化研究15和密切遵循分子钟47]。因此,nd可以可靠地作为一个代理来推断进化时间和基因组的分子功能。

2.5。受欢迎的TMF在基因组

研究的传播TMF在基因组方面,我们使用了一个分布指数( 值)量化分子的流行功能。这个指数计算基因组编码特定的数量TMF项除以总数量的基因组,规模从0到1。因此,一个 值0表示完全没有的TMF术语而值接近1指示附近普遍存在。分子的活动是至关重要的细胞将有更高的生活 值,而去TMF独有的一个物种或超界被预期低 值。

2.6。生物体的持久性策略

我们使用先前描述的概念经济、灵活性和健壮性,以确定生物在我们的数据集的持久性策略(48]。经济定义为nonredundant的总数TMF在一个基因组。因此基因组较低经济港口有限分子活动和坚持一个吝啬的策略。灵活性是由总(即定义的。冗余)的数量TMF在一个基因组。因此,基因组高灵活性编码相同的多个实例TMF术语和因此带来的灵活性有机组成。最后,鲁棒性定义的灵活性比经济,表明增加抵抗环境压力和生存能力的损害。换句话说,灵活性是有机体的能力同样应对不同级别相同的刺激(例如,不同强度的光)而健壮性是能够承受不同的刺激没有创新新模块(48]。

3所示。结果与讨论

3.1。功能多样性超界

维恩图显示1924年的分布模式TMF在三个超界(图2(一个))(从[复制28])。这些包括TMF术语在超界(即独特的礼物。,A, B, and E), were shared by two superkingdoms (AB, AE, and BE), or were universal (ABE), thus resulting in seven possible Venn taxonomic groups made explicit in Figure2(一个)。总数的近44%TMF条款是独特的在真核生物中发现(E),展示了巨大的功能性eukaryal生物的多样性。相比之下,只有8.4%和0.05%TMF条款(B)细菌以及古生菌独有(A),分别为(图2(一个))。

大量的独特eukaryal分子功能的结果很重要,因为我们只采样21 eukaryal基因组相比,45和183年古菌和细菌基因组的生物,分别。结果表明:真核生物有可能发现大量的小说在整个进化过程中,分子活动。以前的分析表明基因的复制和重组期间丰富的进化eukaryal超界和裁剪真核基因组中发挥了重要作用[16,49]。我们建议增加的这些事件导致的快速功能多样化古代滥交的分子在分子更先进和新颖的功能,从而增加真核细胞的功能曲目。相比之下,无核细胞坚持经济战略,拥有简单的功能配置。

总共有526TMF条款出现在所有三个超界,第二维恩分类组(ABE)(图2(一个))。走的数量TMF条款之间共享任何两个超界是集团最高(272),中间为AB(100),和最低AE(11)(图2(一个))。一个解释的非常大的大小分类群是细菌内共生在真核生物的进化,可能许多细菌基因转移到宿主细胞(50]。然而,我们从数据集过滤寄生生物,这也导致排除属立克次氏体(专性细胞内寄生虫),被认为是现代线粒体的祖先(51]。此外,细菌的蛋白质可能是高度的学科也被统计浓缩试验(见部分2)。因此,我们的数据更符合另一个场景,在该场景中,细菌和真核生物进化的复杂而丰富的祖先现存生活而古生菌进化首先大规模基因组精简。换句话说,非常大的大小分类组(即。,272年TMF计算)完全不能解释为内共生,可能代表了一个强大的垂直跟踪富裕社区的祖先细胞(预期在28])。

最后,很明显从古生菌的维恩图代表了最简单的细胞生命形式。古细菌蛋白质组功能最多样和繁荣与最小的分子活动。细菌遵循一条中间路线,更像比真核生物古生菌,而后者是功能丰富和编码丰富的基因组。

3.2。进化的分子功能

一个ToF描述1924年的进化TMF术语(类群)在249年独立生存的有机体(字符)(图2 (b))。十最基本类群与催化和绑定的重要活动,包括“ATP绑定(去:0005524),”“锌离子绑定(去:0008270),”“镁离子绑定(去:0000287)”,“三磷酸鸟苷绑定(去:0005525),”“phosphorelay传感器激酶活性[去:0000155],”“metalloendopeptidase活动(去:0004222),”“FMN绑定(去:0010181),”“锰离子绑定(去:0030145),”“GTPase活性[去:0003924],”和“DNA-directed DNA聚合酶活动[去:0003887]”(插图图2 (b))。“ATP结合”是最古老的分子功能而“nonmembrane生成蛋白质激酶活性[去:0004715]”最派生(图2 (b))。大部分的通用TMF方面占领深位置的发展史(红圈),而分子活动特有的或共享的最多两个超界(即。、AB、AE,分类群)出现(蓝圈)和来自古代的分子功能(图2 (b))。早期出现的代谢功能匹配结果从先前的进化研究的蛋白质域结构和分子功能(例如,15- - - - - -17,35])。

展开的顺序出现的分子功能的进化,我们计算节点距离(nd代表每个去的相对年龄)TMF项直接从ToF(见材料与方法)。我们出了nd的值去TMF条款对分布指数( ),由基因组编码的总数TMF项除以总数量的基因组,研究的受欢迎程度和分布TMF在超界集团(图3)。的nd 情节显示显著(图和前所未有的进化模式3(一个))。

大多数最古老的分子功能( )是普遍存在(红圈)非常高 值(图3(一个))。事实上,总共26TMF有一个角度 等于1表示无处不在的存在在所有样本的基因组(表1)。这些普遍的TMF条款与基本催化和绑定等生命活动至关重要的绑定ATP(去:0005524),DNA复制(去:0003887),乳沟的rna DNA杂交(去:0004523),解除前DNA链的复制和转录(去:0003917),生物合成的活动氨酰合成酶(去:0004813,去:0004815,:0004820,:0004821,:0004824,:0004826,:0004831),和其他表中列出1。值得注意的是,所有这些通用TMF在进化过程中出现早期( )(表1)和superkingdom-specific出现之前的条款(阅读下文)。列表中显示的最后有一个共同祖先细胞样的组成与复杂的催化机制存在,所显示先前的研究蛋白质域和分子功能(17,18,35]。

然而,f开始下降的过程nd和接近0nd0.45。我们观察到,相当大的一部分(蓝圈)和AB(绿色)TMF术语出现在 ,这表明还原进化过程在起作用(图3(一个))。我们建议早期进化的概率一个血统完全失去TMF词的概率大于其他两个血统获得相同的TMF同时术语。因此,表象的和AB分类群的最可能代表完全丧失的事件TMF在古细菌,真核生物(resp。)很早就开始出现在进化过程中(阅读下文)。相比之下,B(黑色),E(灰色),(橙色),AE(仿古青铜)TMF主要条款出现在进化后期时期( )。真核生物,特别是发现了大量的小说TMF在进化后期,从而弥补了早期还原事件。

箱线图,如图3 (b)证实的出现顺序分类群的进化。第一个分子活动出现在进化过程中是“ATP绑定(去:0005524)” (图3)。安倍分类组不等 和随后的表象,AB, B, E, A,和AE,依次(图3 (b))。虽然几个AB分类组的成员出现早于,他们认定为异常值和可能的候选人的高度以后,古菌和细菌之间发生在进化过程中(例如,“青霉素绑定(去:0008658)”)(表2下面的异常值,也读)。因此,是集团可能出现在AB集团信号的第一个完整的损失事件TMF词在任何超界。这种直觉也符合此前发表的分析,提出了减少古生菌的原始基因组的进化事件(例如,15,52])。因此,我们的研究结果支持古生菌的早期分化的演变路径后世界的原始生物基因组减少,最终导致穷人的代表TMF古细菌的分类群(即。AE,维恩图解(图和AB)2(一个))。

第一个分子功能的是组”DNA复制起源绑定(去:0003688),”“[酰基载体蛋白质]S-malonyltransferase活动[去:0004314],”和“FMN adenyltransferase活动(去:0003919)。“这三个TMF条款共同出现在 (箱线图如图3 (b))。如上所述,这一事件也代表了第一个完整的损失事件TMF古生菌。有趣的是,没有一个古细菌蛋白质被注释:0003688TMF在我们的数据集。有趣的是,古细菌基因组缺乏同系物的复制的蛋白质扮演重要角色在调节DNA复制起始的(例如,注重科技进步YabA的兴奋剂、大坝或SeqA) (53]。另一种解释,虽然不太可能,是使用相对较低的质量去古细菌基因组数据。古生菌替代细菌和真核生物相比,这可能反映出在失踪去注释古细菌生物至关重要。然而,我们发现去覆盖超界之间没有显著变化。例如,意味着覆盖在古生菌57%,这不是远离细菌和真核生物中60%的覆盖率(表S1)。因此,完全没有去:0003688,古生菌的生物学意义和价值识别未来工作的热点同系物的细菌和eukaryal蛋白质。

TMF方面独特的超界开始出现在进化后期( ),第一次在细菌中 (“chorismate裂合酶活性[去:0008813]”),然后在真核生物 (“CCR1趋化因子受体结合(去:0031726)”),最后在古生菌 (“methylenetetrahydromethanopterin脱氢酶活性(去:0030268)”)(图3 (b))。“chorismate裂合酶活动”对丙酮酸的去除至关重要chorismate,首次研究了大肠杆菌和其他革兰氏阴性细菌(54,55]。“CCR1趋化因子受体结合”活动是很重要的在炎症反应损伤和病原体(56)和独特的出现在真核生物 。最后,archaeal-specific术语(“methylenetetrahydromethanopterin脱氢酶活动”)是参与叶酸生物合成和首次研究了hyperthermophilic热点甲烷细菌属thermoautotrophicum(57]。我们还注意到AE分类组出现不久的表象和E组 (“烟草胺合成酶活性[去:0030410]”)表明古细菌和真核生物更类似于对方对“现代”分子活动( )相对于更古老的58]。

3.3。全球超界的倾向

情节为个人超界早些时候确认模式(图4)。总共55TMF有一个角度 1在古菌(图来显示他们的无处不在的存在4(一))。然而, 开始下降迅速增加 。第一个完整的损失事件被记录 三去TMF术语“DNA复制起源绑定”、“酰基载体蛋白质S-malonyltransferase活动”和“FMN adenyltransferase活动”(青色圆图4(一))。去的TMF条款和AE出现后所特有的进化( )和较低的分布 值(图4(一))。

在细菌中,56岁TMF条款普遍出现在细菌基因组( ),古代起源( )。的 值开始下降,达到了0 当第一个完全丧失事件“CCR1趋化因子受体结合”被记录。另外,这种分子活动很可能从未获得的细菌基因组和独特的出现在真核生物赋予真核细胞免疫功能。分子功能细菌的分布是全球分布(图非常相似3(一个)),其中最古老的TMF分布有显著提高的 较小的值,而派生的分布值(图4 (b))。

最后,真核生物的传播表现出显著的变化TMF条款。总共有125TMF条款普遍存在于真核基因组跨越 范围从0到0.8(图4 (c))。第一个事件发生在完全丧失 当“青霉素绑定”活动从真核基因组迷路了。然而,正如前面所解释的那样,这走TMF词是局外人AB分类组(箱线图AB在图3 (b)),最有可能代表akaryotic微生物之间的横向并购事件发生。事实上,这个词是普遍的细菌( 在古生菌),但罕见(仅在~ 10%热点检测)(数据4(一)4 (b))。这表明晚期基因转移从细菌到古生菌,一旦细菌物种出现在进化的场景。在其他类似的模式转移也明显TMF古老的起源( AB集团的)。值得注意的是,平均 这些古老的TMF条款0.31 0.83古生菌和细菌。这表明古代走TMF条款横向转移从细菌到古生菌,而不是反之亦然。我们观察到,总体平均水平 对于所有AB去TMF条款0.16 0.26古生菌和细菌(总体中位数分别为0.06和0.12,分别地)。去的TMF表中列出的AB分类群2因此非典型和可能代表古的横向转移,值得进一步关注。鉴于这种非典型行为,真核生物的分子活动的实际损失发生之后,在第一次损失事件在古菌(图3 (b))。

为真核生物分子独特的功能出现晚(灰色圆圈)( ),就像古菌和表现出倾向于在真核物种(图中普及4 (c))。行使透露,古生菌坚持一个吝啬的策略而细菌和真核生物丰富其功能工具箱。特别是,真核生物获得了大量的小说在进化表明分子活动很晚晚的多样化eukaryal超界和解释的物种多样性和真核生物的组织我们今天观察水平。

3.4。物种的进化

我们重建的托尔描述了249年的进化独立生存的生物(类群)使用1924年的曲目TMF任系统字符(图5(一个))。从ToFs协议的结果,托尔从基因组普查获得的分子功能建议一个古老古生菌的起源,后期出现的细菌和真核生物(图5(一个))。热点占据最基础的位置放在原来的方式,而细菌和真核生物形成的单元组。单元eukaryal进化枝高度支持引导(100%)。最基础的托尔类群与高温和hyperthermophilic热点(例如,Desulfurococcus kamchatkensis,Thermofilum立案,Staphylothermus绿,Hyperthermus butylicus以及属于属的物种Thermococcus海床)表明高温厌氧细胞生命起源(插图图5(一个))。然而,动物加油古生菌托尔的要求一个解释。我们的数据表明,paraphyly走的不均匀分布的结果TMF古细菌基因组。损失的微分模式如图在古细菌生物分子功能明显4(一)。这表明最后的共同热点祖先可能是更复杂的比任何现存的古细菌基因组(59]。也许,简化分子曲目更适合新兴热点血统时地球上适应严酷的环境下。这种“divergence-by-isolation”场景中可能导致原生动物在现代树重建历史快照的热点。

我们发现主要热点组,Crenarchaeota Euryarchaeota,没有形成有凝聚力的群体。这是在冲突与先前发表的发展史基于连接的热点核糖体蛋白(60]。如上所述,non-cohesiveness主要古细菌类群分布可以解释的TMF古细菌基因组。另一种解释是有限的抽样研究的热点。分析的时候(2009年11月),只有45独立生存的古细菌生物(主要是极端微生物)> 50%去报道为进化的研究提供了可能。从那时起,我们对古生菌的认识大大扩大了许多嗜中温古细菌物种的发现。这将是重要的在将来的研究中包括更多的古细菌基因组进行验证。因此我们研究报告警告说,模式是最有可能的场景来自我们的数据但至关重要的是“功能性”的角度来看,现代细胞的进化从gene-centric序列的角度是不同的。

进一步证实了早期的古细菌超界的起源和灵感来自多元化的持久性策略模型细胞(48),我们计算指标对经济(独特的总数TMF术语在基因组)、灵活性(总冗余的TMF在基因组),和鲁棒性(灵活性比经济)为所有基因组数据集。这些指标描述的策略部署所需的分子功能持久性生物意义和适应环境。当绘制在一起3 d-scatter情节,古细菌基因组(红圈)占领位置靠近原点指示最大经济但至少灵活性和健壮性(图5 (b))。相比之下,细菌基因组展出中级水平的经济、灵活性和健壮性和紧密聚集。这表明,功能限制细菌物种非常保守。eukaryal基因组显示经济的最低水平,但最大的灵活性和健壮性和水平分布与最大的可变性(图5 (b))。真核生物的运动进一步加强假说通过促进功能复杂性而持续akaryotic微生物促进经济。此外,古生菌代表细胞生活的最简单的形式,首先出现在进化。

3.5。与竞争的假设

我们的实验预测高温多元化生活的原点(也预期在61年- - - - - -63年])和挑战理论认为生命的起源在寒冷的环境中(例如,64年])。结果也不支持真核生物的起源或交互融合的两个akaryotic细胞(50,65年,66年]。相反,我们的数据表明,原始干细胞线在分子活动丰富,生了古生菌,然后细菌,最后真核生物(图3)。Eukaryal基因组可能保留了许多古老的分子从akaryotic逐渐失去了微生物的活动。无核细胞补偿这些损失由适应严酷的环境下,享受快速增长周期,可能在细胞的压力下猛龙队和RNA病毒(59]。eukaryal血统多元化多后,可能已经多元化的内共生细菌物种。我们的数据也因此不兼容的假设表明真核生物起源于内古生菌(基于基因序列)([67年];参见[59批判])。反过来,新托尔支持先前发表的分析类似,使用保守的蛋白质域和RNA结构导致拓扑支持一个古老的嗜热古细菌超界的起源和物种三域分类拓扑15,17]。

更普遍的是,我们的发展史从基因序列不符合先前发表的发展史,不考虑个别蛋白质域的异构的历史及其相关分子的功能。我们认为的发展史从基因序列构建并不真正反映整个生物体的进化历史。我们注意到基因序列很容易高突变(68年)和遭受许多系统构件包括问题产生的序列比对,插入/删除,和交互序列网站产生域结构从而违反性格独立的假设(在其他地方(详细讨论13])。因此,基因和它们的序列不能被认为是守恒的进化系统发育研究单位和不可靠的标记涉及比较深。相反,蛋白质域结构比基因序列,并利用守恒在过去可靠地揭示很深的进化超界之间的关系(15- - - - - -18]。我们基于分子功能的基因普查的发展史也兼容的蛋白质结构域和RNA的发展史,因此应该考虑同样强劲。最重要的是,去近似一个生物体的生理和真正描绘一个托尔(例如,29日])。此外,终端的使用条款增加该决议不仅在最基础的分支ToL(大量的古代TMF方面有非常高的 值提供了一组扩展的守恒的字符)也在派生(终端代表高度专业化的分子功能可能不是所有类群守恒)。根据这些考虑,我们发现细胞生活在嗜热古菌的根是一个重要的结果,支持良好的进化和技术因素。

3.6。我们的研究的可靠性

在这项研究中,我们使用术语都是手动和电子策划没有引用他们的证据规则。我们先前已经表明,不同的编码导致类似树的拓扑和证据,因此,不妥协的结论(例如,35])。我们的研究也强劲的影响去报道阈值与不同生物覆盖50%(表S1)仍然定位在托尔(图3从超界)和不平等的分类群取样18]。然而,它在很大程度上依赖于当前注释和生物的生活方式的信息。去定义不断更新和新的关系。此外,生物的进化分组背后的基本假设,历史是共享的存在和派生模式发生和丰富的分子功能,符合韦斯顿的普遍性标准字符极化(69年),几乎是不合理的。这些因素应该考虑当解释我们的结论。我们预计然而phylogenomic模式描述在本研究仍将强劲的数据增长,不太可能进行大量的修改。

在这项研究中使用的系统角色去术语提供了本体论的定义与蛋白质结构和基因产品。相比其他可用分子字符(例如,基因序列),这些定义更好的近似生物体的生理和提供了理想的字符集在生物系统进化的语句。分子进化网状的功能也耐火材料问题;他们是紧密联系在一起的域组织蛋白(49),这是最低限度影响趋同进化(70年]。我们以前使用方面去研究他们的进化对细胞的影响(例如,28,29日])。新颖性是解剖他们的起源和传播主要超界。这个练习提供了强有力的支持,之前进行比较functionomic分析(28)和托尔重建从人口普查的条款29日]。

我们注意到部队控制基因和蛋白质的进化也适用于分子的进化功能。例如,基因重复随后neofunctionalization可以创建功能新奇(71年]。最近,细菌被证明“重新组合”的代谢网络的损失函数(而不是得到!)在面对环境压力(72年]。这意味着两个得失无核细胞的功能可能是重要的。另一个有用的贡献功能曲目来自高度(73年]。这展示了一个例子“青霉素绑定”转移的分子活动从细菌到古生菌。最后,新创基因不能被低估了。小说基因增强的功能细胞,尤其是在真核生物。另一种选择压力可能会引发新功能的出现是病原体的压力,尤其是RNA病毒。RNA病毒变异以更高的利率,因此高阶真核生物的免疫系统可能会获得新的分子活动来对抗入侵的病原体。

据我们所知,我们的新方法支持基因本体进化的应用研究,是一个创新的工具包的分子系统发育分析使用的繁体字。然而,在一个平衡的注意,术语容易homoplasious事件出现的趋同进化和高度等功能性招聘。保护从这些影响,我们仔细地排除115条款,被确认为可能的候选人的高度。此外,我们限制了分析只包括终端方面,他们代表最专业的功能注释,因此可能不是守恒的所有类群。我们也排除寄生和兼性寄生生物的分析它们与宿主共同进化和系统发育分析复杂化。在所有这些步骤,我们最小的字符数量可能遭受相似的候选人。249年最后一个数据集独立生存的基因组和曲目1924TMF条款应该考虑从高度受homoplasious事件的影响最小,平行和趋同进化,偏见提出的生物的生活方式的差异。实际上,基于基因组的人口普查的发展史的分子功能表现在某种程度上优于ToL重建从核糖体rna基因树在解决主要的生物分类群的系统发育关系,在稍微降低成本新一致性指数(RI)(~ 0.7工具重建从蛋白质域~ 0.6的工具重建方面)(29日]。在这些研究中,nonvertical进化发展史上的影响由分子功能的基因普查预计将最小ToFs以来与树木相域之前构建的蛋白质域结构。托尔重建是一个困难的问题影响的方法和生物的并发症。然而,同样应该考虑我们的方法(如果不是更多)健壮的其他现有方法,更好的近似物种系统发育分析的问题,和一个新的方向未来使用条款在系统发育分析,改进的潜力。

4所示。结论

我们的调查显示,细胞生命的根源在于嗜热古细菌物种的祖先。这是一个有趣的但非典型结论是由两分子的分布函数在许多细胞的基因组物种和phylogenomic表意分析的方法。的使用条款,分子字符功能提供了重要的见解和超界的进化。特别是,我们发现了显著的真核基因组的功能多样性,它显示的外观新颖的分子功能在进化过程中相对较晚。相比之下,蛋白质组akaryotic微生物持续的支持经济和后极简主义的道路。分析提出了定义的概念是有用和可靠的字符在系统发育研究中使用。尽管他们复杂的分层组织招聘的力量和脆弱性,这些新系统角色进行解决的发展史描绘自然历史的巨大潜力。

利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项研究是由美国国家科学基金会支持(mcb - 0749836瓦,0749836)和美国农业部(CRIS illu - 802 - 909) GCA和下一代BioGreen 21的资助项目,农村发展管理(PJ0090192013) KMK。任何意见,调查结果、结论和建议表达这种材料是作者和不一定反映资助机构的意见。

补充材料

独立生存的生物样本列表在这项研究中分类分类和覆盖率。

  1. 补充材料