文摘

早期研究以来,原核生物的历史分类处理许多变化的新的和更健壮的技术的发展。结果,新的分类单元描述的数量成倍增加,虽然越来越多的人已经重新分类,分类的要求更多的努力来维持一个有组织的等级制度。然而,期望是原核生物的分类将获得一个更稳定的状态与基因组时代。其他分析可能继续是必要的,以确定微生物的特性,但使用基因组数据足以提供可靠的分类单元描述,帮助分类达到正确的目标分类和识别。在这里,我们描述原核生物的进化分类到基因组时代,强调细菌和作为一个例子根瘤菌分类的历史。这个例子的重要性被选中,是因为豆科植物与根瘤菌的共生固氮作用的氮输入对自然生态系统和农业作物。这个案例研究报告的技术进步和方法用于分类和识别细菌物种,显示实际的规则所需的准确描述新分类群。

1。介绍

分类术语被广泛讨论。一些研究者认为分类是系统误差,而其他生物分类和定义分类系统学的一部分,这将有一个更广泛的范围,包括与进化研究和系统组件(1]。分类是科学的有序安排负责生物体尊重一个等级系统,可以假定进化关系;它还提供了相关信息地球上生命的起源以及它如何发展(2,3]。一般分类的目标是建立一个基于系谱关系分类系统,旨在达到一个自然系统,反映了“自然秩序”(4- - - - - -6]。

原核生物包括生物属于这两个域,古菌和细菌,分别称为原始细菌和古细菌和真细菌。这些微生物没有明显的核或其他细胞器由于缺少内部膜,主要特征区分他们从真核生物。原核的分类通常是分成三个相关领域:分类、命名和标识(7,8]。生物的有序排列分类中指定分类。命名法的目标是名国际代码后的生物命名的原核生物(ICNP)规则。识别涉及到分配描述的品种分类群(7,9,10]。然而,如果应变仍未定义的分类,特性和系统发育分析应该仔细描述和名称进行新的分类单元。

分类的基本单位是物种。Bergey系统细菌学手册定义了菌种的菌株作为一个群体中的某些特色,通常彼此相似组织的基本特征(11]。估计是地球上大约1012种细菌(12]。2021年11月,大约有17845种有效名称(没有同义词)(13]。考虑到这个数字,我们可以得出结论,细菌多样性是不够了,最可能仍由uncultivable物种。

除了安排生物分类工具用于研究微生物多样性和建立系统发育的关系。生物多样性是生态系统的稳定性的基础上,提供环境适应力14]。评估微生物生物多样性还提供了各种食品生产和再生农业生物技术资源,环保技术,如生物修复和bioprospection新酶、抗生素和生物过程。研究微生物多样性和分类法是至关重要的保证环境和社会经济效益还是未知的微生物世界。在一个试图将所提供的商品和服务的货币价值生态系统,生物多样性的价值据估计每年的优秀价值33万亿美元,接近GDP(国内生产总值增长)的美国和中国联合15]。其他的估计指出降低或类似的价值观,但毫无疑问,他们都是非常重要的16]。

尽管许多技术、规则和概念用于原核生物,综述我们描述细菌分类进化到基因组时代和重要工具开发评估细菌多样性和指导适当的分类。我们也提出一个案例研究与根瘤菌澄清分类科学的发展是如何影响这群细菌,可能在最重要的生态系统和农业可持续发展,和提高我们的知识。

2。细菌物种概念和描述的新分类群

物种的概念被认为是一个普遍的理论限制类别所有生物体的“物种”。讨论了关于原核生物,有几个不一致,因为他们不适合最常见的真核物种观念,如形态、生物学、或进化的概念17]。多年来,细菌物种分类根据表型特征,其次是多相分析涉及表型、基因型的,和系统性能,但不同细菌群体的方法。因此,每个分类单元描述由较低的分类单元,和一种物种代表每一个属。现在,下一代测序技术的进步(上天)鼓励了小说的描述物种主要基于基因组序列(18),这种做法是对细菌物种概念和分类群(19- - - - - -23]。

小说的描述细菌类群的分类学家遵循国际委员会的指导系统的原核生物(ICSP),分成几个小组委员会,根据领域知识。关于rhizobial物种,根瘤菌的分类委员会和杆菌负责指导方针。多年来,根瘤菌分类单元描述可用的唯一准则是格雷厄姆和合作者在1991年发表的(24]。最近,小组成员提出了一个改进的最小的物种,属标准描述(25),在网站上提供https://sites.google.com/view/taxonomyagrorhizo/home。菌株的基因组资料对比研究和相关类型菌株更新是必需的,和模式菌株的基因组序列代表了新物种必须存入数据库。这个需求将增加基因组的数量用于进一步的研究。

另一个关键的步骤,分类问题适当的命名,ICNP调节。小说细菌分类单元的学名需要在拉丁语中,指的是历史的分类单元,在原核生物的“批准名单”成为一个有效的名字。国际系统与进化微生物学杂志》上(IJSEM) ICSP的官方杂志,一个明确的声明的名字(即。,家人。11月11月,11月,将军sp.,等等)和它的词源,以及描述数据的分类单元和应变类型名称,必须提供(26]。IJSEM外的有效名称必须遵循这些指导方针和请求官方杂志验证(27]。

与站在原核的名字列表命名(LPSN)是一个在线工具不断更新由莱布尼兹研究所DSMZ-German收集微生物和细胞培养GmbH (https://lpsn.dsmz.de/)。它包括一个广泛的分类信息对于每一个分类单元描述,如词源、命名和分类地位、类型菌株名称和描述出版物的链接(13]。然而,值得一提的是,一些原核生物,比如那些仍然uncultivable,或遗传物质从环境中获取,尽管可能序列表明可以代表新物种,没有足够的信息需要被描述为一个新的分类单元(28]。因此,这些生物被归类为一个新物种的“候选人”或一个新属,接收分类地位Candidatus(29日]。如今,随着宏基因组的发展,包括获得基因组序列采样材料生物居住社区的一个共同的环境,数以百万计的16 s rRNA序列已经存入数据库(30.),和大量的份额低于建议阈值相似的物种界限。因此,即使uncultivable原核生物尚未分离,这些序列的分析暗示他们可能代表不同的物种。鉴于这种证据,许多努力进行了基因序列的uncultivable类群被认为是由ICSP和改变的状态Candidatus有效的名称(31日]。

3所示。一个简短的细菌分类学的观点

费迪南德•科恩发达的第一个研究细菌分类在1870年代。他利用形态学特征作为标准来定义六个不同属(1]。,基于表型性状发表不同的分类方法,分类学家的研究困难因为缺乏最小分类标准和通用协议(17]。Bergey手册第一版的限定词细菌学(1984 - 1989),改变了这种状态,定义的参考指南细菌分类,提供条件,其中的微生物学家合并采用的标准(32]。

即使出现聚类方法出现之前的电脑,他们应用于细菌学只是使用电脑后,大约在1957年,由斯尼斯和路德维希et al。33,34]。这个时代的细菌分类,数值研究几个表型属性是电子表格式和亲缘用作测量。然而,尽管数值分类法提高细菌的鉴定,它没有考虑系统发育分析35]。一起数值分类学的发展,新技术考虑到生理和生化特征开始发展,色谱、电泳等方法来定义chemotaxonomic标记,希望达到的目标对细菌的普遍分类系统(17]。

在1960年代早期,分子技术的发展支持的方法,如DNA鸟嘌呤和胞嘧啶内容(GC摩尔%)和DNA DNA杂交(DDH) [36,37分类研究。这些技术允许基因组的比较,提高细菌的分类。自第一个实验基于单链DNA Schildkraut(希尔德克劳特)进行的重新组合等人(1961年38),大约50年来,DDH被用作细菌物种界限的标准技术(8,9,17]。

在试图确定一个了不起的突破远亲生物之间的关系是在1970年代Taq酶被发现和用于DNA通过聚合酶链反应(PCR)扩增技术(39),双脱氧法测序技术被桑格et al。40]。几乎同时,小核糖体亚基16 s rRNA为18 s rRNA原核生物和真核生物被描述,并开始被广泛用作分子标记组织所有生物体分成三个高级分类单元,古生菌,细菌,真核生物,称为域(41]。这一新的分级分类系统基于这些分子标记允许加入原核系统发育信息的分类(2,42- - - - - -45]。

系统学研究生物体之间的进化关系,并使用保守分子数据成为普遍接受的分类。核糖体序列后,其他保守基因开始使用(46]。茎虽然不可以使用序列,序列输入(MLST)一般评估8到12连接看家基因或其他蛋白质编码基因识别基因型和区分病毒密切相关,成为广泛应用于分子流行病学。MLST,每个基因(轨迹)包含不同的等位基因;等位基因的差异是转换的值导致的“序列类型”细菌,这是可用的(就像在一个特定的数据库比较https://pubmlst.org/)的一些致病细菌。尽管MLST不常用的推断发展史在流行病学研究中,这是申请这个目的在分类研究中,导致茎的发展序列分析(二)47- - - - - -52]。

二访问连接看家基因的进化信息构建系统发育树和更健壮的数据比分析单一序列(53,54]。研究的一个重要工具是原核生物的多样性和分类分类群的物种描述由于其高分辨率的权力。序列是一致的,信息网站进行了比较。在16 s rRNA分析,核苷酸的身份(倪),这是一个百分比的序列相似性,必须尊重每个各自的阈值建议群研究[46,55,56]。可以通过使用不同种类的系统发育重建推理方法。每一款都有其特别的优势和劣势,需要仔细考虑选择最佳方法适合分析(25,57]。

今天,先进的测序技术允许分类使用硅比较微生物基因组数据,帮助分配他们各自的类群或描述新的分类单元,以适应新的组织。随着基因组测序,分类学家可以计算整个genome-related指数(OGRIs)和估计的微生物之间的关系;然而,建议还应该考虑阈值。OGRIs来取代DDH由于其低成本,基因组信息的再现性和质量。此外,基因组序列可以存入数据库,以便其他科学家可以使用数据没有培养各自的细菌(51,58]。OGRIs包括平均核苷酸身份(ANI)和数字dna dna杂交(dDDH),最广泛的用于计算orthological两个基因组序列之间的关系。这些序列是起源于同一祖先序列,使得整个进化保守。研究表明,ANI是一个强大的进化距离的测量,与DDH值自2005年以来已发表(59,60]。

总之,直到基因组时代,多相分类是用来识别,分类,根据表型和名称原核生物,基因型的,和系统发育特征。它使相当大的进步和稳定的微生物分类。然而,随着基因组测序的进步,今天有更好的工具来描述物种,微生物多样性研究发展史,纵坐标。微生物分类的历史包含了最先进的技术,坚持标准和规则,代表一个科学领域的进步与保守主义(61年,62年]。

4所示。生物信息学、进化标记和阈值

进化的分子标记是本构基因反映生物体的发展史,因为基地的替换在DNA序列(由突变和重组)正比于每一个物种的进化经历了从它的祖先,使物种的分化水平的估计(63年]。在细菌分类,这些分子标记开始被放大,测序,并用于过去的纵坐标细菌与PCR和测序技术的发展。序列的扩增子的分子标记菌株的研究和相关菌株需要对齐使用特定算法,如肌肉(64年]和ClustalW [65年),识别重要的网站分析。

在下一步中,建议选择最好的替代模型的多重序列比对,这取决于系统的方法来理解集团的发展史研究。模型的替换算法负责评估每个核苷酸的频率和替换的频率,区分过渡(换取氮基地相同的生化类)和颠换(换取不同的生化类的氮基地)。,该模型可以推断对齐(的发展历程66年,67年]。最后,系统方法用于构造发展史的基础上,对齐和最佳发展的模型。进化的结果是一个图形表示的菌株的系统发育树。

在种系发生树,四肢调查所代表的血统(序列,菌株)。水平线被称为分支,节点连接分支代表菌株之间的最近共同祖先(67年]。然而,一个可靠的发展史重建需要考虑序列的数量,大小的对齐,统计的支持,和外围集团。引导是常用的发展史为树节点(提供数据支持68年]。这种信心测试包含多个数据集具有相同大小的重采样与原始对齐。对于每个重采样,算法随机选择的网站,也就是说,列对齐,这可能是重复或排除。不同重采样的系统发育树结果而获得的树在最初的对齐。重采样的数量是可变的,可以选择的研究,以确保可靠的发展史(69年]。引导值对应于每组发现的比例在所有树木获得重采样。外围集团代表了一个相关的分类群,它是用来显示原始菌株,帮助确定树的根(70年]。

也可以计算倪,数学参数用来测量的百分比之间的相似的核苷酸序列对齐,但它并不包括进化分析。倪特定软件可用来计算,如BioEdit [71年]。几项研究比较倪特定序列和基因分析,如dDDH或ANI,一大群的菌株标准建议值反映原核生物的全基因组特征的倪,节约时间和成本。这些值通常被称为阈值或截止值,用于分类单元界限(56,72年]。

16 s rRNA的基因,细菌的一个关键分子标记分类,包含约1500个碱基对(bp)和在合成过程中发挥作用基本每原核生物蛋白质的功能。它是起源于一个共同的祖先在所有原核生物中,同源,在整个进化过程中保持守恒,但与进化信息变量的网站(42,73年]。16 s rRNA序列的差异程度可以估计系统菌株之间的距离,因此,被认为是分子天文钟在细菌分类1,67年]。

一些数值已经提出的16 s rRNA倪划定物种界限。例如,在1994年Stackebrandt和Goebel [74年倪]表明,菌株分享不到97%的16 s rRNA序列不应属于同一物种因为同源性不会给dna dna重新组合60 - 70%以上。之后,一个阈值从98.7到99%被认为是对应DDH重新关联值物种界定(1]。最近,金等。72年)进行了一次大16 s rRNA序列的相似性之间的比较研究和ANI并提出了阈值98.65%的16 s rRNA序列的相似性区分两个物种。

小说分类单元的数量的增加使用16 s rRNA描述序列数据已经彻底改变了我们的微生物知识分类,尤其是在物种水平(51]。然而,16 s rRNA分析的分辨能力是有限的,由于守恒的站点的优势在这些序列,不给足够的进化信息分析和限制识别在属级(6,75年- - - - - -77年),95%属划定的建议阈值(78年]。此外,研究报告,这些序列可以有多个异构的副本,在某些微生物组,水平基因转移(HGT)可能发生[79年,80年]。这些事件可能导致误解的进化数据(81年]。关于这些问题涉及核糖体序列,从16 s rRNA发展史的信息必须与分子的建议值分析证实与更好的分辨能力,不应该取代其他方法。

许多分类学家分析了内部转录间隔区(ITS)作为替代分子标记增加知识核糖体地区(75年,82年- - - - - -84年]。这些序列位于small-subunit之间(16 s rRNA)和大亚基(23 s rRNA)核糖体RNA和包含高度变量序列的区域,使细菌的分化甚至在应变水平,显示出更高的系统发育多样性(85年- - - - - -87年]。例如,一项研究Bradyrhizobium属证明菌株分享95.5%镍在序列在DDH相当于60%的重新组合,属于同一物种的(88年]。然而,随着16 s rRNA,这些序列没有高分辨率推断物种级别的分类群。尽管不经常使用,但23 s rRNA也可能被应用作为分子标记。23 s rRNA位于大原核核糖体亚基,具有保护作用,普遍分布,提出了序列和不同程度的变化。然而,它通常表现为显示插入和删除与大尺寸,导致更多的信息来提高系统分辨率作为额外的分析(66年,89年]。

尽管16 s rRNA序列已被广泛用作基本的进化分析的有效工具和可耕种的uncultivable细菌,对于密切相关的组,他们无法确定最近的邻居因为不同的物种可以分享相同或几乎相同的16 s rRNA序列(83年,90年- - - - - -93年]。一种方法,可以用来填补这个差距是二。如前所述,二将一起从连接看家基因进化信息,以更好地保证正确的分类群菌株鉴定研究。管家基因负责基本角色的基础微生物新陈代谢,细胞的基本编码蛋白质功能。因此,他们有保护水平高但速度进化率与核糖体序列相比,携带更多的系统发育信息(94年]。

二允许基因在一起作为一个更大的系统发育分析数据集(35,46,52,95年]。因此,聚集足够的系统信号的方法,提供一个缓冲效果noncongruent信号影响较小的数据集,更可靠的(77年,94年,96年]。然而,值得一提的是,一个管家基因分析并不能反映整个进化的模式菌株;建议继续16 s rRNA之间的比较,每个看家基因种系发生检测和避免潜在的高度和重组事件,因为每个看家基因可能不同的历史进化过程(75年,92年]。

二的主要要求包括管家基因的选择,应该存在于所有生物的基因组研究对象作为一个基因组复制和传播。他们还必须有一致的大小允许系统发育重建和测序。因此,不同属可能不同的基因用于分析(46,52]。此外,产生的数据从二必须证实16 s rRNA, dDDH, ANI分析。推荐使用至少5看家基因,考虑到直接的基因数量反映了歧视性的技术(52]。一些最常见的看家基因申请新类群的分类是ATP合酶β亚基(atpD),伴护蛋白(dnaK)、谷氨酰胺合成酶二世(glnII)、谷氨酸合成酶(gltB),DNA促旋酶β亚基(gyrB),重组酶(recA),RNA聚合酶β亚基(rpoB)和色氨酸合成酶β亚基(trpB)[10,75年,97年- - - - - -99年]。此外,新基因可以研究,旨在确定他们是否提供相关的和一致的系统发育信息上面引用的这些基因。

管家基因选择后,每组的单基因序列应该一致,保持同一地区的比较和同样大小的对齐。随后,每个单基因的发展史是单独建立和比较,如果它们全等,排列必须连接来进行这次二。连接过程可以进行手动使用软件或任何文本编辑器程序。一些最常见的软件原核序列对齐的大型(分子进化遗传学分析)(One hundred.)提供肌肉和ClustalW对齐工具,和BioEdit71年ClustalW)也提供校准工具。连接序列,海景(101年是常用的。此外,重要的是要寻找更新序列数据库构建可靠的发展史,验证序列的质量和可用性的序列密切相关的压力。

2002年,ICSP特设委员会推荐连接看家基因的分析作为一个有前途的方法来取代DDH协会在细菌分类102年]。在这之后,Konstantinidis et al。56]研究广泛的四个重要细菌全基因组比较组。他们得出的结论是,六到八个基因的种系发生反映了ANI DDH阈值的70%,96%的物种界限。作者并没有建议任何特定的基因和肯定,即使是随机的基因组合,他们为组织提供一个健壮的发展史研究[56,103年]。此后,连接看家基因已被接受的倪预测全基因组信息和区分细菌组(98年,104年- - - - - -106年]。但是,没有通用阈值二还决定了物种界限(18]。然而,二是作为一个伟大的策略来区分物种在细菌分类学的研究中,它被认为是一个关键步骤的细菌分类,因为它比16 s rRNA系统合理的分析,涉及到守恒的地区能够推断出发展史,与OGRIs数学参数(51]。

5。评估基因特征

随着DNA分子代表物种的身份,研究基因组资料允许获取相关信息进行分类。原核生物的基因组包含重复序列的形式分布于整个染色体;然而,网站、长度和他们重复的次数是每个应变特征,代表每个基因组的指纹。评估这些基因组资料,分类学家使用DNA扩增PCR与特定的引物为这些地区或限制性内切酶减少限制性位点的染色体。因此,在这两个过程,有不同的DNA片段的混合物可以通过电泳分离揭示各自的基因档案(9,107年,108年]。分类研究有三个主要组重复的元素:重复基因外回文(代表)109年(ERIC) [], enterobacterial重复基因间的共识110年),和框元素(111年- - - - - -113年]。这些物种界限分析是有限的,但是如果使用得当,它们可以应用于确定菌株相同的物种的多样性,发现克隆,并验证菌株在研究或文化集合8,108年,114年]。

DDH评估扩展和稳定的DNA混合链两个基因组混合物连续分离和重新组合后的孵化受控条件下(115年]。截止是基于百分比的重新组合使用混合的熔化温度的差异DNA链(不同的)相比,100%的原始链(相应的)。如果本协会为70%或更高,或者融化温差(ΔTm)低于5°C,基因组比较属于同一物种(7,18,35]。DDH开始被应用在一个假定的小说组共享超过97%镍在16 s rRNA序列相关的物种,旨在保证足够的菌株的基因组之间的差异来支持一个新组的描述。自从在微生物学(DDH的引入116年),它成为物种界定的“黄金标准”细菌和古生菌和所需技术在每一个原核生物物种描述(8]。然而,尽管引用优势,DDH的局限性,特别是对于耗时,需要密集的劳动,而不是允许不同实验结果的比较,不允许建立一个全球数据库(44,51,117年,118年]。

第一个原核生物基因组测序的细菌流感嗜血杆菌在1995年,使用传统的桑格测序技术(119年]。虽然一个新的基因组时代开始,基因组测序的高成本和耗时的过程不允许一个十年的重大进展。2005年,捷技术的到来,也称为高通量测序方法,基因组测序的便利和低成本推出了原核生物的基因组测序报告(51,120年]。今天,许多测序平台可以使用,他们分为两大组,根据模板用于测序反应的类型,高端仪器,桌上型仪器。高端平台需求更多的技术基础设施的数据跟踪、分析和存储,而桌上型的更温和的需求。现在,最流行的平台是MiSeq和HiSeq (Illumina公司、美国),离子激流(热费希尔科学、美国),和太平洋生物科学(美国)(60]。

统计参数用于报告的质量基因组大会推荐分类的目的是(我)基因组大小,定义为所有的长度重叠群测序;(2)将军,定义为长度最短的叠连群,累积地显示50%或更多的基因组大小的长度重叠群是总结从最大的到最短;和(3)报道的深度测序,表明有多少测序读生成;这个值通常是作为折叠和建议至少50 x(50倍)平台引用之前(60,121年]。分类是基因组中另一个需要考虑的关键问题的真实性,这可以通过比较完整的保守序列,16 s rRNA或管家基因从基因组中提取相同的序列通过传统Sanger测序获得的。在描述一个新物种,这种比较与模式菌株(应至少执行51]。

目前,使用基因组测序,分类学家可以使用其他分析研究细菌的dna之间的关联性。这些分析的阈值显示与70% DDH技术。正如上面提到的,这些值被称为OGRIs和有效地计算基因组的相似之处在网上(51,58]。ANI和dDDH现在广泛用于替换原来的DDH,采用阈值的95 - 96%和70%,分别为物种界限。OGRIs可以计算使用软件工具进行分类的目的。今天有许多现成的web服务,比如Genome-to-Genome距离计算器和ANI计算器,和独立的工具,如JSpecies和OrthoANI USEARCH。除了快速、低成本,高质量的基因组数据库的序列可以改进,研究人员可以使用世界范围内(60,117年,122年,123年]。

与基因组序列的可用性,另一个参数,可以计算在网上是DNA鸟嘌呤和胞嘧啶(GC)内容,也用作基因型的标记在分类124年]。一开始,基地的成分变异株的同一物种不应超过3摩尔%,从同一属菌株,10 mol % (7]。之后,调查比较基因组数据的GC含量和dDDH表明,菌株之间的差异不应超过1摩尔%的同一物种58]。GC内容可以使用工具来组装基因组计算,如种子查看器提供的服务器(拉斯特125年],QUAST [121年],BioEdit [71年]。尽管GC含量是重要的区分nonrelated细菌,类似DNA碱基组成并不必然意味着两个菌株密切相关[35]。

6。表型性状

与真核生物的分类,表型特征可以用来区分一些生物,这些特征是可疑的原核生物,因为不同种类的细菌可以将相同的表型(17]。然而,开始使用表型评价有助于划定的原核的分类进一步分析;例如,大多数致病细菌群体出现的表型在文学和快速诊断的关键。

经典的表型测试微生物包括形态、生理和生化分析。形态特征描述细胞和殖民地特性,如细胞形状、内生孢子的形成,鞭毛,革兰氏染色剂,颜色菌落直径、透明度,粘液,及其一致性。另一方面,生理生化特征包括文化在不同生长条件下的数据,如温度,pH值(4 - 12),耐盐碱(1 - 10%),O2或公司2要求,宽容不同的抗生素、酶活性(即。、脲酶)和代谢化合物(即。、碳源和氮源)(7,9,28,126年]。因此,建议比较获得的数据和参考或类型菌株,包括正面和负面的控制8]。此外,使用等商业测试用最小的标准API (bioMerieux)或生物测井(生物测井,Inc .)评估碳源利用率由细菌建议避免实验室之间的不一致。

另一个常见的表型测试细胞的化学特征,评估细胞外的元素(肽聚糖、磷壁酸和霉菌酸),细胞膜成分(脂肪酸,极性脂质,呼吸道lipoquinones和颜料),或细胞质化合物(聚胺类)8]。这些特性也称为chemotaxonomic标记,因为它们通常是稳定在一个细菌组(127年]。由此产生的数据在特定的数据库。最常见的一种是脂肪酸的数据库配置文件由夏洛克微生物识别系统实现(MIDI, Inc .) [8,105年,128年]。尽管细胞化学特性提供重要的信息,它已成为不寻常的分类研究,因为测试是非常艰苦的,通常需要特定的设备和方法,允许只在属级分类识别。最近,使用Matrix-Assisted激光解吸/电离飞行时间(MALDI-TOF)细菌鉴定已成为快速、精确,和具有成本效益的方法,尤其是相比,传统的表型和分子技术。它是基于细菌的分析组件配置文件,作为直接从完整的细菌中提取蛋白质,并与参考数据库识别(129年,130年]。这种方法是常用的临床分离株的鉴定,但随着参考数据库被更新,这是成为可行的其他组的细菌,如根瘤菌(131年- - - - - -133年]。

值得一提的是,有许多没有已知功能基因编码蛋白质。因此,表型测试可以帮助寻找蛋白质与生物技术的兴趣,提高了解微生物与环境的相互作用(18]。然而,表型结果的组合基因型和环境条件。因此,它不可能知道整个原核生物的表现型仅基于可观测的特点或从基因组获得的信息。在分类,通常发现一些表型不一致数据评估,可能是因为附件基因组编码许多表型性状;例如,质粒容易生物体之间的交换。此外,由于没有实验室条件下能够完全模拟环境,表型特征可以排除一些微生物,比如uncultivable。因此,这些基因组分析(需要验证的数据134年]。

7所示。根瘤菌的研究情况

7.1。根瘤菌分类的历史

2000多年前,中国古代文学报道,豆类和谷物轮作是传统上用于提高粮食产量。改善土壤肥力通过培养豆类就已经注意到,尽管机制还不知道(28]。然而,只是年底19世纪大气氮的同化与豆科植物的根瘤数,并于1888年第一个根瘤细菌是孤立的结节Pisum一植物(豌豆)和荷兰微生物学家中国对外报道的威廉拜耶林克负责固氮作用过程。孤立的细菌最初命名芽孢杆菌radicicola但后来重新归类为根瘤菌,包括根瘤菌leguminosarum物种(28,135年,136年]。从那时起,一直一般称为根瘤菌结瘤固氮细菌(137年]。

在二十世纪初,有节测试使用广泛的寄主植物和不同的细菌进行了寄主植物之间的特异性和共生细菌被报道。在此基础上,鲍德温和弗雷德(138年]提出了cross-nodulation概念,表明根瘤菌和宿主植物之间的特异性。大约80年,物种分类学家这一概念用于定义,和六个主要物种描述:r . leguminosarum(136年),r . phaseoli,r . trifolii,r . meliloti(139年酵母提取物),产生酸反应甘露醇琼脂(YMA)中,和r . lupini(140年),r .日本血吸虫(141年),在同一介质产生碱性反应。除了这六个物种,其他菌株分离豇豆被定义为根瘤菌spp。135年,142年]。

分类法把cross-nodulation概念后几项研究报告异常和菌株分享相似度高,属于不同的群体。此外,根瘤菌分类所需的更多信息,包括调整一般细菌分类(143年- - - - - -145年]。然而,即使在根瘤菌分类cross-inoculation概念之后,继续研究,代表一个重要的特性对于接种和效率的共生28]。

下一步的根瘤菌分类是基于数值分类使用电脑比较细菌属性。在1960年代,许多分析都包括在分类学研究涉及表型性状、生长条件、养分资源,代谢功能,抵抗抗生素和其他化学物质,等等。同时,DNA分子开始调查,和碱基组成(GC摩尔%)添加细菌的分类(145年- - - - - -148年]。使用数值分类法结合DNA分析,其他三个rhizobial属。1982年,乔丹149年属的]提出了描述Bradyrhizobium分配增长缓慢的物种b .日本血吸虫b . lupini。六年后,属Azorhizobium(150年)是描述,包括能有效结瘤根和茎的菌株田菁属rostrata独立生存的有氧条件下和固氮。同年,Sinorhizobium属提出了快速增长的大豆品种大豆根瘤菌(151年]。

在1990年代,许多其他分析包含在分类学研究。多相分类学证实一些类群提出了数值分类法还指出,数值分类法缺乏关于根瘤菌之间的进化关系的信息。一致的DNA研究允许分类评估细菌多样性和系统发育关系在分子水平上28]。16 s rRNA序列分析包含在根瘤菌物种描述和重新分类在1991年格雷厄姆和合作者(24最小标准公布新的根瘤菌和物种描述农杆菌属(152年]。考虑到16 s rRNA发展史及相似性,根瘤菌分类在门变形菌门,细分α变形菌门(153年]。在相同的十年中,两个属。首先,贾维斯et al。154年)提出了属Mesorhizobium分配五根瘤菌物种与一个中间增长率快速增长根瘤菌Sinorhizobium与增长缓慢Bradyrhizobium。后,德Lajudie et al。155年属的]提出了描述Allorhizobium共生细菌与水生豆类Neptunia•

六个根瘤菌属被分配在四个不同的家庭:Bradyrhizobium(149年),Mesorhizobium(154年),而Azorhizobium(150年)属于家庭Bradyrhizobiaceae(今天Nitrobacteraceae) Phyllobacteriaceae Xanthobacteraceae,分别根瘤菌(136年),Sinorhizobium(重新归类为Ensifer)[151年,156年),而Allorhizobium(155年)属于家庭根瘤菌科(157年]。此外,一项研究与家庭成员的根瘤菌科报道16 s rRNA基因的相似性高于92%属,表明这个值可以是一个家庭界定阈值(158年]。

新世纪开始根瘤菌分类上的革命。发生在2001年1月,第一次里程碑的第一份报告non-rhizobia固氮细菌legume-symbiotic孤立结节的Crotalaria,分为Methylobacterium(159年),物种m . nodulans(160年]。就在同一个月,基于16 s rRNA分析(161年),年轻的et al。162年建议所有物种的包容农杆菌属(152年),Allorhizobium undicola(155年在属根瘤菌。在2002年,属的一个新物种Devosia据报道,诱导固氮根瘤在吗Neptunia•(163年]。2005年,第一个根瘤菌属Phyllobacterium被描述为p . trifolii,孤立的结节三叶草pratense(164年]。从2005年到2007年,属Ochrobactrum(今天,布鲁氏菌)[165年,166年分配两种结瘤,o . lupinio . cytisi(167年,168年),孤立的结节Lupinus白色Cytisus scoparius,分别。2008年,林和合作者169年)中所描述的Shinella属(170年的共生细菌美国kummerowiae孤立的从根结节Kummerowia stipulacea。2009年,第一个rhizobial隔离(BA135)属于物种Aminobacter aminovorans据报道,孤立结节的莲花清塞音(171年]。在接下来的十年中,从2012年到2014年,属Microvirga(172年)分配四结瘤固氮新物种,m . lupini隔绝Lupinus texensis,m . lotononidis,m . zambiensis隔绝Listia angolensis,m . vignae隔绝豇豆属unguiculata(173年,174年]。

除了所有这些变化α变形菌门课,2001年杰出的报告结瘤β变形菌门(175年),属于属洋葱1992年,被Yabuuchi和合作者(176年]。这是第一次,基本有节基因(点头)和报告的分枝能力均不属于共生细菌α变形菌门(175年]。之后,几个结瘤的细菌β变形菌门属被描述,包括Ralstonia属(177年),在2004年重新分类Cupriavidus(178年- - - - - -180年),除了几个物种的洋葱属,后来重新归类为新属Paraburkholderia(181年,182年]。在接下来的几年里,单一的引入和连接看家基因的系统发育研究最终导致许多物种的重新分类和提议的新属NeorhizobiumPararhizobium,也属的修订农杆菌属Allorhizobium(183年,184年]。最近,使用全基因组分析,桑托斯和合作者21建议两个新属的描述,MycetohabitansTrinickia,最后一个包含结瘤固氮的物种t . symbiotica

进化的分类分析,我们可以得出这样的结论:很多结瘤的描述细菌,分离出结节不同的主机和nonrhizobial属已经出版,和许多分类群的重新分类。大部分的细菌有一组不同的有节(点头)和固氮作用(nif)基因,其中一些相关基因的不同成员的古典rhizobial属。这些发现表明,建立与豆科植物共生关系的能力是在细菌比预期的更广泛(137年,175年]。

今天,根瘤菌分布在八个家庭,7个属于α变形菌门,另一个在类β变形菌门。从这两个子类,α根瘤菌报告为广泛分布,在地理和宿主范围,虽然β根瘤菌已经很成熟,他们的分布似乎更受限制28]。的α变形菌门的家庭是分配的根瘤菌科7属,三个属的Phyllobacteriaceae Methylobacteriaceae有两个属,和其他四个家庭只分配一个属,硝化细菌科(老Bradyrhizobiaceae),布鲁氏菌科,生丝微菌科,Xanthobacteiaceae。的β变形菌门家庭Burkholderiaceae有三个属。属的物种数量的列表与有效的名字站在命名(没有同义词)根据LPSN表列出2021年10月1

2020年,一项研究进行表型、基因组和属的系统发育分析Ensifer并认为属应该分为两类,一个用于共生进化枝,另一个用于nonsymbiotic进化枝(185年]。最近,IJSEM建议修订出版的家庭根瘤菌科(186年]。core-proteome的广泛的研究表明一个阈值约86%的平均氨基酸身份(cpAAI)作为属划定一个新的框架。值得注意的是提到cpAAI不能作为唯一的信息属划定,和作者指定“大约86%”关于每个属的进化提供了一些灵活性。尽管LPSN网站尚未更新验证的名字,在重新分类研究的基础上Kuzmanović和合作者186年),有参数的统一属EnsiferSinorhizobium不再是合理的,提出了八个新的组合,但并不是所有涉及rhizobial菌株(186年]。

从表1基于LPSN,我们可以得出这样的结论:今天超过200种已知rhizobial分成19个属的α- - -β变形菌门子类,数量逐年上升。然而,不到一半的这些有效的名字来自19个属物种组成菌株已经报道的共生特性,包括有节和固氮能力。此外,许多物种作为内生菌,或从环境样品分离,或从结节但无法重建的共生关系。因此,许多物种的共生能力在很大程度上仍是个未知数。

此外,在2004年,Benhizia和合作者187年首次公布的隔离γ变形菌门的物种从豆类结节。在这项研究中,52隔离属于假单胞菌,埃希氏杆菌属,Leclercia,Pantoea,肠杆菌属属是从三个孤立的Hedysarum物种,rhizobia-like细菌被发现占领结节。然而,科赫法则和隔离的共生参数没有进行调查。受伤和合作者188年)也报道2010年rhizobial菌株的存在γ变形菌门细分。作者描述了点头nif基因的假单胞菌sp.应变Ch10048,共享共生序列的相似性高农杆菌属sp,建议收购这些基因通过HGT rhizobial物种在土壤中。尽管这份报告点头nif在应变Ch10048基因,结瘤能力的确认主机豆类洋槐pseudoacacia的存在γ根瘤菌仍存在争议,直到没有提供更多的证据证实了基因的其他细菌共存结节,固氮能力的应变测试28]。

毫无疑问,根瘤菌分类先进与原核生物的分类,和改进这些细菌的起源和演化。然而,有一个需要增加相关的研究发展史的分类学和系统学根瘤菌固氮作用和生物技术的特性。

8。Rhizobial共生参数和基因组结构

说过,小组委员会的成员的根瘤菌的分类和杆菌ICSP回顾了这群细菌分类学发展和更新的最低标准分类研究,包括特定于根瘤菌和杆菌介导的其他注意事项。根据他们的说法,分类定义不应包括共生或致病性人物因为与植物的相互作用是由附件可能出现在几个细菌物种的基因,得到或者失去,实施分类限制(25]。相反,如果一个应变关于植物表型,这应该是分类方案中描述应变的但视为财产,不是全部的分类单元。值得一提的是,symbiovars也在rhizobial调查学习,虽然没有接受正式的分类范畴。symbiovar这个词是在2011年提出的名字一群菌株能结瘤固氮和各种豆类或一个特定的豆类,今天这个定义是主要基于共生基因的种系发生25,189年]。

关于新rhizobial物种的描述,特别是建议评价菌株的共生能力基于科赫法则使用原始主机和/或其他豆科物种。最后一个选择可以用来扩大信息病毒的宿主范围和定义symbiovar团体或者当原始寄主植物的种子并不可用。这个物种菜豆,Macroptilium atropurpureum,豇豆属unguiculata,含羞草是滥交的豆类常用根瘤菌的分类研究。共生的能力可能是评估相比,负控制的/没有根结节,植物生物量、N含量、或乙炔还原试验。此外,必须分离菌株的结节,保持原来的表型,系统,或基因型的特性,服从科赫法则(25,190年,191年]。

荟萃分析的基础上,1708年完成2017年细菌基因组进行diCenzo和菲南192年细菌基因组的平均数和中位数),发现3.65 Mb和3.46 Mb,分别。2020年的回顾性研究中,戈德斯和合作者(193年)的代表菌株的基因组进行比较α根瘤菌和β根瘤菌,表明rhizobial基因组范围从3.42 MbCupriavidus taiwanensis液化沼气19424 - 9.36 MbMicrovirga lupiniLut6。然而,作者强调,一些菌株Bradyrhizobium, Mesorhizobium,Azorhizobium属基因组可能更高,这意味着rhizobial基因组可以两次或更多倍的平均大小细菌基因组在这两项研究报告(192年,193年]。相比之下,另一项研究报告说Ensifer菌株从共生进化枝平均减少325基因和似乎少rRNA操纵子株相比,属于nonsymbiotic进化枝(185年]。大型基因组可能与适应土壤和根际环境194年]。

一般来说,rhizobial基因负责植物感染,有节,和固氮作用聚集在一起共生质粒染色体或共生的群岛,甚至在两个基因组区域(195年- - - - - -200年]。这些集群经常移动遗传成分的一部分(兆欧)有独立的进化历程201年]。例外是2007年首次报道揭露一群Bradyrhizobium株光合能力并不拥有有节基因,可以诱导有节而有节(点头)因素202年]。众所周知,点头因素发挥着至关重要的作用在rhizobia-legume宿主特异性的相互作用;这些分子不同的共生具体支柱长度和其他结构,确定组植物根瘤菌结瘤(203年,204年]。回顾最近出版,智利和Mandal [205年)其他研究报告指出,即使在没有点头的因素,其他bradyrhizobia菌株,不属于光合作用组,也可以建立成功的有节。中讨论的假设,有点头的可能性因素独立有节开始通过裂纹与宿主感染入侵过程中,而不是形成感染常见的线程。感染后,有节可能使用类似的信号发生和机制存在于Nod-dependent有节(205年,206年]。

除了主要的染色体,一些细菌有“第二染色体”或“megaplasmid”,提出了“chromid”这个词。这些元素有一些核心基因和核苷酸组成类似于相关的染色体,但大部分基因是配件。有些根瘤菌和杆菌也有genus-specific chromids,属内相似但不同的保守基因属之一。一个例子是农杆菌属物种与线性chromids携带一个独特的复制系统和守恒的基因(207年]。

9。Rhizobial起源假说和演化

作为生物固氮作用被认为是最重要的生物过程对地球上的生命,有真生物技术兴趣diazotrophic细菌(208年]。研究有节和固氮效率的能力,加上核心和共生基因的系统发育比较,给出见解diazotrophic细菌的起源和生物进化的固定能力在原核生物106年,209年,210年]。

Remigi和合作者201年回顾,固氮能力比有节过程和广泛传播细菌和古生菌。有节的基因可能会聚集在共生进化的早期其他功能基因重复和专业化的道路。如今,有节的高多样性基因很难表明细菌家族的祖先。的nif点头基因有不同的发展史,这意味着根瘤菌固氮能力继承他们的独立生存的亲戚(211年]。除此之外,这些基因的距离并不是必不可少的功能,它表明最近HGT事件作为一个共生。

证据表明,Bradyrhizobium可能是根瘤菌属的祖先212年]。使用谷氨酰胺合成酶的酶基因(GSI和GSII),对于氮同化,估计Bradyrhizobium起源于5.53亿年前(缅甸)。其他根瘤菌进化400 - 324米娅,原始的Mesorhizobium,根瘤菌,Sinorhizobium(=Ensifer)属。有趣的是,第一个豆类登上地球上多久,大约70米娅(63年,213年]。的另一个证据Bradyrhizobium祖先是一些菌株被发现与固氮能力独立生存的细菌,在一些观测到的Azorhizobium,血统都是遥远的从其他rhizobial属(28]。

众所周知,细菌有不同的机制来交换遗传物质。这个事件更复发之间的生物共享同一生态环境,加强一些根瘤菌共生进化通过收购来自其他物种的基因的高度(197年,214年,215年]。此外,一项研究答:caulinodans报道水平转移频率的增加其共生的岛屿在豆科植物根际土壤或植物黄酮类化合物的存在,表明宿主依赖性进化(216年]。随着时间进化,共生功能基因的水平转移之间的共生和nonsymbiotic细菌假设负责大根瘤菌多样性越来越多的研究报告(201年,217年]。根际细菌的庞大人口,似乎自相矛盾的,共生仅限于只有19个属。然而,越来越多的研究报告nonrhizobial结节里面的细菌的共存,这值得进一步研究和可能有助于解释,更多的合作伙伴帮助共生(153年,218年- - - - - -222年]。

10。结论

提出了评估,分类的主要目的是协调生物和分级系统稳定。如图1,已经取得显著进展:在原核生物和根瘤菌分类和发展史。然而,与基因组时代可能出现深刻的变化。然而,健壮的分类方法逐渐成为越来越多的实验室,让研究人员极大的兴趣进行调查。这些研究有了新见解的起源、进化,和地球上细菌的多样性和近18000的描述有效的物种,其中220多是根瘤菌。然而,需要更多的研究来关联固氮根瘤菌的分类与生物技术特性来提高他们对农业和环境可持续性的贡献。

缩写

ANI: 平均核苷酸身份
DDH: dna dna杂交
dDDH: 数字dna dna杂交
埃里克: Enterobacterial重复基因间的共识
国内生产总值: 国内生产总值增长
高度: 水平基因转移
ICNP: 国际代码命名的原核生物
ICSP: 国际委员会在原核生物系统
IJSEM: 国际系统与进化微生物学杂志》上
其: 内部转录间隔区
LPSN: 原核与站在术语名称的列表
兆: 分子进化遗传学分析
兆欧: 移动遗传元素
二: 茎序列分析
MLST: 茎序列类型
米娅: 几百万年前
门店: 新一代测序
倪: 核苷酸的身份
OGRI: 整体genome-related指数
聚合酶链反应: 聚合酶链反应
代表: 重复的基因外回文。

的利益冲突

作者宣称他们没有利益冲突的出版。

作者的贡献

路易莎卡洛琳Ferraz海琳和米Serenato Klepa贡献同样这项工作。作者宣称,他们已经同意参与手稿和发布。

确认

从斗篷L.C.F.海琳承认博士后奖学金(INCT)。从斗篷硕士Klepa承认博士奖学金(Coordenacao de Aperfeicoamento de Pessoal de含量优越,财务代码001)和m . Hungria承认研究员CNPq(巴西科学和技术发展委员会,303026/2020-0)。这项研究部分由INCT-Plant-Growth促进微生物对农业可持续发展和环境责任(CNPq 465133/2014-4, Fundacao Araucaria-STI 043/2019,斗篷)。