研究文章|开放获取
本杰明·j·塔利乔安妮·b·爱默生,凯伦·安德拉德约亨•j•布洛克埃里克·e·艾伦吉莉安·班菲尔德,卡拉海德堡, ”新创序列Haloquadratum walsbyiTyrrell湖,澳大利亚,揭示一个变量基因组景观”,古生菌, 卷。2015年, 文章的ID875784年, 12 页面, 2015年。 https://doi.org/10.1155/2015/875784
新创序列Haloquadratum walsbyiTyrrell湖,澳大利亚,揭示一个变量基因组景观
文摘
咸水环境系统接近饱和盐水平代表了一个极端的环境中,生物的生长和生存的极限附近生活。丰富的微生物群落的成员之一高系统archaeon广场,Haloquadratum walsbyi。利用短内容metagenome Tyrrell湖,咸水环境生态系统在维多利亚,澳大利亚,我们表现的比较基因组分析h . walsbyi为了更好地理解不同菌株之间的变异程度/亚种。结果显示,之前分离株/亚种不能完全描述的完整曲目基因组景观中h . walsbyi。重组、插入和删除湖Tyrrell派生的观察Haloquadratum基因组和被环境支持新创占主导地位的基因组序列,包括变化的两个最丰富的品种。分析有关halomucins表示,这个大蛋白同系物是不常见的所有物种的一个特征Haloquadratum。进一步,我们分析了腺苷结合盒转运蛋白(ABC-type运输车)利基分区不同菌株之间的证据/亚种。我们能够确定独特的和可变运输机从所有五个基因组分析和子单元新创环境序列,表明不同的养分和碳源获取可能发挥作用在维护不同的菌株/亚种。
1。背景
低的微生物多样性,极端的高盐度环境一直得到广泛的研究提供一个更详细的了解现存的社区(1- - - - - -4]。微生物,包括嗜盐古生菌为主,在这些极端环境中茁壮成长在高盐浓度下定义,可以维持生命,提供实验模型系统来评估微生物增长的极限。生物压力在这些环境中并不局限于高盐浓度也包括高温,强烈的紫外线照射,氧含量波动和可变离子比率可以影响电化学梯度的建立(5]。即使限制氧气浓度,许多微生物在这些系统中生长最佳有氧,异养条件下(6]。
h . walsbyi闻名的主导地位高盐环境和其独特的方形形态(7]。h . walsbyi是一种专性喜盐生物,有许多适应出现链接的能力在高盐浓度的环境中成长。由于其平面细胞结构,h . walsbyi最高表面area-to-volume (s / v)任何微生物的比例。单个细胞可以测量2μm×2μ米×0.2μm,但张细胞已被证明在尺度- 40μ米2(8]。的巨大规模h . walsbyi表是可能的s / v比只依赖于细胞的厚度。这么高的s / v比直接与膜过程在细胞发展的重要性(9]。h . walsbyi有大量套细胞运输蛋白质基本保持其主要异养生活方式(10]。然而,它也能够利用细菌视紫红质支持光养增长(11]。这个过程是由细菌视紫红质蛋白的存在增强细胞的两面,入射光可以通过细细胞细胞质(10]。h . walsbyi是不动的,但利用气体囊泡内定位可能最大化两个发光的水柱10)和可用的氧气,氧气的溶解度高盐环境较低(12通过异养过程)和除氧导致有限的氧气渗透在浅层咸水环境系统。h . walsbyi类Halobacteriaceae中是独一无二的,它有一个大幅降低基因G + C百分比(% G + C)内容(13- - - - - -15]。提出了两个假设来解释这个大幅偏离其他嗜盐古生菌。首先,低% G + C被认为是普遍的海洋oligotrophs作为一个可能的机制来减少氮的要求(16]。更有可能低% G + C有助于减少DNA稳定overstabilization造成的高内部毫克2 +浓度,以类似的方式如何嗜热菌增加% G + C增加DNA稳定在高温环境下(17]。有趣的是,16 s rRNA基因研究已经表明h . walsbyi散度有限(≤2%)16 s rRNA基因(4)在全球范围内相对于其他组内Halobacteriaceae(~ 7%),表明h . walsbyi可能更进化的限制。
到目前为止,最广泛的基因组的比较h . walsbyi集中在两个分离菌株培养从盐田在西班牙(str DSM16790) (9)和澳大利亚(str C23) (18)已经完全测序(10,19]。一些以前的宏基因组工作执行使用fosmid从西班牙盐场克隆库探索结束h . walsbyi多样性的系统和显示系统中潜在的多样性,包括小说Haloquadratum有关的克隆和基因组四岛的识别(13,20.]。全面DSM16790和C23基因组的比较分析揭示了缺乏基因重组的基因组之间的变异发生的结果和大规模基因插入/删除或小的区域(19]。有限的这两个基因组的基因变异和低16 s rRNA基因分歧导致了提出的假设h . walsbyi是全球同质基因内容和高度分散或在严格的进化约束,导致有限的生物地理学(19]。扩大的比较分析Haloquadratum从fosmid-based基因组基因组超越以前的结果确定13,20.)将允许更好地理解保守基因属性属内。
以前的结果从Tyrrell湖,维多利亚,澳大利亚,一种天然thalassohaline咸水湖泊,被用来重建几个基因组无教养的(21和小说嗜盐古生菌菌株14,22)和病毒(23,24]。以前的工作在嗜盐古生菌在该系统进行宏基因组样本收集在2007年和2008年使用读桑格-和454年衍生序列。几个草案和使用读桑格生成复合基因组数据集从2007年湖Tyrrell metagenome,导致两个额外的h . walsbyi基因组(J07HQW1和J07HQW2),以及第一个基因组物种属的一个独立的候选人Haloquadratum(J07HQX50) [14]。在这项研究中,我们使用宏基因组样本收集在2010年使用短内容Illumina公司paired-end探索基因组序列的多样性最丰富的嗜盐古生菌的系统,Haloquadratum walsbyi。我们使用Haloquadratum有关的程序集的2010湖Tyrrell metagenome专门评估h . walsbyi非均质性。比较分析的五个Haloquadratum基因和环境组件显示的新见解的基因组景观丰富的嗜盐古生菌。
2。材料和方法
2.1。样本收集和Metagenome测序
样本收集2010年1月使用一个串行过滤方法(南国的夏天)蒸发盐水湖采样中,为期四天的时间序列实验Tyrrell在西方维多利亚,澳大利亚(35.52°S、142、80°W)。据报道在海德堡et al。25),盐浓度一般> 300 g L−1和样本收集从浅(< 20厘米深度)池分开湖由盐的主要障碍。所述Narasingarao et al。21)和就达et al。14),水通过20个样本预滤器μ3.0 m Nytex屏幕然后连续过滤,0.8和0.1μm polyethersulfone过滤器(美国纽约笼罩公司)。0.1提取DNAμ0.8米,μ3.0米,μm过滤器,所述海德堡et al。25]。测序了j·克雷格·文特尔研究所(同时,罗克维尔市,医学博士,美国)使用成对的2100个基点Illumina公司测序平台100 bp插入大小。
2.2。组装、装箱和注释
样本使用一个迭代过程的装配使用IDBA-UD组装(诉1.1.0)[26通过分级tetranucleotide序列聚类),装箱,和序列招聘使用BWA对准器(诉0.6.1-r104) [27)和Ref_Select函数程序的套房,海星(诉0.4.17)[28]。对于所有组件,IDBA-UD使用默认设置,预校正设置(- -pre_correction)打开。所有阅读招聘步骤,正向和反向FASTQ文件读取对齐到连续的DNA序列(叠连群)使用的BWA对准器aln程序生成校准和samse山姆生成相应的文件,允许的最大数量差异两个过程四(4 - n)。然后生成FASTA文件内使用ref_select命令海星。
第一轮的大会,从每个样品基因组数据过滤器是独立组装产生重叠群。他们用叠连群长度大于5000 bp使用层次聚类tetranucleotide序列使用皮尔逊相关性作为截止值为0.80。假定的编码DNA序列(CDSs)的所有集群重叠群总跨度大于10000 bp确定使用这个程序FragGeneScan (v . 1.16) (29日]。翻译比较公认的信用违约互换使用爆炸对数据库的蛋白质序列16从家庭Halobacteriaceae生物,从类Nanohaloarchaea(见补充表两种生物S1网上http://dx.doi.org/10.1155/2014/875784)。的所有箱子叠连群> 60%的翻译假定的cd被分配到属Haloquadratum被保留,用于使用盛世达招募相应的序列读取。
参加第二轮组装,多个过滤器从相同的样本被组装在一起。叠连群大于5000 bp的长度被聚集,如上所述。基于集群的评价,是确定阈值较低的皮尔森相关(0.50)将充分捕捉重叠群相似。确定了13箱总跨度叠连群> 1 Mb(最大本= 6.4 Mb)。的序列读取每个过滤器被招募的重叠群在每个垃圾桶标识(例如,示例LT71分为三个箱子包含大于1 Mb的序列。0.1的序列μm和0.8μm过滤器被招募的重叠群每一本单独生成新的FASTA文件)。
最后一轮的组装、序列从每本和相应的过滤器组装(例如,从0.1序列μm过滤器的示例3 FASTA LT71将文件代表了垃圾箱中确定第二轮组装)。进行进一步的分析新创程序集,只有叠连群> 50000 bp的长度被认为是。公认的信用违约掉期测定使用拉斯特注释服务器(30.应用以下设置:基因调用者=拉斯特;release64;自动修复错误=是的;回填差距= yes。
2.3。招聘统计
当前可用的五的基因组序列Haloquadratum物种从IMG下载数据库(Haloquadratum walsbyiC23、DSM16790 J07HQW1 J07HQW2,Haloquadratumsp。J07HQX50) [31日]。J07HQW1的基因组,J07HQW2 J07HQX50重建从环境样品收集在2007年从Tyrrell湖。J07HQW1和J07HQW2基因组高覆盖率和读Sanger测序(9.0倍和8.7倍,分别地。)和有限的差距沿着一个封闭的脚手架(缺口预测基因总数的0.2%和0.5%,分别地),所有的空白都是短的长度(~ 50 - 100 bp)比由原生质(8 - 10 kbp)和张成fosmids (35 kbp)用于生成顺序读取。所有基因都被叠连群结合使用后生成第二轮组装招募,使用盛世达,公认的最大数量Haloquadratum相关序列的所有样品和过滤器。该池的冗余序列包括那些招募从整个湖Tyrrell metagenome IMG基因组和汇集从每个过滤器的顺序读取每个样本对第二轮后的套叠连群派生组装。招募序列处理去除重复序列,然后使用独特的相同的序列。seq命令mothur套件的生物信息学工具(32]。序列被加工去除序列已成为未配对的过程中。其余的序列是一致的反对Haloquadratum基因组,包括染色体外的DNA。比对进行使用Geneious(诉6.1.6)使用“参考地图”程序应用以下设置:中低灵敏度/快;重复5次;不修剪。
的三个样本有不同的过滤器分数大小(LT71、LT80 LT85)是一致的Haloquadratum基因组之前来自湖Tyrrell (J07HQW1、J07HQW2 J07HQX50)来估计每个生物体在不同滤波器的相对丰度分数。比对的基因组进行如上所示。
2.4。全基因组比对和基因组同线型
叠连群长度大于50000个基点后生成第三轮总成是一致使用进步的淡紫色J07HQW1基因组基因调整器(33]。叠连群被手动分配为四个类别中的一个基于同线性度与参考基因组:高,中,低,没有同线型。叠连群被分配到高类别的同线性如果结果一致表明,整个叠连群包含colinearized地区相比J07HQW1或大约70 - 90%的叠连群colinearized地区,但这些地区比J07HQW1重新安排。叠连群被分配到媒介类别如果大约30 - 70%的叠连群colinearized地区。不到30%的低类别包含序列重叠群拥有colinearized地区。这些类别没有对齐参考基因组。重叠群在没有进一步同线性分类一致Haloquadratum基因组来确定这些序列代表的地区中包含的其他生物而不是J07HQW1基因组。
J07HQW1基因组的大部分地区,许多环境重叠群一致确认进行进一步分析。重叠群和相应的段J07HQW1基因组的使用进步的淡紫色基因组对准器保持一致Haloquadratum walsbyi基因组(C23 DSM16790, J07HQW2)和手动检查插入,删除和重组。假定的基因插入和删除所有内容确定。
2.5。感兴趣的基因:Halomucins和ABC-Type转运蛋白
Halomucins注释之前的Haloquadratum walsbyiC23 DSM16790基因组。这些序列被用来识别以前类似的序列组装基因组Tyrrell湖和生成的环境重叠群的研究。公认的信用违约互换的方式进行使用CLUSTALW [34应用以下设置:成本矩阵=大学;开放的成本差距= 15;差距扩大成本= 6.66。使用公认的信号肽SignalP (v . 4.1)与被切断在0.45和0.51之间(35]。
一个数据库是由所有的假定的蛋白质序列相关ABC-type转运蛋白,包括所有子单元的转运蛋白(即。、腺苷三磷酸酶、substrate-binding和透性酶),从之前的所有注释Haloquadratum基因组。每一个Haloquadratum基因组然后比较使用爆炸[36]这个数据库的一个子集,不包括蛋白质中特定的基因组。ABC-type转运蛋白被发现从环境相比,注释和总数据库使用爆炸。爆炸结果解析ABC-type转运子单元,没有重大爆炸匹配到数据库或AAID不到80%。假定的基质和功能可用的子单元来自注释而不是独立消息来源的证实。
3所示。结果与讨论
3.1。样本收集和Metagenome测序
通过过滤地表水从五个时间点取样的从2010年1月Tyrrell湖4天。基于图书馆建设和测序成功,8个样本选择包含在这项研究中,包括三个时间点的两个小(0.1μ米)和大(0.8或3.0μ米)筛选得到了分数。最后metagenome由135239438削减,高质量,paired-end序列包含数据(表12.7英镑1)。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
总溶解固体,重量百分数。 临时(°C)的数据,TDS, pH值最初发表在爱默生et al . 201223]。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.2。装配和装箱
迭代式的组装和装箱过程被用来减少复杂性和丰富Haloquadratum在合并后的数据序列。第一轮的组装生成5403叠连群长度大于5000个基点,为856箱使用层次聚类生成tetranucleotide频率。这856箱,424人公认的Haloquadratum基于比较的数据库类起源Halobacteriaceae和类Nanohaloarchaea,包含2096重叠群。顺序读取被招募到叠连群推定地相关Haloquadratum。第二轮组装导致生成的重叠群1965 > 5000个基点的长度。这些叠连群受到tetranucleotide层次聚类,如上所述;然而,目视检查集群的关系表明,皮尔森相关的截止0.50将更具包容性的组装结果(即。,产生更大的箱子),同时将数据集划分为不同的基因组单位(补充图S1)。总共13个箱子包含在组件1 Mbp,最大的本包含6.4 Mbp的序列数据。
最后一轮大会,每个过滤器的顺序读取一部分是招募对重叠群在每一本从单个样本(即组合而成。,样本LT71 2过滤器分数和3箱;每个过滤器是对每个本招募,这样6总组件进行)(补充表S2)。这一轮大会的结果表明,组装统计数据,包括将军,指的是长度,总长度,增加的值。只有最大长度统计有一个相对较小的下降,但这种下降是将军和平均长度的增加所抵消(表2;补充表S2)。第三轮组装生产了195叠连群在长度大于50000个基点,这是用于进一步分析。注释的叠连群确认27801公认的信用违约互换(额外的结果见补充信息)。
|
||||||||||||||||||||||||||||||||
3.3。招聘参考基因组
几个2010年湖Tyrrell metagenome样品有多个排序滤波器分数(LT71、LT80 LT85),其中包括一个小过滤部分(0.1μ0.8米)和一个μm过滤器(LT71)或3.0μ过滤器(LT80和LT82)。招聘2010年宏基因组序列对基因组组装2007湖Tyrrell metagenome揭示了基因组招募13 - 30%的总图书馆3.0μm过滤器,而< 7%的图书馆0.1μm过滤器。这些结果表明,多数Haloquadratum人口在湖里Tyrrell系统存在总量大于3.0μ米在规模和扩大在16 s rDNA分析结果确定的西班牙盐场DSM16790是孤立的13(附加结果见补充信息)。
比较分析两种h . walsbyi基因组从最初从盐田分离培养代表西班牙和澳大利亚SE的建议h . walsbyi作为一个物种,主要在基因组内容统一在传播范围意味着缺乏对这些生物的生物地理学(19]。异质性在西班牙盐场之前已经被观察到在一个end-sequenced fosmid metagenome [13]。完整的fosmids揭示基因组测序群岛(GIs)沿着DSM16790基因组和确定的~ 50%完全测序fosmids nonsyntenic (20.]。然而,可用的数量h . walsbyi基因组和有限的深度测序fosmid metagenome分析。Tyrrell基因组来自湖环境序列从湖的一部分用于商业盐生产、盐场结晶器类似池塘,而以前的基因组Haloquadratum获得使用实验室分离[10,19]。Tyrrell基因组和湖h . walsbyiC23都是来自澳大利亚的高盐度环境隔开~ 330公里允许进一步测试的制服自然基因组的内容。对招聘的环境序列Haloquadratum基因组,包括DSM16790 C23,被用来确定相关Tyrrell湖环境完成基因组序列。
的一个子集是招募128992632冗余序列Haloquadratum基因组和第二轮后生成的重叠群装配。冗余序列被通过一个两步过程:切除(1)相同的副本被招募到多个参考基因组序列和(2)序列是相同的。未配对序列被删除,导致20477772 nonredundant,配对,和独特的序列。
这些序列对齐的结果表明,最完全由环境覆盖基因组序列是J07HQW1基因组覆盖率(99.96%)紧随其后J07HQW2基因组覆盖率(99.7%)(表3)。J07HQW1的覆盖率和J07HQW2高于C23的覆盖率(92.3%的覆盖率)和DSM16790(93.3%的覆盖率)基因组和大大高于J07HQX50基因组(平均= 84.0%的覆盖率)。预计的低覆盖率J07HQX50基因组,作为先前的结果表明,J07HQX50代表一个较小的比例Haloquadratum2007年人口(6.9%相比74.1%),因此nonredundant序列将包含J07HQX50-like大大降低导致低覆盖率的基因组序列。平均深度的报道h . walsbyi大于222倍基因组覆盖率(= 0 - 6090 x覆盖范围)。C23和DSM16790基因组相似值意味着覆盖J07HQW1和J07HQW2但没有相同的百分比覆盖率,这表明有一个基因组这些内容之间的区别Haloquadratum物种。PL6B质粒的报道表明,它可能出现在32 - 40%以上Haloquadratum人口(见补充信息)。J07HQW1和J07HQW2都不是完全一致在各自的基因组的100%,可能表明也有一些基因变异的形式插入或删除,发生在大约三年前基因组样本,尽管有潜在的随机变化鸟枪测序方法。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.4。全基因组比对
探索基因组在多大程度上内容和重组的校准结果的影响h . walsbyi基因组,全基因组比对进行基因组和环境重叠群装配第三轮后生成的。195年叠连群> 50000个基点的长度对齐J07HQW1基因组。高和中同线性的叠连群类别,82 53,分别成功比对参考基因组的多。为32叠连群分配给无同线性类别,它是确定所有的重叠群可以分配相关J07HQW2或J07HQX50基于比对各自的基因组。虽然有些重叠群包含段小说拥有基因内容(数据未显示),多数叠连群,所有类别的,可以认定为在基因组结构类似于这三个湖Tyrrell之一Haloquadratum基因组。
地区选择强调大规模基因组基因重组和异构的内容。从最初的平面图,J07HQW1基因组的长度,沿着J07HQW1基因组14个地区被确定符合进一步检查的标准;该地区必须在长度和至少60000个基点有多个环境叠连群跨越感兴趣的地区。122年叠连群从感兴趣的这些区域被确定。对于每一个感兴趣的区域,相应的环境重叠群和h . walsbyi基因组排列在一起。这些数据显示,许多特性C23与DSM16790前所未有的,包括大型基因重组和基因插入和删除。三个这样的变量区域下面详细介绍(附加信息为每个地区补充信息)。
3.4.1。沿着J07HQW1地区跨越600000 - 770000个基点
这个地区跨越~ 170 kbp J07HQW1基因组,但相应的地区h . walsbyi基因组规模更小的一个大16插入/删除信用违约掉期常见J07HQW1 C23,加上附加沿着J07HQW1基因组(图33插入1)。许多似乎沿着J07HQW1 33插入基因组非编码,虽然有几个带注释的转座酶或transposase-like信用违约掉期,以及注释与公认的信用违约掉期的细胞功能。16 cd段J07HQW1 C23注释得很糟糕但包含几个同系物ftsZ/ GTPase域包含信用违约互换,一个成功的细胞分裂所需基因家族,特别是在子细胞的形成。
有五个环境叠连群,似乎更接近J07HQW2基因组由于缺少16 cd段,上面所描述的那样,和的存在~ 50 kbp反演在同一基因组景观插入段C23和J07HQW1附近。环境的完整叠连群syntenic J07HQW2基因组。有趣的是,DSM16790缺乏16 cd段和反演J07HQW2和环境叠连群,表明至少有三个潜在方向的。这段时期,和插入/删除不需要序列反演。这个结果很有趣,因为大量的结果表明,J07HQW1和J07HQW2环境中关于平等的丰度。然而,对于该地区所有六个环境重叠群(从四个不同的样品)拥有J07HQW2取向。而完全难以理解,这个结果可能是由于不完整的宏基因组抽样,这可能改变的证据在湖的显性基因结构基因组区域Tyrrell J07HQW2取向。
3.4.2。沿着J07HQW1地区跨越1600000 - 1660000个基点
这个地区J07HQW1和J07HQW2之间共享,但分歧两部分C23 DSM16790基因组隔开~ 200 kbp(大概位置:1240 - 1270 kbp和1470 - 1530 kbp),尽管这四个基因有类似的基因(图的内容2)。~ 200 kbp地区出现在C23和DSM16790曾被认定为一个基因组岛(20.]。基因变异之间的内容h . walsbyi基因组包含了许多公认的信用违约掉期的预测功能。
四个环境重叠群有高度的相似性J07HQW1 J07HQW2,但基因的内容表明,该地区占主导地位的基因组J07HQW1的架构。最长的环境重叠群(ID: LT71_0.8_B_scaffold_0)额外~ 40 kbp段末端的序列相比其他重叠群。这段是一个大相对于J07HQW1重排,syntenic一段基因组的近似位置,2232 - 2284 kbp。一个~ 55 kbp环境重叠群(ID: LT80_0.1_B_scaffold_30)已经完全同线性J07HQW2基因组(近似位置3283 - 3336 kbp)。与上述地区,这些重叠群支持先前的研究表明J07HQW1基因组结构是多基因同线性湖里Tyrrell系统,尽管J07HQW2代表一个不同的同线性。尽管相似之处,最大的环境叠连群仍然代表了一个大规模的J07HQW1基因组重排,可能表明基因组景观进行重排。
3.4.3。沿着J07HQW1地区跨越2619000 - 2702000个基点
这一地区的利益,所有四个整体基因组结构是守恒的h . walsbyi基因组(图3)。有几个基因indels,包括J07HQW1的一个定义特征、C23, DSM16790 J07HQW2相比,在一个假设的蛋白质(J07HQW1_02778)的形式。C23 13 cds的插入,包括一个带注释的基因,如ISH11-type转座酶(Hqrw_3137),一个ABC-type运输操纵子(atp酶、substrate-binding和膜透性酶亚基)没有一个带注释的目标底物(hqrw_3141 - 3145),和两个同系物的重庆农商行蛋白质(Hqrw_3147和3148年),与樟脑阻力和染色体缩合。
环境重叠群分为J07HQW1有关(3叠连群)和相关J07HQW2(4叠连群)基于上述假设的蛋白质的存在/没有。最长的四个叠连群(ID: LT75_0.8_A_scaffold_6) (~ 160 kbp)是完全syntenic J07HQW2基因组(1240 - 1400年kbp)。~ 86 kbp叠连群(ID: LT71_0.1_A_scaffold_2)包含高度比J07HQW1基因组重排沿着~ 40 kbp重叠群的跨度。这个跨度syntenic J07HQW1基因组的七个不同的领域,有一些同线型Haloquadratum基因组的所有其他比对的序列之间存在巨大差异。与两个以前讨论的区域不同,分离J07HQW1——J07HQW2-like叠连群接近这两个物种的丰度预测环境,尽管LT71_0.1_A_scaffold_2有独特的基因组结构,以前没有看到的,代表了小说的取向h . walsbyi基因组。
的新创环境叠连群上述地区压倒性可以分配给三个之一Haloquadratum参考基因组产生的2007湖Tyrrell metagenome。有趣的是,尽管有证据表明J07HQW1和J07HQW2代表的比例相等Haloquadratum人口,两三个区域的重叠群一致表明这两个之一h . walsbyi占主导地位的基因组景观在环境的压力。的新创叠连群不准确地代表丰富的环境,提供了一个估计存在/缺少每个地区之间的环境压力。虽然随机过程可能影响的集合新创叠连群对齐参考基因组,类似重叠群的繁殖有相同基因来自多个样品的同线性和过滤器显示结果可能代表一个精确的快照的基因组景观Haloquadratum社区和展示重组事件席卷多数h . walsbyi个人。此外,大部分的观察基因组之间的可变性h . walsbyi菌株;只有少数的新创叠连群演示基因组变异和重组,这表明大部分的h . walsbyi个人在社区内代表稳定的基因同线性J07HQW1以来持续了三年时间,J07HQW2取样。
3.5。感兴趣的基因
3.5.1。Halomucins
C23和DSM16790基因组,几个大的蛋白质编码序列(> 7000个氨基酸)被确定为粘蛋白同系物,一个家庭的高分子量蛋白质,防止干燥,并给出了术语halomucin (hmu)。提出了这些蛋白质有作用,保护细胞免受干燥和/或创建一个本地化环境与水分活度高于周围环境(10,19]。J07HQW1和J07HQW2基因组注释的缺乏hmu基因或假定的候选人。
一个全功能的唯一迹象hmu同族体序列生成的湖Tyrrell似乎是一个公认的环境重叠群(称为cdehmu1;环境——速记hmu;ID: LT85_0.1_A_scaffold_0)。ehmu1是最长的假定的cd注释195环境重叠群。它类似长C23注释Hmu (7243 AA和7836 AA, resp),虽然都是小于DSM16790注释HmuI (9159 AA)。Hmu的同系物DSM16790和C23份额73.8%的氨基酸身份(AAID),尽管eHmu1 DSM16790和C23 AAID 46.0%和47.9%,分别。比对DSM16790 eHmu1有几个地区和C23 AAID > 75%,表明几个领域常见的在eHmu1 Hmu蛋白存在。信号肽预测eHmu1表明这个假定的cd进行跨膜易位。总的来说,这些证据表明eHmu1的相同器官hmu基因。
第二个和第三个最长的公认的信用违约掉期有相同的注释(“大exoprotein参与血红素利用率或粘连”),是彼此相邻的重叠群与eHmu1相同的样本,但从一个不同的过滤器分数(ID: LT85_3.0_A_scaffold_9)和集体类似eHmu1的长度(3701 AA AA AA + 3527 = 7218)。其中一个假定的cd可以对齐的糖基eHmu1 AAID 99.5% (eHmu2)和其他的n端eHmu1 AAID 94.6% (eHmu3)。eHmu2缺乏一个可检测的信号肽序列,而eHmu3拥有一个n端信号肽,表明它可能是跨膜转移。考试的对齐eHmu2和eHmu3 eHmu1揭示两个删除相对于eHmu1的结构,有28 bp删除造成移码/停止密码子(图4(一))。对许多细菌和古生菌,一个终止密码子在一个假定的cd通常会导致非功能性产品。eHmu2的本质,eHmu3涉及这些公认的信用违约掉期代表部分退化环境Hmu同系物。
(一)
(b)
另一个证据退化hmu同族体发生在J07HQX50基因组。最长的假定的cd 2413 AA基因组注释为“autotransporter adhesin。“这个假定的cd的蛋白质序列有99.7% AAID eHmu1糖基。序列上游的“autotransporter adhesin”包含五个公认的信用违约掉期集体长度7129 AA (2413 + 989 + 1285 + 667 + 878 + 897 AA)。其中一个信用违约掉期(“假想的蛋白质,”878 AA)包含一个n端信号肽序列。这段的核苷酸排列J07QX50基因组(214814 - 238458个基点)显示,有地区高核酸身份(NAID)ehmu1序列两个不同的部分有NAID > 98.0%,而相邻的部分为83.9%,40.8%,和38.9% NAID以及81个基点(图的差距4 (b))。数据显示这一系列假定的cds代表一个高度退化hmu例如序列。三hmu同源染色体检测数据集,两个似乎退化不再功能。eHmu1似乎是完成了hmu同族体所需的必要的信号肽跨膜易位和可能发挥作用通过增加细胞附近的水活性在高盐、低水分活度环境。缺乏证据hmu同族体在J07HQW1 eHmu2 J07HQW2基因组和退化的本质,eHmu3,假定的cds J07HQX50基因组显示功能hmu基因并不是一个普遍适应的属(19),表明其他因素可能推动成功的适应Haloquadratum在高盐环境中。然而,它是可能的,由于质粒在haloarchaeal社区中,扮演的角色halomucins存在染色体外遗传因素,但目前只有证据支持halomucins基因组染色体的一个特征。
3.5.2。ABC-Type运输系统
一个特别感兴趣的领域在微生物生态学/微生物菌株如何成功占据相同的物理环境没有进化压力驱动一个灭绝事件。证据表明J07HQW1和J07HQW2坚持不同的菌株和J07HQX50作为一个不同的物种,在至少三年,这样很可能每个占据非竞争性的生态位。在研究这些生态位分化是特别注意与注释相关的假定的信用违约掉期,磷酸腺苷盒式转运蛋白(ABC)类型,一个系统的主动运输需要使用跨细胞膜ATP移动基板。这些运输蛋白质是专门为这一研究目标,因为他们代表的基质生物消耗能量来跨越膜。运输蛋白质的活动可以管理可用的利基市场,每个物种可能占领。此外,转运蛋白变异可以适应与病毒性捕食的一种形式,防止附件细胞膜的病毒颗粒。
为每个单独的基因组注释ABC-type运输车和假定的cds注释从环保叠连群比较基因组数据库的转运蛋白。目标是确定ABC-type转运体组件(1)没有一个在其他生物直接同源或(2)有一定程度的散度相对于其他基因组。AAID截止80%被用来确定运输车序列发散的礼物Haloquadratum物种。这个分歧是substrate-binding尤其相关,通透酶转运蛋白的亚基,为蛋白质结构的变化可能会影响底物的特异性和效率运输。atp酶亚基的变化可能会影响有限,作为转运体功能方面必须保持一致的功能。
的Haloquadratum基因组曾在138年和159年之间注释ABC-type传输单元。一般来说,比较基因组只显示几个蛋白质序列,跌破80% AAID阈值。C23和DSM16790转运体组件的平均相似度阈值以上AAID ~ 98 - 99%。湖Tyrrell基因组,组件的平均相似度高于阈值是AAID ~ 89 - 93%。预计这些值作为J07HQW2 (91% AAID)和J07HQX50 AAID(89%)更发散有机体中Haloquadratum进化枝J07HQW1相比,C23, DSM16790。转运子单元的高平均相似度高于80%的AAID阈值表明潜在变量的多样性低于阈值代表单元传输特性。
没有一个h . walsbyi菌株含有独特ABC-type运输车组件。然而,每个基因有一组不同的变体运输组件表明物种之间的区别/株(补充表S3)。结果C23透露150年10 ABC-type转运子单元AAID阈值低于80%。的10个,有两个铜(铜)通透酶(Hqrw_4112和Hqrw_1178)和锌(锌)(Hqrw_2414)和尿素/短链酰胺substrate-binding (Hqrw_4030)子单元。除此之外,有一个完整的operonic ABC-type运输车没有分配函数(hqrw_3142 - 3145)。相比之下,DSM16790有八个不同的亚基(146带注释的子单元);五个来自一个完整的操纵子与支链氨基酸(HQ2192A-HQ2197A)。J07HQW2还子单元与支链氨基酸运输,但不包括完整的操纵子,只有透性酶(J07HQW2_03665和03668)和atp酶(J07HQW2_03669和03670年)。其他三个变体子单元从DSM16790脂蛋白相关运输(两个通透酶和atp酶)(hq3476a - 3478 a),表明,与C23不同,似乎只变种转运蛋白与金属离子和酰胺运输、DSM16790可能变种特异性脂蛋白运输的效率。
J07HQW1了11个变种运输车141带注释的子单元的子单元。五11的atp酶,两个是标注为“假想蛋白”(J07HQW1_00367和00669年),和其余四是两个抗菌肽(J07HQW1_00014和00042年),一个核苷(J07HQW1_01905),和一个铁3 +-hydroxamate J07HQW1_00956透性酶。的铁3 +-hydroxamate通透酶对铁和钴胺素结合位点,这两者都是有竞争力的在湖里回收Tyrrell系统。抗菌肽通透酶可以象征J07HQW1之间的相互影响和系统中其他生物。
J07HQW2最大的变体输送单元套房了h . walsbyi物种29 159单元确定变异,13的注解为atp酶(补充表S3)。硝酸J07HQW2变体通透酶和substrate-binding单元/磺酸盐/碳酸氢盐,亚精胺/腐胺,di - /寡肽/ Ni,磷酸/膦酸酯,支链氨基酸,和磷酸盐(辐透家庭转运蛋白)。预计这些运输单元的自然异养Haloquadratum。这些转运蛋白存在于另一个h . walsbyi基因组,但变异substrate-binding和J07HQW2通透酶亚基可能显示不同来源/这些转运蛋白底物的特异性。
类似于J07HQW2, J07HQX50有整套的转运蛋白变体和现在类似的注释Haloquadratum基因组,但是这些差异可能暗示属之间的生态位分化(补充表S3)。J07HQX50有138注释ABC-type运输车的子单元。三个子单元被认定为没有直接同源的基因组。一个注释(J07HQXv2_01450)没有其他序列的相似性基因库nonredundant数据库和< 150 bp的长度。其他两个注释的子单元Haloquadratum直接同源包括亚精胺、腐胺substrate-binding蛋白质(J07HQXv2_01469)和甜菜碱/ choline-binding脂蛋白通透酶(J07HQXv2_02756)。J07HQX50有86个变种转运子单元的许多预测基质已观察到另一个基因组的变异,包括亚精胺、腐胺、磷酸(辐透和PstA家庭转运蛋白),di - /寡肽、铁3 +、维生素b12、酰胺、钴和支链氨基酸。有趣的是,30变体输送单元的注解为糖、碳水化合物和/或单糖单元。各种sugar-related J07HQX50转运蛋白可能表明这种生物的生态位系统中,利用特定子集的单糖,允许它继续存在于系统以及更多的优势种。
环境重叠群有734 ABC-type转运子单元可识别的基于拉斯特注释。这个数字包括一定程度的冗余,因为有许多重叠群内收集的数据集可能代表相同的生物,但在一个不同的过滤器分数或在一个不同的样本。任何个人转运蛋白亚基的具体数字不视为丰富或重要性的证据。因此,确定了五个单元的环境没有直接同源的重叠群Haloquadratum基因组。这些单元包括两个未赋值的atp酶、尿素和硝酸substrate-binding蛋白质,和一个非功能性寡肽转运蛋白的片段。环境叠连群含有96变种运输车子单元(补充表S3)。与J07HQW2和J07HQX50,许多预测这些单元的基板与异养这些生物的性质有关。一群变种转运子单元并不确定Haloquadratum基因组是预测利用glycerol-3-phosphate和二羟丙酮(DHA)作为底物。它已经表明,DSM16790有遗传潜力DHA和glycerol-3-phosphate转换成二羟丙酮磷酸(DHAP) [10]。DHAP已被证明是一个重要的中间在磷酸盐和碳代谢DSM16790因为它可以用作糖质新生衬底或糖酵解或通过glycerol-1-phosphate转换成一个关键组件的热点膜脂质(37]。变体的存在对这些运输单位内环境重叠群和分析Haloquadratum基因组表明替代形式的这些亚基可能会导致湖水Tyrrell利基维护系统。
4所示。结束语
详细的基因组比较我们的环境metagenome和公开可用Haloquadratum基因组显示一些新方面的这些生物如何在高盐环境中茁壮成长。具体来说,本研究表明,先前的假设有关的同质性h . walsbyi进行基因同线性时不支持比较更多的物种和属的代表。我们发现两个小规模(即在基因插入/删除内容。,single genes, e.g., transport proteins and hydrolases) and large-scale rearrangements and variation in genomic content. Further, previous results suggesting that halomucins play a crucial role in the adaptation ofHaloquadratum高盐环境从湖Tyrrell不支持的结果。虽然有些小湖Tyrrell的一部分Haloquadratum人口有一个完整的halomucin同族体,有证据表明这个基因在环境和J07HQX50负选择压力下。因此,halomucins可能不代表唯一的机制Haloquadratum种虫害维持细胞内稳态,但套件的一部分潜在的机制,允许在高盐环境中成长。最后,分析ABC-type运输车已了解每个成员的属Haloquadratum可能保持利基分化在相同的物理环境中,包括金属代数余子式的转运蛋白的变化(如铁、铜、镍、和公司),为/磷酸盐,酰胺(例如,亚精胺和腐胺),和碳水化合物(例如,单糖)。
利益冲突
作者宣称没有利益冲突有关的出版。
确认
提供的资助,这是美国国家科学基金会(NSF) MCB奖。0626526 j·班菲尔德,e·艾伦和k .海德堡。Cheetham盐工作(海湖,维克,来自)提供允许收集样本。援助与田野调查所提供的e·斯科特,n . Eisenkolb L.R.科莫里就,海德堡和j。特别感谢将a阮提供自动化构建初始基因映射中使用的数据1- - - - - -4。
补充材料
补充材料:提供水平的提高分析和讨论关于“装配和装箱”,招聘metagenome上h . walsbyi基因和质粒从不同的过滤器分数,和整个基因组对齐段的手稿,包括一个额外的第四区域沿着J07HQW1对齐跨越3033000 - 3387000个基点。
补充数据:说明的原始结果tetranucleotide装箱协议和提供更多的细节为整个基因组片段。补充表包括有关细节Halobacteriaceae基因组用于构造本地数据库,通过各种轮组装,组装效率的基因识别为变体ABC-transporter子单元,和湖的招聘Tyrrell百分比h . walsbyi从不同的过滤器的分数metagenome基因组。
引用
- 铃木Bodaker,沙龙,m . t . et al .,“社区比较基因组学在死海:越来越极端的环境中,“ISME杂志,4卷,不。3、399 - 407年,2010页。视图:出版商的网站|谷歌学术搜索
- Boujelben, m . Gomariz m . Martinez-Garcia et al .,“空间和季节性原核的社区动态池塘斯法克斯盐度的增加太阳能盐田在突尼斯,”安东尼·范·列文虎克,卷101,不。4、845 - 857年,2012页。视图:出版商的网站|谷歌学术搜索
- c . Demergasso l . Escudero e . o . Casamayor g . Chong诉Balague和c . Pedros-Alio“新奇和细菌多样性的时空异质性高湖Tebenquiche (Salar de阿塔卡马),“极端微生物,12卷,不。4、491 - 504年,2008页。视图:出版商的网站|谷歌学术搜索
- d .哦,k·波特,b·拉斯·d·伯恩斯,和m . Dyall-Smith”Haloquadratum的多样性和其他haloarchaea三,相距遥远,澳大利亚盐场结晶器池塘、”极端微生物,14卷,不。2、161 - 169年,2010页。视图:出版商的网站|谷歌学术搜索
- 答:奥伦,”生活在高盐浓度,”的原核生物e·罗森博格,e . f .德龙,洛里,e . Stackebrandt f·汤普森,Eds。施普林格,页421 - 440年,柏林,德国,2013年。视图:谷歌学术搜索
- A.-Ş。安德烈·h·l·Banciu, a·奥伦”生活用盐:代谢和古生菌的系统发育多样性存在于盐水生态系统,”《微生物学字母,卷330,不。1、1 - 9,2012页。视图:出版商的网站|谷歌学术搜索
- A . e . Walsby“方形细菌”,自然,卷283,不。5742年,第71 - 69页,1980年。视图:出版商的网站|谷歌学术搜索
- h . Bolhuis“Walsby广场archaeon”适应生活在高盐浓度古生菌,细菌和真核生物:Gunde-Cimerman, a·奥伦,a . Plemenitas Eds。,第199 - 185页,2005年。视图:谷歌学术搜索
- h . Bolhuis e . m . Te Poele, f . Rodriguez-Valera”archaeon Walsby隔离和栽培的广场”,环境微生物学》第六卷,没有。12日,第1291 - 1287页,2004年。视图:出版商的网站|谷歌学术搜索
- h . Bolhuis p . Palm a Wende et al .,“广场archaeon的基因组Haloquadratum walsbyi:生活在水的限制活动,”BMC基因组学第169条,卷。7日,2006年。视图:出版商的网站|谷歌学术搜索
- 欧贝贾,e . n . Spudich j·l·Spudich m·勒克莱尔和e . f .德龙”变形菌视紫质光养在海洋,”自然,卷411,不。6839年,第789 - 786页,2001年。视图:出版商的网站|谷歌学术搜索
- j·e·舍伍德f . Stagnitti m . j . Kokkinn和w·d·威廉姆斯,“在咸水水域溶解氧浓度,”湖沼学和海洋学,36卷,不。2、235 - 250年,1991页。视图:出版商的网站|谷歌学术搜索
- b . a . Legault a . Lopez-Lopez j . c . Alba-Casado et al .,“环境基因组学”Haloquadratum walsbyi“在盐场结晶器表明大量的附属基因在一个连贯的物种,”BMC基因组学第171条,卷。7日,2006年。视图:出版商的网站|谷歌学术搜索
- 美国就达p . Narasingarao j·a·尤加尔德这样j·f·班菲尔德k . b .海德堡和e·e·艾伦,”Assembly-driven社区咸水环境微生物生态系统的基因组学”,《公共科学图书馆•综合》,8卷,不。4篇文章ID e61692 2013。视图:出版商的网站|谷歌学术搜索
- a . h . Treusch a . Kletzin g . Raddatz et al .,”表征large-insert环境基因组DNA库从土壤古菌的研究,“环境微生物学》第六卷,没有。9日,第980 - 970页,2004年。视图:出版商的网站|谷歌学术搜索
- s . j . Giovannoni h·j·特里普,美国Givan et al .,“遗传学:在世界性的海洋细菌基因组精简,“科学,卷309,不。5738年,第1245 - 1242页,2005年。视图:出版商的网站|谷歌学术搜索
- n·f·w·桑德斯,t . Thomas p . m . g . Curmi et al .,”机制的热adaptatation透露anatarctic古生菌的基因组Methanogenium frigidum和Methanacoccoides burtonii”,基因组研究,13卷,不。7,1580 - 1588年,2003页。视图:出版商的网站|谷歌学术搜索
- d·g·伯恩斯,h . m . Camakaris·h·詹森和m . l . Dyall-Smith haloarchaeon Walsby栽培的广场,“《微生物学字母,卷238,不。2、469 - 473年,2004页。视图:出版商的网站|谷歌学术搜索
- m . l . Dyall-Smith f·菲佛,k .克利等。”Haloquadratum walsbyi:有限的多样性在全球池塘。”《公共科学图书馆•综合》》第六卷,没有。6篇文章ID e20968 2011。视图:出版商的网站|谷歌学术搜索
- s . Cuadros-Orellana a b。Martin-Cuadrado Legault et al。”,在原核生物基因组可塑性:haloarchaeon广场为例,“ISME日报,1卷,不。3、235 - 245年,2007页。视图:出版商的网站|谷歌学术搜索
- p . Narasingarao美国就达j . a . Ugalde et al .,“新创宏基因组组装揭示丰富小说古生菌高微生物群落的主要血统,”ISME杂志》第六卷,没有。1,第93 - 81页,2012。视图:出版商的网站|谷歌学术搜索
- 美国就达j·b·爱默生,c·m·琼斯et al .,“季节性波动驱动离子浓度在咸水湖泊微生物演替社区,”ISME杂志,8卷,不。5,979 - 990年,2014页。视图:出版商的网站|谷歌学术搜索
- 托马斯j·b·爱默生,公元前,k .安德雷德·e·e·艾伦,k . b .海德堡和j . f . Banfielda”动态病毒种群高系统揭示了宏基因组大会,“应用与环境微生物学,卷78,不。17日,第6320 - 6309页,2012年。视图:出版商的网站|谷歌学术搜索
- j·b·爱默生k·安德拉德,公元前托马斯et al .,“宿主和CRISPR动力学archaea-dominated湖tyrrell咸水环境的维多利亚,澳大利亚,”古生菌文章ID 370871卷,2013年,12页,2013。视图:出版商的网站|谷歌学术搜索
- k . b .海德堡w·c·纳尔逊·j·b·霍尔姆n . Eisenkolb k .安德拉德和j·b·爱默生”表征的真核微生物多样性高湖tyrrell,澳大利亚,”微生物学前沿卷,4篇文章ID第115条,2013年。视图:出版商的网站|谷歌学术搜索
- h·c·m·梁y Peng s . m .姚和f . y . l .下巴,“IDBA-UD:新创汇编单细胞和宏基因组测序数据的深度与高度不均匀的,”生物信息学,28卷,不。11日文章ID bts174, 1420 - 1428年,2012页。视图:出版商的网站|谷歌学术搜索
- h·李和r·杜宾“快速而准确的短阅读符合burrows - wheeler变换,“生物信息学,25卷,不。14日,第1760 - 1754页,2009年。视图:出版商的网站|谷歌学术搜索
- 诉艾弗森,r·m·莫里斯,c, d . Frazar c . t . Berthiaume r·l·莫拉莱斯和e . v . Armbrust”解开基因从基因组:揭示海洋euryarchaeota无教养的类,“科学,卷335,不。6068年,第590 - 587页,2012年。视图:出版商的网站|谷歌学术搜索
- m .ρ,h . Tang和y你们,”FragGeneScan:预测基因在短和容易出错的读取,”核酸的研究,38卷,不。20日,p . e191, 2010年。视图:出版商的网站|谷歌学术搜索
- r·k·阿齐兹·d·巴特尔斯a最好et al .,”拉斯特服务器:使用子系统技术快速注释,“BMC基因组学第75条,卷。9日,2008年。视图:出版商的网站|谷歌学术搜索
- v . m .马科维茨f . Korzeniewski k .印度et al .,“综合微生物基因组(IMG)系统”,核酸的研究卷,34 D344-D348, 2006页。视图:出版商的网站|谷歌学术搜索
- p·d·城堡,s l·威斯克t Ryabin et al .,”引入mothur:开源,独立于平台的,支持的软件描述和微生物群落相比,“应用与环境微生物学,卷75,不。23日,第7541 - 7537页,2009年。视图:出版商的网站|谷歌学术搜索
- a . e .亲爱的,b .茂,n . t .佩纳”Progressivemauve:多个基因与基因获得损失和重排,”《公共科学图书馆•综合》,5卷,不。6篇文章ID e11147 2010。视图:出版商的网站|谷歌学术搜索
- j·d·汤普森·d·g·希金斯,t·j·吉布森“Clustal W:改善进步的敏感性,通过序列加权多重序列比对,position-specific差距处罚和权重矩阵的选择,”核酸的研究,22卷,不。22日,第4680 - 4673页,1994年。视图:出版商的网站|谷歌学术搜索
- t·n·彼得森椰子饼,g·冯·Heijne h·尼尔森,“SignalP 4.0:识别信号肽从跨膜区域,”自然方法,8卷,不。10日,785 - 786年,2011页。视图:出版商的网站|谷歌学术搜索
- s . f . Altschul t·l·马登a·a·谢弗et al .,“豁裂的爆炸和PSI-BLAST:新一代的蛋白质数据库搜索项目,“核酸的研究,25卷,不。17日,第3402 - 3389页,1997年。视图:出版商的网站|谷歌学术搜索
- m . Nishihara t .山崎,t .大岛渚,y郎。”sn-Glycerol-1-phosphate-forming活动古生菌:古细菌分离磷脂生物合成和甘油由甘油磷酸盐对映体分解代谢,”细菌学期刊,卷181,不。4、1330 - 1333年,1999页。视图:谷歌学术搜索
版权
版权©2015年本杰明·j·塔利等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。