研究文章|开放获取
乔安妮·b·爱默生,凯伦·安德拉德布莱恩·c·托马斯·安德斯·诺曼,埃里克·e·艾伦卡拉海德堡,吉利安·班菲尔德, ”宿主和CRISPR动力学Archaea-Dominated咸水湖泊Tyrrell,维多利亚,澳大利亚”,古生菌, 卷。2013年, 文章的ID370871, 12 页面, 2013年。 https://doi.org/10.1155/2013/370871
宿主和CRISPR动力学Archaea-Dominated咸水湖泊Tyrrell,维多利亚,澳大利亚
文摘
自然的研究热点组合需要社区环境,即一个并发的评估动力学的热点,细菌和病毒种群。在这里,我们使用过滤器size-resolved宏基因组分析报告101年的动态古细菌和细菌辣子鸡和140年病毒种群17个样品收集在不同的时间尺度从2007 - 2010年澳大利亚高湖Tyrrell (LT)。所有样品都是由古菌(75 - 95%)。古细菌、细菌和病毒的数量被发现是动态的几个月到几年的时间尺度和不同的浮游病毒组合在场,相对于host-associated(活跃和前病毒)体积分数。定期分析集群空间短回文重复(CRISPR)区域表明罕见的和丰富的病毒都是有针对性的,主要由低丰度。虽然很少有间隔器点击NCBI nr数据库或140 LT病毒数量,21%的人未装配的LT病毒集中读取。这表明当地适应LT-specific病毒和/或欠采样haloviral组合在公共数据库,以及成功CRISPR-mediated维护病毒种群丰度低到足以排除基因组组装。这是第一个宏基因组报告评估广泛的热点动态人口水平在短时间尺度咸水环境系统。
1。介绍
最丰富的和无处不在的生物实体,病毒宿主死亡率和群落结构影响,食物网动力学,和地球化学循环1,2]。为了更好地描述病毒的潜在影响古细菌进化和生态学,重要的是要理解病毒的耦合动力学和古细菌宿主的自然系统。尽管先前的研究已经证明在宿主种群动力学,这些研究大部分都集中在细菌宿主,经常局限于目标群体的病毒-宿主对,对古细菌病毒-宿主在自然系统动力学。
社区规模病毒-宿主分析往往是基于低分辨率测量整个社区,依靠技术,如变性梯度凝胶电泳(DGGE) pulsed-field凝胶电泳(但是脉冲场凝胶电泳的出现),和微观的数量(例如,[3- - - - - -5])。一个例外是一个研究,研究病毒和微生物动力学通过单一read-based四水生环境宏基因组分析,包括archaea-dominated结晶器咸水池塘(6]。在工作,提出微生物和病毒随时间持续的个别类群(物种),但高度动态的基因型(应变)水平。然而,在这些数据的再分析我们组利用宏基因组组装,我们得出的结论是,病毒实际上是人口(分类)水平的动态系统(7]。这个结果表明,进一步的分析是必要的,以确定古细菌种群往往是动态或稳定高系统短时间尺度。
宏基因组分析相对较少的病毒-宿主动力学已经报道,几个已经考虑定期聚集空间短回文重复(CRISPR)系统,它提供了一个机会来研究宿主的反应病毒捕食和病毒链接到主机8- - - - - -12]。CRISPR系统是一个基因组地区几乎所有的古菌和细菌,和CRISPRs(至少在所有系统,到目前为止,尚未生化特征)已被证明具有适应性免疫病毒和/或其他移动遗传元素通过主机CRISPR之间的核苷酸序列标识系统和入侵的核酸13,14]。CRISPR区域间距器的特点,通常来自外国核酸,包括质粒和病毒DNA,和短回文重复序列之间的间隔(综述[15,16])。同一物种的不同菌株可以高度发散CRISPR地区(例如,17])。高度基因研究病毒-宿主解决动力学在archaea-dominated酸性矿排水系统表明,只有最最近收购了CRISPR间距器匹配共存病毒和显示,病毒迅速重组逃避CRISPR目标,表明社区稳定是通过宿主抵抗病毒和病毒的快速进化主机CRISPR系统阻力(9]。古细菌CRISPR动力学也被调查硫化叶菌islandicus人口(18,19),表明明确的生物地理学CRISPR序列的病毒数量和适应当地的病毒数量。是否类似的动力学发生在archaea-dominated咸水环境系统还不是很清楚。
以前,我们组35病毒种群的动态跟踪八病毒集中(代表30 kda - 0.1μm大小分数)期间收集的三个夏天从archaea-dominated咸水湖泊Tyrrell (LT),维多利亚,澳大利亚7]。我们表明,病毒在LT系统总体稳定和动态多年时间尺度的天。在这项研究中,我们寻求扩大我们的分析包括LT病毒宏基因组库生成的从0.1,0.8和3.0μm过滤器,其中可能包括前病毒、病毒大于0.1μ米,否则保留积极感染病毒,病毒的过滤器。这允许我们增加我们的学习的时间和空间范围17样本,包括四个冬天的病毒样本集中的DNA测序。给当前和以前的病毒分析上下文的LT和测试的理论微生物类群物种水平的稳定archaea-dominated咸水环境系统(在[6]),在这项研究中我们还通过16 s rRNA古细菌和细菌动力学特征基因分析,我们使用CRISPR协助解释分析结果。
2。材料和方法
2.1。样本收集和准备
样本采集、DNA提取和测序方法前面描述的(7,20.,21]。短暂,10 L地表水样品收集顺序从LT和过滤20日,3.0,0.8和0.1μm过滤器。post - 0.1μm滤液集中通过切向流过滤和保留病毒DNA提取。病毒集中和0.1、0.8和3.0μm过滤器被保留为每个样本,测序进行不同尺寸范围,根据样本(表1)。样品名称包括月(J 1月、8月),,网站(A或B, ~ 300 m除外),和时间点如果样品是days-scale时间序列的一部分(例如,t1, t2,等等)。在必要时,分数还表示在示例名称(3.0、0.8或0.1的过滤器尺寸吗μ米,或VC对病毒集中)。网站A和B是孤立在夏天(样品1月),但连续的湖在冬天(8月样本)。GPS坐标为A和B是网站35°19′09.6′′年代,142°47′59.7′′E和35°19′18.71′′年代,142°48′4.23′′E,分别。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 风险投资:病毒集中。 纳米:不测量。 体育:paired-end测序。 SR: single-read测序。 VC J2009B是一个从三个病毒DNA池集中收集在一天。 保持一致的命名与先前的出版物样本,我们保留样品名称是基于连续浓缩病毒样本。样品3.5实际上是收集第四系列和样品4的第五。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.2。恢复140年病毒重叠群> 10 kb和检测病毒在每个样本
除了35 LT病毒和病毒样(即病毒或质粒)的人群,我们前面描述的7),我们将所有从一个新的IDBA_UD叠连群> 10 kb (22)装配的六个Illumina-sequenced病毒集中样本(默认参数)。我们也试图包含尽可能多的病毒序列组装从图书馆大粒级过滤器。要做到这一点,我们首先试图从所有Illumina-sequenced过滤器组装读取样品和读取从至少一个0.8μm过滤器/样本(无论测序类型),用IDBA_UD缺省参数(22]Illumina-sequenced样品和gsAssembler [23454 -测序样品使用默认参数。组件通常是支离破碎的,因此,没有发现病毒重叠群大于10 kb大部分组件。然而,我们恢复病毒重叠群> 10 kb 0.1从宏基因组的组装μ过滤器从2010年1月,通过注释,可以自信地确定分配给病毒或前病毒(如叠连群,包括病毒衣壳蛋白,尾巴蛋白质,和/或terminases)。注释参数之前描述的一样(7]。我们使用BLASTn跨组件和识别复制病毒序列样本,我们删除任何重叠群共享> 2 kb > 95% nt身份(所有重叠群实际上被共享≥99% nt身份因为没有重叠群共享> 2 kb 88 - 98% nt身份)。剩余的140病毒2 kb高达87% nt的身份,与一些较小的共享区域更高的身份。
确定是否一个给定的病毒出现在一个给定的示例中,我们使用140年的病毒序列重叠群> 10 kb作为片段招聘(即引用。,招聘Illumina公司测序读或相当于100个基点从其他测序技术读取片段,如[7),使用burrows - wheeler对准器(bwa)使用默认参数24]。我们至少需要1 x的阅读范围给定参考序列重叠群至少50%的检测。层次聚类(皮尔森相关,平均连锁聚类),读取的数量映射到一个给定的病毒序列重叠群在一个给定的样本归一化病毒序列的长度和读取样本的数量,如前所述[7]。
2.3。代的16 s rRNA基因数据和计算主机相对丰富
生成一个参考16 s rRNA基因序列的数据库,我们使用了EMIRGE算法(25]附近重建完整的16 s rRNA基因Illumina公司宏基因组数据。所有的0.1和0.8μm过滤器,DNA Illumina公司测序和浓缩病毒的DNA也从相同的样本测序,接受EMIRGE分析为了生成一个参考16 s rRNA为LT基因数据库系统。以下样品基因组EMIRGE分析过滤:2007 at1 (0.8μ2010 bt3(0.8米)μ2010 bt1(0.1米)μ2010 bt2(0.1米)μ2010 bt3(0.1米)μ(0.1米),2010μ米)。我们集中所有EMIRGE-generated 16 s rRNA基因序列在97% nt身份,使用UCLUST [26),导致101年16 s rRNA基因序列数据库。分类是分配给这些辣子鸡,使用席尔瓦增量调整器(新浪)27)在席尔瓦网站(28,29日]。使用缺省参数(bwa24),我们将宏基因组读取映射(分成100个基点的长度限制的偏见与不同的测序技术,如上所述,在[7)从所有过滤器样品参考数据库101个辣子鸡,为了生成相对丰度估计为每个OTU跨样本。对于一个给定的OTU中发现某个给定的程序库,我们要求≥1 x覆盖率在≥70%的长度EMIRGE-generated 16 s rRNA基因序列。为了占不同的测序吞吐量,我们使用相对丰度;我们估计百分比的每个样本中的每个OTU读取,映射到OTU数量除以总数量的读取映射到任何OTU样本乘以100。这些分子的相对含量,用于分层聚类(皮尔森相关,平均连锁聚类)和网上出现在表S1(见补充材料http://dx.doi.org/10.1155/2013/370871)。
这些序列(140病毒重叠群> 10 kb和101 16 s rRNA基因序列)已提交下NCBI BioProject加入。PRJNA81851。
2.4。相关性与CRISPR间距器
我们使用粗鲁的30.)定期识别集群空间短回文重复(CRISPR)在每个样本重复和间隔序列。对于这一分析,我们认为所有测序过滤器的大小(即对于给定的水样在一起。,0.1,0.8,和3.0μ米过滤器)。使用BLASTn与一个价值的截止,我们评估CRISPR间距器的数量从每个样本匹配(1)的140病毒序列重叠群> 10 kb,(2)读取从病毒集中收集相同的样本(只适用于病毒集中的8个样本测序),和(3)读取从其他病毒集中收集样本。
3所示。结果与讨论
3.1。相对丰度的病毒种群大小分数
叠连群> 10 kb 105新病毒被重建,增加基因的数量特征的病毒从Tyrrell湖(LT),维多利亚,澳大利亚,从35到140年。140年叠连群,包括7名之前报告完整的基因组,大小范围从10050到93283个基点。我们分析了这140病毒基因型的相对丰度从病毒宏基因组库集中和过滤体积分数(0.1 - -0.8、0.8 - -3.0和3.0 -20μ米)跨越时间和地点之间只有42中尉和多达116病毒被发现在一个给定的样本(任何大小分数),和更多的病毒样本中发现病毒集中被测序。虽然我们承认比较16 s rRNA基因的微生物辣子鸡> 10 kb病毒重叠群辣子鸡是一个不完美的代理来比较这些群体的多样性,我们发现大约10浓缩病毒的病毒种群大小分数每个主机OTU(任何过滤器大小分数)在大多数样本,表明浮游病毒多样性和宿主多样性规模大约与丰富,曾被建立是大约10:1在大多数环境中(例如,31日])。
为了区分自由浮游病毒身体困在过滤器和host-associated病毒(即。活跃的病毒和/或前病毒),我们认为,0.8和3.0μm过滤孔隙尺寸太大,保留大量的病毒颗粒,主要应该包括host-associated病毒。我们认为0.1μm过滤器可以保留host-associated和浮游病毒和病毒集中(30 kda - 0.1μm大小分数)通常不包括宿主细胞和应由浮游病毒。因此,我们认为是病毒检测在图书馆从三个过滤器尺寸分别组:(1)病毒集中,(2)0.1μm过滤器,(3)0.8或3.0μm过滤器。至少在五个样本从每个组测序一个库,病毒的数量只发现在病毒集中总是高于过滤器(图上只发现数量1(一))。这一趋势是强劲的两个样本,从病毒库集中和至少一个0.8或3.0μm过滤器样品测序(图1 (b))。虽然我们发现更多独特的病毒在病毒集中,总发现病毒的比率在0.8或3.0μm过滤器,相对于总病毒检测到病毒集中,往往是约等于(图1 (c)),这意味着丰富的病毒病毒集中往往类似于病毒的丰富性host-associated大小分数。
(一)
(b)
(c)
我们使用层次聚类(图2(一个))来确定模式的相对丰度(即140年病毒。,the 140 viral contigs >10 kb) could be observed, according to season, filter size, and/or sample site. No universal patterns were observed, but there was some clustering according to filter type and/or for samples collected from the same site during the same week. Specifically, all four viral concentrate samples from January 2010, site B clustered together, and they clustered more closely with all of the 0.1 μm过滤器从同一时间序列与其他病毒比集中样本。两个额外的病毒样本集中收集在同样的季节,但在不同的网站和年(J2007At1和J2009B)完成一个较大的集群组,表明浮游病毒之间的相似性分数,相对于病毒更大尺寸的滤波器。有趣的是,剩下的两个病毒样本集中(唯一样本收集2010年1月从网站和另一个样本网站收集2007年1月)集群相互分开,其余的数据集。总的来说,这表明病毒集中代表了不同的病毒社区的一部分被其他采样大小分数,特别是分数> 0.8μm。有趣的是,尽管上述相似性丰富性(即。,the number of viral OTUs remains relatively similar across samples, but the composition differs in viral concentrates, relative to host-associated size fractions).
(一)
(b)
虽然最明显的趋势在病毒组合层次聚类分析的分离病毒集中于其他过滤器上面描述的大小,观察一些集群为0.1,0.8和3.0μm滤波器体积分数。具体地说,所有四个过滤器样品收集从2009年1月网站集群在一起,所有的0.8和3.0μm过滤器从2010年1月站点B,显示稳定的活跃的病毒和/或前病毒的组合超过四天在这两种情况下。尽管0.1和0.8μm过滤器样品收集在2007年8月从网站1聚集在一起,他们是分开相同大小的过滤器收集两天后,建议积极转变病毒组合/天或前病毒诱导的时间表。在一起,这些数据表明,尽管一些营业额在活跃的病毒和/或观察前病毒,最活跃的病毒和/或前病毒archaea-dominated LT系统天内稳定。
3.2。古细菌和细菌辣子鸡
我们也为特征的相对丰度的潜在宿主辣子鸡跨越时间和地点之间的LT系统。101年古细菌和细菌总数16 s rRNA基因辣子鸡nt身份97%,29日被发现在5%的丰度或更高任何过滤任何样品。简单的可视化图3显示只有29个辣子鸡,它只包含样本至少五个辣子鸡是检测到。
在过滤size-resolved情节(数字3(一)-3(c)),很明显,即使是最丰富的古细菌组显著变化在时间和空间方面的存在/缺失和相对丰富。例如,的相对比例Halorubrum例如,Haloquadratum在样本——比如辣子鸡往往差别很大,从几乎完全Halorubrum例如生物(例如,在2007年8月时间序列)几乎完全Haloquadratum——生物(例如,在2009年1月,地点,时间序列和2010年1月,网站)。这些组织的相对丰度的变化甚至可以观察到在0.8小时μm过滤器从2009年1月,site B,时间序列(图3(b))。显著改变温度测量之间的第一次和第二次的样品2009年1月,site B,时间序列(表1),我们假设这一转变在群落结构可能标志着对温度变化的反应。除了2010年1月,site B,时间序列的多样性和相对丰富Haloquadratum例如,Halorubrum例如生物通常anticorrelated,表明这些古生菌可能争夺LT系统类似的利基。观察一个相对较低的多样性和丰富的Haloquadratum在一些样品(即如生物。,A2007At1-t2, A2008At2, and J2009Bt1) suggests thatHaloquadratum物种更有活力高系统比之前一直感激32]。
除了趋势在生物类型,具体的辣子鸡也表现出有趣的动力学。例如,OTUHaloquadratum walsbyi2,它属于一个物种通常被认为是最丰富的生物在咸水湖泊(32),在丰度相对较低或没有检测到0.8和3.0μm过滤器从2007年8月,网站,2010年1月,site B,尽管它是在丰度高,粒级网站2009年1月和2010年1月。有趣的是,OTU也出现在天范围内动态2008年8月在网站,出现在高3.0μ时间1 m过滤但没有检测到0.8μm过滤时间2。三个辣子鸡,包括两个相关Salinibacter,在2007年8月,更加丰富网站,时间序列(所有过滤器尺寸)比任何其他样本。Nanohaloarchaeon, CandidatusNanosalina(21),发现在相当高的丰度0.1μA和B m过滤器从2010年1月网站但不丰富(图其他站点和时间3(a))。与小细胞大小一致有机体,它和其他丰富的Nanohaloarchaeal OTU, CandidatusNanosalinarum,被发现在低丰度或没有检测到过滤器大于0.1μm。
总的来说,分析29最丰富的古细菌和细菌辣子鸡表明动态人口水平跨越时间和空间,特别是在几个月或者几年时间尺度,动态显示小时天。这些结果表明动力学在最丰富的古细菌和细菌种群分类单元水平,相比之前的一项研究中,预测最丰富的微生物类群被稳定在时间尺度的周一个月在圣地亚哥附近的一个结晶器咸水池塘(SD)、钙、美国(6]。这项研究是基于分类关系预测从宏基因组读的~ 100个基点。可能是采样时间尺度的差异,地球化学和/或社区组成可能导致真正的微生物动力学这两个系统之间的差异。同时,LT微生物真核社区主导的掠夺Colpodellasp,目前尚不清楚有什么影响自上而下放牧可能在细菌和古细菌群落结构的变化20.]。然而,SD研究还表明病毒种群系统的稳定性,我们之前通过SD的再分析数据证实了最丰富的病毒种群的研究实际上是动态的(8),所以有可能不同的测序和分析方法揭示了在古细菌和细菌种群动力学SD网站。不幸的是,现有的SD数据的再分析使用的方法在本研究中是不可能的,由于不兼容454测序读EMIRGE算法,旨在重建已经几乎16 s rRNA基因paired-end Illumina公司宏基因组数据。
基于101年的相对丰度古细菌和细菌辣子鸡(包括低丰度LT生物),我们使用层次聚类来确定整体古细菌和细菌群落结构相似性将LT组样本根据季节,样品类型,或过滤器尺寸(图2 (b))。一般来说,古细菌和细菌社区抽样从同一地点天集群比病毒更紧密组合相同的样品(见上图,图2(一个)),表明宿主种群的稳定性大于病毒种群在天。唯一的样品(即没有时间系列。,days scale) clustering was observed for host communities were samples from August 2008, site A. For that time series, DNA from different filter sizes was sequenced from each sample, and different sequencing technologies were used (454 and Illumina), so it is possible that similarities between the samples exist but were masked by different methodologies. However, interestingly, all samples and filter sizes from the August 2007, site A, time series clustered together, including DNA from 0.1, 0.8, and 3.0 μm大小分数排序所有三个技术(454年桑格,Illumina公司)。这表明一个独特的社区网站2007年8月,是稳定和健壮的方法论的差异在天图书馆建设和测序。
在某些情况下,古细菌和细菌社区0.1μm过滤器聚集在一起,分别从其他过滤器相同的时间点,反映Nanohaloarchaea浓缩。具体来说,0.1μ过滤器从2007年1月,网站,聚集在一起,他们属于一个更大的集群,包括所有0.1μ过滤器从2010年1月,网站b Nanohaloarchaea的患病率在这些样本而不是其他人明显在图3(一),它是基于上述29最丰富的辣子鸡。在所有其他情况下,0.1μm过滤器集群大过滤器从相同的时间序列。2009年1月,site B,单日时间序列,只有0.8的DNAμm过滤器(病毒集中)测序,上午下午和晚上样品分开示例集群,集群在一起,表明群落结构的变化超过一天。这是符合的相对丰度的变化Halorubrum例如,Haloquadratum例如生物从时间序列(图3),可能与温度有关的转变,如上建议。
有趣的是,一个季节性的趋势并不表示在29日最丰富的辣子鸡的分析或在101年OTU分层聚类分析(季节性病毒种群趋势很难推断,从冬天没有病毒集中测序样品)。样本网站2007年8月有截然不同的古细菌和细菌群落结构从样品在同一网站2008年8月,1月和样本网站每年也相当明显。虽然有些site B的样本,收集2009年1月和2010年1月,可能出现异常(图3(b)),群落结构的变化随着时间2009年1月site b在多年来收集的样本。
与任何宏基因组研究中,我们不能确定在多大程度上丰富的宏基因组库反映真正的丰度。然而,我们照顾,以避免偏见,往往与sequencing-based社区相关分析。具体来说,通过专注于16 s rRNA基因序列从宏基因组数据,我们避免了PCR扩增偏差估计的热点和细菌的动态。同样,我们能够产生足够的浓缩病毒宏基因组DNA测序没有multiple-displacement放大(MDA),这是众所周知的,产生重大偏差,特别是在病毒基因组(在讨论33,34])。
3.3。CRISPR分析
使用粗鲁的算法(30.),我们发现549独特的重复和8095定期从集群独特的间隔序列空间短回文重复LT (CRISPR)地区的数据集。除了一个样品从2009年1月,网站,只有图书馆间距器相匹配的任何140完成,几乎完全病毒基因组被那些病毒从样本集中也测序(表2)。这可能表明不同浮游病毒组合存在在LT的时间点病毒集中没有测序,这将符合病毒种群动态观察整个测序病毒集中(7]。值得注意的是,没有间隔器LT 140年8月基因组匹配任何病毒,可能符合季节性病毒群落结构的转变(从8月样品没有病毒集中测序),已经在海洋观测系统(例如,35])。然而,伴随季节性主机群落结构的转变是不支持,所以也有可能每年8月浮游病毒样本可以港口不同的组合。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
唯一间隔匹配任何七前所述完整LT病毒和病毒样的基因组7]是LTV2(76716个基点)和LTVLE3(71341个基点)在2010年1月从三个样本库,site B,时间序列(表2)。的七个病毒基因组,集中这两个达到了约一个数量级(丰度最高7),他们在最丰富的时间序列间隔器定位检测。这表明LT CRISPRs可以积极目标丰富,共存病毒,与以前的观测一致的CRISPR抽样共存的病毒在一个酸性矿排水系统(9,11]。然而,应该注意的是,绝大多数的间距器不匹配的任何140年病毒重叠群> 10 kb,我们认为是最丰富的病毒,因为他们聚集显著。这表明,大多数CRISPRs目标罕见的病毒。另一种可能的解释是不活跃的优势,遗迹CRISPR地区,但是如果是这样的话,那么我们希望看到同样的CRISPR间距器复制(即跨样本。CRISPR地区将无性繁殖系地继承了几代人,而不是积极整合新间隔器在subgenerational时间表)。鉴于只有353间间隔序列重复样本,相对于8095独特的间隔序列数据集,我们推断,大多数CRISPR地区是高度动态的和/或不同CRISPR区域,我们发现随着时间的推移,由于主机群落结构的变化。无论如何,有一个高间隔器在LT系统的多样性,符合高多样性的病毒。
CRISPR区域的匹配140 LT病毒重叠群,只有五个重复匹配组件从0.1,0.8,和/或3.0μm滤波器序列(匹配表明主机有机体),也没有匹配的任何12个完整和几乎完全细菌和古细菌基因组组装的LT网站2007年1月一个时间序列36]。三场比赛,2010年1月site B总成(安德拉德et al .,未发表的数据)叠连群,只能在订单确认Halobacteriales水平,基于最佳爆炸冲击整个叠连群,和一个重复匹配叠连群预测属于Natronomonas-like生物体(表2)。最有趣的CRISPR重复序列匹配是一个从可能Nanohaloarchaeon叠连群,基于分类的最佳爆炸冲击整个重叠群。的间隔与重复匹配LTVLE3,病毒或质粒中描述(7),强烈建议LTVLE3 Nanohaloarchaea的病毒或质粒。有趣的是,尽管LTVLE3只是从2010年1月在病毒丰度高集中site B为期四天的时间序列,衬垫的唯一目标是识别,最丰富的Nanohaloarchaeon CandidatusNanosalina(21),发现在大多数LT样品和如此丰富的在网站site B(隔离池300除外)2010年(图3(a))。这表明Nanohaloarchaea site B可能是适应本地的丰富LTVLE3 site B在2010年1月。
爆炸搜索所有8095 LT CRISPR间距器和549的重复序列显示本质上没有击中NCBI nr和环境数据库,并没有发现任何打击的重复序列。三个间隔器匹配了100%智人,这表明他们可能是错误的间距器或代表移动遗传在公共数据库中不存在的元素。总的来说,这些数据表明,LT CRISPR间距器目标移动遗传元素还没有被发现,这表明LT古生菌可能是高度适应本地病毒捕食,虽然我们不能排除的可能性(即公共数据库的偏见。,也许LT CRISPRs可以从其他地方目标病毒不代表公共数据库)。支持当地的适应,尽管相对较少的间隔匹配140 LT病毒重叠群> 10 kb, 1729间距器(21%)比赛未装配的LT病毒集中读取。这可能说明选择适应本地CRISPR间距器这一目标,可能共存的病毒,符合先前观察到的当地CRISPR适应共存病毒在一个酸性矿排水系统在地理上不同的污泥生物反应器(8,9]。因为这些比赛是未装配的读取,我们推断,大多数目标LT病毒丰度相对较低,至少在时间和地点由本研究抽样(除了LTV2 LTVLE3,如上所述)。这可能表明成功CRISPR-mediated维护病毒种群丰度低到足以排除基因组组装。
的时间尺度CRISPR间距器被保留和匹配共存,low-abundance LT系统病毒,我们发现一些证据支持许多CRISPR间距器的稳定性和low-abundance病毒在所有由本研究时间尺度采样(三年)。LT间距器往往匹配读取来自多个病毒基因组集中收集一样经常在天(2007年1月,网站)或更多(2010年1月,site B)他们匹配读取从单个病毒集中metagenome来自同一个时间序列(图4(一))。这表明许多间隔器及其目标,low-abundance病毒是稳定在天。的时间尺度上,间隔器及其目标共存病毒通常被发现在一个以上的四个地点和时间由病毒集中取样(2007年1月,网站;2009年1月,site B;2010年1月,网站;2010年1月,site B)。同样,在所有八个样本病毒集中排序,那么许多(更)间距器达到病毒集中读取来自其他样本匹配病毒集中读取相同的示例(图4 (b))。同样数量的比赛的八个病毒集中观察病毒的样本集中没有测序(图4 (c))。总的来说,这些结果说明CRISPR地区通常保留间隔目标针对low-abundance病毒1 - 3年的时间尺度。我们也推断low-abundance病毒很可能更稳定的LT比高度动态系统,更高的丰度。
(一)
(b)
(c)
4所示。结论
两种病毒(140年叠连群> 10 kb)和宿主(101 16 s rRNA基因辣子鸡)组合结构是高度动态archaea-dominated LT系统的时间和空间,特别是在几个月到几年。然而,古细菌和细菌数量通常比病毒更稳定的种群,并降低病毒丰度比丰富的病毒推断更稳定。过滤器size-resolved病毒人群的分析揭示不同浮游病毒组合和host-associated(即。,active and provirus) fractions, suggesting that a higher diversity of viruses may have the potential to infect than are actively infecting at any given time. Consistent with that hypothesis, CRISPR analyses revealed persistent targeting of lower abundance viral populations, along with a high diversity of spacer sequences. However, interestingly, the most abundant viruses (~2% of the viral community, relative to ≤0.1% for most viruses, [7])也CRISPRs的目标,表明古细菌宿主对持久保护之间取得平衡,low-abundance病毒,这些病毒可能足够丰富的灾难性影响主机群落结构的变化。
确认
资助这项工作是由美国国家科学基金会提供奖0626526和DE-FG02-07ER64505能源部。由于Cheetham盐工作(澳大利亚维多利亚)允许收集样本;约翰·莫罗约亨•布洛克和迈克Dyall-Smith领域寻求帮助;马特·刘易斯和j·克雷格·文特尔研究所(同时)图书馆建设和测序;香农威廉姆森和道格Fadrosh(同时)培训乔安妮·b·爱默生在病毒相关实验室技术;康纳Skennerton和基因泰森早期访问与粗鲁的和援助项目;克里斯汀太阳有用的讨论;和两个匿名评论者的建设性的意见,提高了纸。
补充材料
表S1报道16 s rRNA的相对丰度在样本基因辣子鸡。序列id为每个OTU出现在行,和样本id列。值在给定OTU表显示的相对丰度在一个给定的样本,计算在材料和方法部分描述。
引用
- f . Rohwer说道,d . Prangishvili, d . Lindell“角色”病毒的环境中,环境微生物学,11卷,不。11日,第2774 - 2771页,2009年。视图:出版商的网站|谷歌学术搜索
- c . a .净重的“海洋viruses-major玩家在全球生态系统”自然评论微生物学,5卷,不。10日,801 - 812年,2007页。视图:出版商的网站|谷歌学术搜索
- k·波特、b·e·拉斯和m . l . Dyall-Smith”在盐湖宿主的相互作用,”目前看来在微生物学,10卷,不。4、418 - 424年,2007页。视图:出版商的网站|谷歌学术搜索
- r。。Sandaa和a·拉森,”挪威沿海水域的季节性变化病毒-宿主种群:关注噬藻体社区感染海洋聚球藻属spp。”应用与环境微生物学,卷72,不。7,4610 - 4618年,2006页。视图:出版商的网站|谷歌学术搜索
- s . m .短和c a .净重”时间动力学海洋藻类病毒和真核生物,自然社区”水生微生物生态学,32卷,不。2、107 - 119年,2003页。视图:谷歌学术搜索
- l . b . Rodriguez-Brito l . Li Wegley et al .,“病毒和微生物群落动态在四个水生环境中,“ISME杂志,4卷,不。6,739 - 751年,2010页。视图:出版商的网站|谷歌学术搜索
- 托马斯j·b·爱默生,公元前,k .安德雷德·e·e·艾伦,k . b .海德堡和j·f·班菲尔德,“动态病毒种群高系统揭示了宏基因组大会,“应用与环境微生物学卷,78年,第6320 - 6309页,2012年。视图:谷歌学术搜索
- 诉Kunin s .他f . Warnecke et al .,“细菌metapopulation适应本地噬菌体捕食尽管全球传播,”基因组研究,18卷,不。2、293 - 297年,2008页。视图:出版商的网站|谷歌学术搜索
- a·f·安德森和j·f·班菲尔德”,病毒在自然种群动态和获得性耐病毒微生物社区,”科学,卷320,不。5879年,第1050 - 1047页,2008年。视图:出版商的网站|谷歌学术搜索
- r·e·安德森,w . j . Brazelton和j . a . Baross”使用CRISPRs ametagenomic工具识别微生物宿主扩散流的深海热液喷口病毒组合,”《微生物生态学,卷77,不。1,第133 - 120页,2011。视图:出版商的网站|谷歌学术搜索
- g·w·泰森和j·f·班菲尔德,”快速发展的CRISPRs参与获得性耐药微生物的病毒,“环境微生物学,10卷,不。1,第207 - 200页,2008。视图:出版商的网站|谷歌学术搜索
- j . f .海德堡w·c·纳尔逊·t·Schoenfeld和d . Bhaya“细菌战微生物垫社区:CRISPRs提供洞察宿主和病毒基因组的进化,”《公共科学图书馆•综合》,4卷,不。1,文章ID e4169, 2009。视图:出版商的网站|谷歌学术搜索
- r . Barrangou c . Fremaux h . Deveau et al .,“CRISPR提供获得抵抗病毒在原核生物中,“科学,卷315,不。5819年,第1712 - 1709页,2007年。视图:出版商的网站|谷歌学术搜索
- f·j·m·Mojica c . Diez-Villasenor j . Garcia-Martinez和大肠的索里亚,”干预的定期间隔的原核的重复序列来自外来基因元素,”杂志的分子进化,60卷,不。2、174 - 182年,2005页。视图:出版商的网站|谷歌学术搜索
- r .索瑞克诉Kunin, p . Hugenholtz”CRISPR-a广泛系统,提供获得抵抗噬菌体在细菌和古菌”自然评论微生物学》第六卷,没有。3、181 - 186年,2008页。视图:出版商的网站|谷歌学术搜索
- b . Wiedenheft s h·斯特恩伯格和j·a . Doudna”RNA-guided细菌和古菌的基因沉默系统”自然,卷482,不。7385年,第338 - 331页,2012年。视图:出版商的网站|谷歌学术搜索
- r·t·DeBoy e . f . Mongodin j·b·爱默生和k·e·纳尔逊”Thermotogales染色体进化:大规模的反演和应变CRISPR序列的多样化,”细菌学期刊,卷188,不。7,2364 - 2374年,2006页。视图:出版商的网站|谷歌学术搜索
- n . l ., a . Herrera h . c,一个和r·j·惠特克”CRISPR多样性相关人口硫化叶菌islandicus,”《公共科学图书馆•综合》,5卷,不。9篇文章ID e12988 2010。视图:出版商的网站|谷歌学术搜索
- n l和r·j·惠特克举行,“病毒生物地理学显示签名在硫化叶菌islandicus基因组,”环境微生物学,11卷,不。2、457 - 466年,2009页。视图:出版商的网站|谷歌学术搜索
- k . b .海德堡w·c·纳尔逊·j·b·霍尔姆n . Eisenkolb k .安德拉德和j·b·爱默生”表征的真核微生物多样性高湖Tyrrell,澳大利亚,”微生物学前沿ID 115条,卷。4日,2013年。视图:出版商的网站|谷歌学术搜索
- p . Narasingarao美国就达j . a . Ugalde et al .,“新创宏基因组组装揭示丰富小说古生菌高微生物群落的主要血统,”ISME杂志》第六卷,没有。1,第93 - 81页,2012。视图:出版商的网站|谷歌学术搜索
- h·c·m·梁y Peng s . m .姚和f . y . l .下巴,“IDBA-UD:新创汇编单细胞和宏基因组测序数据的深度与高度不均匀的,”生物信息学,28卷,不。11日,第1428 - 1420页,2012年。视图:出版商的网站|谷歌学术搜索
- m·格里斯,m·埃霍尔姆w·e·奥特曼et al .,“基因组测序在microfabricated高密度picolitre反应堆,”自然卷,437年,第380 - 376页,2005年。视图:谷歌学术搜索
- h·李和r·杜宾“快速而准确的短阅读符合burrows - wheeler变换,“生物信息学,25卷,不。14日,第1760 - 1754页,2009年。视图:出版商的网站|谷歌学术搜索
- 公元前c . s Miller b·j·贝克·托马斯,s . w .歌手和j·f·班菲尔德,“EMIRGE:重建完整的核糖体基因从微生物群落短读取测序数据,”基因组生物学,12卷,不。5条R44机身内部,2011年。视图:出版商的网站|谷歌学术搜索
- r·c·埃德加“搜索和集群数量级的速度比爆炸,”生物信息学,26卷,不。19日,2460 - 2461年,2010页。视图:出版商的网站|谷歌学术搜索
- e . Pruesse j . Peplies, f . o . Glockner“新浪:准确的核糖体RNA基因的高通量多序列比对,“生物信息学28卷,第1829 - 1823页,2012年。视图:谷歌学术搜索
- e . Pruesse c . Quast k Knittel et al .,”席尔瓦:一个全面的在线资源质量检查和对齐的核糖体RNA序列数据与ARB兼容,”核酸的研究,35卷,不。21日,第7196 - 7188页,2007年。视图:出版商的网站|谷歌学术搜索
- c . Quast e . Pruesse p Yilmaz et al .,”席尔瓦核糖体RNA基因数据库项目:改善数据处理和基于web的工具,”核酸的研究卷,41 D590-D596, 2013页。视图:谷歌学术搜索
- c . t . Skennerton m . Imelfort g·w·泰森,“粗鲁:识别和重建CRISPR未装配的宏基因组数据,”核酸的研究第41卷。。10 p . e105 2013。视图:出版商的网站|谷歌学术搜索
- r . Danovaro c . Corinaldesi a .戴尔'Anno et al .,“海洋病毒和全球气候变化,”《微生物学检查,35卷,不。6,993 - 1034年,2011页。视图:出版商的网站|谷歌学术搜索
- m . l . Dyall-Smith f·菲佛,k克利et al .,“Haloquadratum walsbyi:有限的多样性在全球池塘,“《公共科学图书馆•综合》》第六卷,没有。6篇文章ID e20968 2011。视图:出版商的网站|谷歌学术搜索
- m . b . Duhaime m·b·沙利文,“海洋病毒:严格评估宏基因组sample-to-sequence管道,”病毒学卷,434年,第186 - 181页,2012年。视图:谷歌学术搜索
- m . b . Duhaime l .邓b·t·波勒斯·m·b·沙利文,“对野生病毒和其他超低浓度定量宏基因组DNA样本:严格的评估和优化的链接器放大方法,”环境微生物学,14卷,第2537 - 2526页,2012年。视图:谷歌学术搜索
- r·j·帕森斯·m·布莱巴特·m·w·洛玛斯和c·a·卡尔森,“海洋virioplankton动态的时间序列揭示了反复出现的季节性西北马尾藻海”ISME杂志》第六卷,没有。2、273 - 284年,2012页。视图:出版商的网站|谷歌学术搜索
- 美国就达p . Narasingarao j·a·尤加尔德这样j·f·班菲尔德k . b .海德堡和e·e·艾伦,”Assembly-driven社区咸水环境微生物生态系统的基因组学”,《公共科学图书馆•综合》文章ID e61692卷。8日,2013年。视图:谷歌学术搜索
版权
版权©2013乔安妮·b·爱默生等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。