文摘

Haplaxius crudus范Duzee是各种经济重要的害虫手掌由于其传播致命的泛黄的能力,一个致命的phytoplasma感染。也是致命的古铜色的假定的向量在佛罗里达州,另一个致命phytoplasma疾病造成重大经济损失。到目前为止,没有线粒体基因组物种家族Cixiidae测序。在这项研究中,完整的线粒体基因组h . crudus测序、组装和注释从PacBio续集II长期使用佛罗里达大学HiPerGator测序读。的mitogenomeh . crudus长15848个基点,37个线粒体编码基因(包括13个蛋白编码基因(pcg), 22个图示,和2 rrna)内部控制除了公认的非编码区域。的核苷酸组成h . crudus是不对称的,倾向于a / T (44.8%, 13.4% C、G, 8.5%和33.3% T)。蛋白质编码基因(pcg)拥有标准的无脊椎动物线粒体基因起始密码子很少有例外而内容和顺序的h . crudusmitogenome非常类似于大多数昆虫线粒体基因组的完整测序。基于整个mitogenome显示了系统发育分析h . crudus解决紧密Delphacidae,公认的妹妹Cixiidae的分类单元。这些数据提供了一个有用的资源开发新颖的底漆集可以帮助在系统发育研究或人口遗传学研究。将来更完整mitogenomes可用其他灰飞虱种类,可以构造更健壮的发展史,更准确的观点在这迷人的和经济上重要的进化关系群昆虫。

1。介绍

高通量基因组测序技术的发明极大地改变了对生物学的理解,多样性,和昆虫之间的关系及其相关病原体(1]。线粒体基因座在特定的系统发育研究最常用的分子标记(2和评估种群动态3,4),因此下一代测序技术的一个重要组成部分。昆虫线粒体基因组紧凑,一般从14到20个碱基(kb),与一组编码的基因非常保守,在所有子半翅类(5- - - - - -7)以及其他订单,如鞘翅目(8]。通常在动物线粒体基因组编码基因组成13个蛋白编码基因(pcg), 2核糖体rna (rrna), 22转移与非编码rna(图示)控制区域(9]。此外,特定的基因顺序内线粒体DNA是一个关键的功能,可以提供重要的证据建立进化类群之间的关系在高和低的分类水平,可以在昆虫之间变量(4,10,11]。

到目前为止,5178年完成或接近完成昆虫线粒体基因组序列上可用基因库(截至2020年4月)和继续增长随着测序技术变得更加符合成本效益和时间有效。然而,更少的完整的线粒体基因组的半翅类的昆虫,特别是Auchenorrhyncha测序或发表在基因库(https://www.ncbi.nlm.nih.gov/)。

半翅类昆虫是最大的群体之一hemimetabolous昆虫(12),包括三个亚目:Auchenorrhyncha,胸喙亚目,异翅亚目(5,13]。Auchenorrhyncha和胸喙亚目植物病原真菌适合传输基于形态学的口器(穿刺/吸)和摄食行为14]。在半翅类,著名的害虫飞虱、叶蝉、蚜虫、烟粉虱。飞虱属于家庭Cixiidae包括超过2000种,150属半翅目(昆虫的15]。

美国棕榈cixiidHaplaxius crudus(图1),是最重要的手掌auchenorrhynchan害虫,从美国亚热带到中美洲和南美洲的热带地区16,17]。h . crudus是一个证实向量的棕榈疾病称为致命泛黄(LY)造成的16 sriv-a phytoplasma在美洲大陆18),是致命的古铜色的假定的向量(磅)19),一场毁灭性的棕榈疾病造成的致命的古铜色phytoplasma (16 sriv-d子群)。Phytoplasmas相关的革兰氏阳性细菌和植物是专性细胞内寄生物传播phloem-feeding半翅类的昆虫,包括叶蝉、飞虱、木虱(20.,21]。LY和磅phytoplasmas最终导致死亡的手掌和感染导致的损失数以百万计的椰子树(椰子)在整个加勒比盆地22)以及其他棕榈的物种。此外,h . crudus在美国东南部广泛和丰富。

,完整的线粒体基因组(测序、组装和注释)h . crudus提出了。这些数据是为了作为一个资源发展的小说在系统发育标记使用和人口研究。

2。材料和方法

2.1。DNA提取和测序

高质量的制备高分子量基因组DNA进行了成熟的野生型h . crudus女性在戴维收集,佛罗里达。标本形态学鉴定,保存在100%乙醇,并存储在昆虫向量−80°C生态实验室、劳德代尔堡(FLREC)研究和教育中心,佛罗里达大学。整个身体昆虫组织与无菌均质杵在2毫升的液氮。均质化后,总基因组DNA提取的冰冻的成人使用试剂盒Gentra Puregene®基因组DNA工具包辅以10倍基因组®全基因组提取协议。纯度和浓度进行了测试使用NanoDrop™Microvolume分光光度计和量子位®荧光定量技术(热费希尔科学,https://www.thermofisher.com/us/en/home.html)。纯度高1.8和基因组比浓度> 30 ng /μL是全基因组测序所需。一旦清除纯度和浓度是直接寄给你的样品测序,佛罗里达大学的跨学科的生物技术研究中心(UF-ICBR)。样本测序使用PacBio续集II SMRTbell®长读测序技术40 x覆盖率(太平洋生物系统,https://www.pacb.com/)。

2.2。基因组组装和注释

序列组装、校准和核苷酸成分进行了计算与佛罗里达大学的超级计算机,HiPerGator 3.0。HiPerGator集群提供的处理器和内存密集型计算节点的基本的bash命令行操作。新创装配序列通过CANU v2.0执行读取操作汇编专业组装PacBio序列分三个阶段:修正,修剪,和组装23]。蛋白质编码基因被确定使用NCBI的无脊椎动物线粒体基因子仪(NCBI,https://www.ncbi.nlm.nih.gov/orffinder/),转移rna被确定使用亚纹v1.2 (24],核糖体rna被确定使用水户网络服务器(25]。被认为是目前公认的控制区域之间rrnL (rRNA-12S)和Ile-Gln-Met tRNA集群。核苷酸多样性和成分分析与HiPerGator也执行。Postannotation对齐在大型使用肌肉执行算法X(26]。

2.3。系统发育分析

系统发育分析是评估使用九昆虫线粒体核苷酸序列。九种昆虫,四个non-Hemipteran昆虫和四个半翅类昆虫选择进行分析(表1)。物种的线粒体基因组序列和注释从基因库下载从八种昆虫和Fasta文件格式是一致的h . crudus使用肌肉线粒体Fasta文件算法在大型X用默认设置(26]。一旦对齐,进化的历史被执行毫升推断法和Tamura-Nei模型最适合计划(27]。可能性最高的树日志(−140533.20)所示的比例相关类群是相关的。启发式搜索树得到使用neighbor-join和BioNJ算法来估计可能性最大的复合(制程)与一个优越的似然值。分支长度测量的每个站点的替换数量共有10个核苷酸序列。密码子的立场分析1,2nd3理查德·道金斯,非编码顺序。总共有21821个职位在最终的数据集。

3所示。结果

3.1。基因组大小、组织和结构

线粒体基因组的组装叠连群证明h . crudus是一个环状DNA分子的长度15848个基点。线粒体基因组包括37个基因,13 pcg 22 tRNA基因,和2 rRNA核糖体基因(图2、表2)。下的新序列提交基因库加入数量(MW057863)。主要链(α链)携带的大部分基因(8 pcg 14图示),而其余小链上的基因是编码(β链)。mitogenome at富集区的范围从14720年到15848年英国石油公司与rrnL和tRNA-Ile(图之间的位置2)。的核苷酸组成h . crudus线粒体DNA是一个= 7097 (44.8%),T= 5279 (33.3%),G= 1341 (8.5%)C= 2128(13.4%)的15845个核苷酸。基因组组织通常遵循标准的祖先昆虫线粒体基因组计划(图3)。

3.2。蛋白编码基因

线粒体DNA的h . crudus包含全套pcg通常出现在动物线粒体DNA。pcg排列在昆虫的基因组根据标准的顺序(图3)。pcg的假定的起始密码子是那些先前已知的动物线粒体DNA,即。,ATG,丙氨酸,ATA, ATC GTG, TTG和GTT(表2)[28]。常见的启动密码子ATG可以分配给大部分的蛋白质编码序列,无一例外。两个蛋白质编码区域,ATP6 / ATP8和ND4 / ND4L重叠和转换来自同一个cistronic mrna。除了控制区域,我们观察到18非编码区域范围从1到1210个基点(图2、表2)。非编码控制地区h . crudus线粒体基因组延伸1129 bp和位于最后的tRNA之间(tRNA-Val)和Ile-Gln-Met tRNA集群。有许多独特的内TA-dinucleotides TTA-trinucleotide重复h . crudus线粒体基因组序列,类似于微卫星序列差异。AAAATGTCAAAAATTTGGACT重复21元的主题31日

3.3。系统发育分析

系统发育分析显示,执行Haplaxius crudus解决与摘要研究选择性(Delphacidae)强有力的引导支持(100)(图4)。也有强大的支持(100年)蚜虫aurantii(蚜虫)解决附近h . crudusn .选择性。一般来说,有强有力的支持(100年)为每一个进化枝,包括订单的昆虫:半翅类进化枝中h . crudus,n .选择性,答:aurantii,Dolycoris baccarum,十七tredecassini,包括甲虫类进化枝Sitophilus oryzaeChauliognathus蔽光的包括,蜻蜓目进化枝Nannophya pygmaea,和双翅目包括进化枝黑腹果蝇(图4)。基于两两比较,n .选择性也显示了最高水平的序列同源性分析类群中,不同h . crudus28.3%(表3)。所有其他类群不同h . crudus至少30.7%(表3)。

4所示。讨论

我们的完整mitogenome组装Haplaxius crudus使用PacBio续集II SMRTbell™测序技术。的h . crudus线粒体DNA展示了典型的半翅类昆虫基因顺序(10,11)这是昆虫的祖先的基因顺序(10]。基因重排等半翅类的家庭并不少见平坦的bug(扁蝽科),蚜虫(蚜科),和烟粉虱(粉虱科)6,7]。此外,h . crudus拥有三个额外的混合产品图示;一个NAD2编码区域内,一个在rRNA-16S,和一个立即上游at富集的控制区域。而h . crudus线粒体基因组的相似n .选择性l . striatellus在内容和分类学上,它是独一无二的基于额外的转运rna的存在。Cixiidae被接受为妹妹集团Delphacidae基于形态学和序列同源性。这两个n .选择性l . striatellus有独特的mitogenomes相对于其他昆虫物种都有主要的反演,将NAD6上游的脯氨酸和苏氨酸转运rna(而不是下游)tRNA-Pro和tRNA-Thr倒顺序是P- - - - - -T(不T- - - - - -P在其他昆虫)。此外,n .选择性拥有两个额外的半胱氨酸tRNA NAD2下游,导致Cys-Cys-Cys-Trp-Tyr的tRNA顺序,而标准顺序昆虫Trp-Cys-Tyr [5]。额外的图示和偏差的存在的基因顺序也不足为奇h . crudus。的长度h . crudus线粒体基因组在即时观察到对于大多数昆虫线粒体基因组,包括其他节肢动物(29日]。

的核苷酸组成h . crudus线粒体基因组是有偏见的,通常观察到昆虫线粒体基因组(5]。半翅类昆虫昆虫从亚纲Fulgoromorpha Coleorrhyncha,异翅亚目通常AC倾斜(30.]。控制区域h . crudus脊椎动物的线粒体基因组对应控制区域mitogenomes和包含转录和复制的来源网站31日]。在h . crudus18岁的线粒体基因组非编码区域范围从1到1210个基点观察除了控制区域。这个区域对应于转录和replicational控制地区典型的昆虫线粒体基因组,也称为at富集地区。这不是常见的昆虫之一Adoxophyes线粒体基因组有26个非编码基因间区域(32]。在这种昆虫,控制区域不太可能不如线粒体基因组编码区域的变量由于在含量高,因此限制了有用性作为诊断标记(33]。观察到的重叠与tRNA-Ile / tRNA-Gln由李等人的结果是一致的。32和莱辛等。34),重叠记录编码区域(ATP8 / ATP6和ND4 / ND4L)符合重叠在其他昆虫(15,32,34,35]。独特的内AAAATGTCAAAAATTTGGACT重复h . crudus线粒体基因组序列类似于微卫星序列差异,同时又有可能被用于人口遗传学研究。系统发育分析在大型X证明了h . crudus单元与半翅类昆虫在家庭Delphacidae蚜科毫升分析使用Tamura-Nei模型证实了假定的血统h . crudus在亚目Auchenorrhyncha。派系的类群答:aurantii(MN397939.1)和n .选择性(NC021748.1)单元h . crudus(MT385107)。线粒体基因组可能提供一个更好的方法来解决棘手的系统发育关系比单基因分析3,33,36]。

线粒体基因组的序列h . crudus的目的是成为一个资源来帮助未来的系统发育和种群遗传学研究cixiids和h . crudus,分别。由于多个编码区域的存在,保守的地区,和可变区域,利用完整的线粒体基因组将成为一个有价值的系统发育标记更完整的线粒体基因组序列生成的其他物种Haplaxius,其他部落Oecleini属,和多组cixiids一般为了更好地理解大的系统发育关系和经济上重要的集团。

数据可用性

数据存入基因库(https://www.ncbi.nlm.nih.gov/genbank/加入)。MT385107。公布的数据将被出版,所以一个注释Fasta文件提供一个补充文件。

的利益冲突

作者宣称没有利益冲突。

确认

作者衷心感谢国际社会培植戈斯(ISA)和佛罗里达大学的实验室的研究支持。此外,作者要感谢HiPerGator IT人员和支持人员在佛罗里达大学的支持和贡献。作者感谢UF-Emerging病原体研究所的种子资金。这项工作也由与农业部合作协议,佛罗里达州孵化项目- ftl - 005539,佛罗里达大学植物病理学部门。

补充材料

完整的线粒体基因组注释Fasta文件(文件名:Hcr_mtgnm)提供。序列还没有发布的基因库的时候提交所以序列是不提供的。(补充材料)