文摘
大部分的人类基因组转录成rna,但是只有少数的这些地区产生蛋白质编码mrna其余区域则是转录成非编码rna。长非编码rna (lncRNAs)闻名的有影响力的监管角色在多个生物过程如印记,剂量补偿,转录调控,拼接。蛋白编码基因的生理功能都进行了广泛的特点通过多能干细胞基因组编辑已经在过去的30年;然而,研究lncRNAs基因组编辑技术的诞生,近年来关注。在这里,我们总结一下最近的进步解剖lncRNAs基因组编辑技术的角色已经和突出潜在基因组编辑工具用于检查的功能已经被lncRNAs。
1。作品简介:发现lncRNAs表达多能干细胞
多能干细胞已经被认为可以无限自我更新和分化成专门的细胞类型的所有三个胚芽层。因此,他们已经作为一个重要的在体外研究早期发展和生成一个模型系统在活的有机体内genome-edited动物模型来分析基因的生理功能。此外,他们作为细胞来源用于再生医学治疗黄斑变性最近[1]。最常用的两个类型的已经被认为是胚胎干细胞(ESCs),源自囊胚的内细胞团,和诱导多能干细胞(万能),建立了从体细胞重编程。
长非编码RNA (lncRNAs) > 200 bp长的RNA转录缺乏编码能力。大多数lncRNAs迅速发展在进化过程中,少数lncRNAs通过物种(守恒2]。的快速进化lncRNAs可以部分解释为lncRNAs转位因子的存在,因为te是主要贡献者lncRNA筹措和多样化的3]。在过去的二十年里,表达阵列最初应用于识别小说lncRNAs [4- - - - - -6]。后,编码项目财团和幽灵财团用高通量测序(高温超导)方法来识别小说记录从一个基因组7,8]。目前,有87774 ~ lncRNAs老鼠细胞中发现和在人类细胞中~ 96308 lncRNAs NONCODE数据库(9]。lncRNAs已经建立的数据库目录小说lncRNAs及其功能(表1)[10,11]。鉴于已经的重要性,进一步编目lncRNAs是必不可少的在已经被我们理解复杂的监管网络。高温超导技术的进步,ChIP-seq实验显示组蛋白修饰的标记基因转录单位。H3K4me3被发现一个标记基因启动子而H3K36me3标志着身体的12- - - - - -14]。因此,H3K4me3结合H3K36me3可以定义一个转录基因的位置(15]。与组蛋白标记识别的应用离散转录蛋白编码基因之间的单位,第一个全基因组发现长基因间的非编码rna (lincRNAs)进行了四种细胞类型包括胚胎干细胞(ESCs) [15]。同样的研究发现,核心多能性监管机构Oct4 Sox2, Nanog推lincRNAs的表达,进而调节ESCs的扩散(15]。这些发现表明lincRNAs监管机构的ESCs一样重要。大多数发现lncRNAs功能(16]。他们可以参与调节多种细胞过程如转录、RNA拼接,翻译规范(表2)[17- - - - - -19]。然而,其确切作用已经被大多是无特征。基因组编辑方法已被广泛用于探索蛋白质编码基因的功能。这是一个黄金标准来演示一个基因的作用。然而,基因组编辑基于同源重组效率低下,尤其在人类已经被(20.- - - - - -23]。引入分子剪刀,如锌指核酸酶(ZFN)转录activator-like效应核酸酶(取得),定期和集群空间短回文重复(CRISPR / Cas9)系统,在这一领域允许高效的基因组已经被编辑和其他细胞类型(24- - - - - -28]。这些基因组编辑技术的最新进展允许他们更有效和广泛的使用在已经被lncRNA函数的分析。在这项工作中,我们回顾以前的研究为经典lncRNAs基因组编辑和总结最近的学习成果lncRNAs已经通过小说基因组编辑技术。
2。在已经被击倒lncRNAs
一般策略研究lncRNAs已经被认为是RNA干扰(RNAi)由短发卡RNA(成分)或小干扰RNA (siRNA)。然而,RNAi不适合许多lncRNAs功能丧失的研究。例如,lncRNAs的分子功能独立的记录,也就是说,这些lncRNAs的功能,从转录本身而不是从转录的产物。此外,一些lncRNAs,如MALAT1在细胞核,非常丰富,所以RNAi是低效的消耗这些成绩单(62年]。研究lncRNAs的生理意义,淘汰赛的ESCs或胚胎需要生产纯合子基因敲除的动物。因此,它是至关重要的使用基因组编辑功能丧失研究lncRNAs在这些情况下实现最干净的损耗的表达式。
2.1。代lncRNA淘汰赛中潜在挑战
分子剪刀被用来创建点突变的蛋白编码基因的关键领域,反过来又促使翻译提前终止的。不同于蛋白质编码基因,转录的功能域为大多数lncRNAs仍不清楚;因此,它是不可能研究lncRNAs功能丧失点突变。因此,敲出一个lncRNA,完全或部分删除lncRNA基因是必需的。为了避免来自lncRNA击倒的间接影响,我们需要操作lncRNA基因组位点而不影响其他基因的基因特性。然而,在某些情况下,这是很难实现的目标。的lncRNAs位于其他基因的启动子区域或与蛋白编码基因的外显子(数据重叠1(一)和1 (b)),其中部分删除通过基因组编辑只能应用在这种情况下,其他基因的表达仍不受影响。在蛋白质编码基因的基因内区,lncRNAs lncRNA基因的删除,没有令人不安的内含子的剪接地区是必需的(图1 (c))。的lncRNAs基因间区域(图1 (d)),这是遥远的从其他基因,可以很容易地通过基因组编辑与蛋白质编码基因技术在类似的方式。然而,基因间lncRNA loci重叠和增强剂(图1 (e)),比如增强器rna,与基因组编辑也很难研究,因为这些位点的缺失可能会干扰的功能增强剂和遥远的基因的表达影响63年]。因此,在本节中,我们将讨论基因间lncRNAs不重叠的淘汰赛中增强剂。
(一)
(b)
(c)
(d)
(e)
2.2。删除lncRNA基因
Whole-gene消融的lncRNAs学习它们的功能(图是一个经典的方法2(a))。初始工作lncRNA淘汰赛在鼠标ESCs但是ESCs不是人类,因为早期的建立和易于操纵的同源重组(64年]。ESCs已被用来作为模型来研究印记,这发生在ESC分化(65年]。第一个lncRNAs已确定,摧毁了鼠标的ESCs lncRNA段H19。孕产妇的同源recombination-mediated删除段H19和其侧翼序列导致印迹基因的表达激活Igf2的删除,而父亲的副本段H19没有影响Igf2表达式[66年),建议段H19作为一个lncRNA调节母性Igf2印记。的lncRNA,Terc,397个基点的端粒酶RNA组件复杂,是另一个主要的例子lncRNA淘汰赛(67年- - - - - -69年]。消融的,TerclncRNA基因导致端粒缩短,随后影响染色体的稳定性和鼠标的ESCs扩散(70年,71年]。提高基因打靶效率,介绍了分子剪刀在已经被工程师lncRNAs。ZFNs结合使用同源重组删除lncRNA表达的高度MALAT1在鼠标的ESCs。从MALAT1ESCs淘汰赛,纯合子MALAT1删除老鼠已经生成(62年]。取得也用来摧毁lncRNAs斑马鱼(72年]。CRISPR / gRNA系统的出现,基因组编辑的效率比以前高。这是证明双gRNAs可以应用有效地摧毁人类细胞系lncRNAs [73年]。使用CRISRP / gRNA系统、全身lncRNA (HPAT5)是首次成功地摧毁了人类的ESCs [59]。最近,可以删除整个段H19转录单位和印迹控制区域(ICR) ESCs的CRISPR / Cas9系统(74年,75年]。这个成功恢复Igf2表达和切实提高效率从产雄受精卵生成可行的老鼠和单倍体的ESCs [74年,75年]。这些研究证明lncRNAs通过基因组的完整删除编辑作为一个有效的方法来发现lncRNA ESCs函数在微分。
某些lncRNAs非常长,所以很难删除一个长篇lncRNA基因。在这些情况下,部分删除lncRNA基因通过同源重组可以申请功能丧失(图研究2(b))。的lncRNAXist,发现在过去的世纪,在这一战略中被淘汰。Xist,一个~ 18 kb lncRNA位于X染色体,基因剂量补偿功能的中央监管机构在ESC分化(76年,77年]。同源重组的策略是用来删除(~ 7 kb)的一部分Xist在鼠标的ESCs [78年),但淘汰赛效率极低。超过2500个克隆筛选来确定一个纯合子基因敲除克隆。通过这种方法,Xist被发现在ESC分化所需的完整的X染色体失活(76年,77年]。异构的淘汰赛Xist揭示了一个关键的角色Xist女性胚胎发展(79年]。部分删除lncRNAs也可以帮助我们确定在lncRNAs RNA的作用域。通过同源的ESCs recombination-mediated击倒,890 bp的区域imprinting-related lncRNAKCNQ1OT1被发现是必不可少的吗KCNQ1OT1招募Dnmt1蛋白质的差异甲基化区域(80年,81年]。与基因组编辑技术的出现,megabase-scale基因缺失与ZFN [82年,取得83年,84年),或CRISPR [85年是可以实现的。CRISPR技术产生的力量击倒的lncRNAs lncRNA被删除了莉婉ESCs。一双sgRNAs结合CRISPR可以删除23 kb的57 kb莉婉通过受精卵注入86年]。此外,如果使用多个sgRNAs淘汰赛效率达到33% (86年]。这种技术进步可以促进我们在已经被删除完整的超大lncRNAs。
发现更多lncRNAs和进一步了解lncRNAs的功能,相应的recombination-based lncRNAs淘汰赛已经更广泛应用于lncRNAs在已经被删除。在其中一项研究中,18 lncRNA基因被淘汰在鼠标的ESCs生产lncRNA-knockout老鼠(87年]。替换lncRNA轨迹的lacZ记者被允许的时空表达模式的可视化这些lncRNAs动物模型。另一个类似的研究创造了淘汰赛ESC行20 lncRNAs通过基因打靶和ESCs使用这些建立基因敲除小鼠研究lncRNAs在老鼠的广泛的角色88年]。这些老鼠lncRNA-knockout构成价值的补充研究lncRNAs的生理作用的资源。
2.3。敲在聚腺苷酸化信号
另一个策略来防止lncRNA成绩单的兄弟是生产聚腺苷酸化(聚)信号在转录起始位点(TSS)(图2(d))。Biallelic插入一个副本或聚(信号的多个副本的开头lncRNA TSS将导致基因转录提前终止和随后的失败lncRNA生产(89年]。然而,对于lncRNAs替代促进剂和转录TSS,这种策略可能不适用。这种策略是受雇于ESCs lncRNA描述的功能Fendrr在胚胎发展(90年,91年]。玻利亚insertion-mediated律Fendrr淘汰赛E13.75发生故障导致心脏和胚胎死亡的老鼠,而过度的Fendrr通过BAC救了表型。此外,这种方法可以防止lncRNA生产没有令人不安的转录活动本身。因此,这种方法允许函数的distinguishment lncRNA本身的基因组的转录活动。这是由印迹lncRNA的例证Airn。的Airn基因与Igf2r启动子区域和转录相反的方向Igr2r(92年]。的Airn基因跨度超过100 kb的老鼠基因组和编码多个拼接亚型(92年]。的表达Airn在父亲的等位基因压制的父亲表达Igf2r,Slc22a3,Slc22a2在ESC分化(92年,93年]。令人惊讶的是,截断的Airn插入的聚(TSS后并不影响信号Igf2r基因表达(94年]。此外,重叠的转录Airn启动子区域能充分抑制Igf2r在ESC分化(94年]。此外,Airn基因是非常大的(> 100 kb),可能难以摧毁。这项研究还表明,聚(信号可能是一个更有效的方法来防止宏观lncRNA基因的表达比whole-gene删除。
2.4。删除lncRNA启动子
的倡导者lncRNAs来驱动他们的表达至关重要。基因间lncRNAs,另一个策略来扰乱他们的表达依赖于去除lncRNA启动子的基因组编辑(图2(c))。同时有两个gRNAs表示,启动子lncRNAs可以有效地实现删除沉默lncRNA表达式(95年]。从经典lncRNA就是一个例子段H19的敲除小鼠允许推导即[96年,97年]。类似于段H19淘汰赛,删除lncRNAs dmr的段H19和Gtl2在单倍体的ESCs CRISPR压制段H19和Gtl2表达式,并允许semicloned老鼠从单倍体的ESCs的生成16]。这些建议删除lncRNA启动子区域作为一个有效的方法已经被沉默lncRNA表达式。
2.5。结合不同的lncRNA基因敲除的方法
上面的示例显示一个方法是不足以确定lncRNAs的所有可能的功能。多个基因组编辑策略需要为了发现lncRNAs及其转录位点的功能已经被。这是研究的证明困扰在的ESCs lncRNAs。阴小干扰rna介导等人发现困扰lncRNA损耗和删除的一小部分困扰基因一致的进一步增加引起的HOXA表达对维甲酸(RA)诱导ESC分化(63年]。然而,大量的删除困扰基因从7.3 kb到58 kb造成了相反的效果。中断的困扰表达式由CRISPR / Cas9-mediated 2.3 kb的淘汰赛困扰启动子区域或插入4×聚(转录起始点的信号后也会导致增强的激活HoxA集群ESC分化后的基因。这些观察表明不同的角色在调节RA-induced lncRNAs及其相应的基因位点HOXA表达式。此外,本研究也引起lncRNAs的角色应该检查在不同的方面和多个方法揭示lncRNA基因位点的功能及其在已经被记录(数据2(e)和2(f))。
3所示。在已经被lncRNA报告基因
创建lncRNA记者基因已经被允许我们跟踪lncRNA表达式在活的有机体内和研究lncRNAs的监管。为了创建报告基因的lncRNAs lncRNAs和蛋白编码基因之间的差异必须被考虑。不同的蛋白编码基因,lncRNAs不编码蛋白质。出于这个原因,它是不可能让荧光融合蛋白通过添加2裂解肽或引入内部核糖体进入位点(IRES)创建lncRNA报告基因。lncRNAs添加蛋白质编码基因序列可能影响lncRNAs的定位和功能,而包含IRES序列可能导致核糖体的招聘lncRNAs和转换lncRNAs mrna。因此,创建lncRNA promoter-driven记者需要基因组编辑lncRNAs lncRNA敲门的轨迹或引入一个独立表达转基因基因组(数字3(一)和3(b))。然而,报告基因的敲lncRNA轨迹将会摧毁lncRNA基因的一个副本并影响邻近基因的表达,如果在独联体lncRNA行为。引入lncRNA promoter-driven转基因记者可能不能反映真正的表达模式lncRNAs因为增强剂的使用和消音器是不同的在不同的基因位点。所有这些情况需要考虑之前lncRNA记者PSC细胞系的建立。
已经被认为是最早的应用lncRNA记者lncRNA转录位点表达外源基因。一个主要实例Rosa26轨迹,用于结构上的基因过表达~ 20年。的Rosa26轨迹在1991年首次被发现的基因诱捕的ESCs [98年]。之后,它被发现编码两个核记录,没有重要的开放阅读框(orf),表明他们是lncRNAs [99年]。打断这轨迹前病毒的β地理报告基因导致无处不在的苷酶的表达,这表明Rosa26轨迹编码普遍表示lncRNAs老鼠(99年]。从那时起,Rosa26轨迹被用作基因遗传安全港兄弟实现无处不在的转基因表达(One hundred.,101年)(图3(c))。如今,人类的Rosa26轨迹也发现,许多基因已经被撞的Rosa26ESCs轨迹的生成兄弟老鼠和研究这些基因的功能(101年,102年]。
lncRNAs参与在开发过程中关键基因调控过程。记者lncRNAs系统也用于监控ESCs的监管地位重要的生物过程,在分化。一个实例是使用父亲的姓氏段H19报告基因在ESC分化监视印迹状态。自段H19表达对母本印记至关重要,以避免中断的段H19基因,转基因段H19promoter-drivenlacZ和PLAP作为记者,以反映变化的印记状态(103年)(图3(d))。使用这个系统,记者1.1 kb控制元件调节母性被发现段H19印记(103年]。最近的一个例子应用的ESCs的lncRNA记者隔离天真的人类。内源性逆转录病毒HERVH被发现是ESC-specific lncRNAs控制多能性(17]。HERVH启动子(LTR7Y)只在细胞活跃囊胚的内细胞团。因此,转基因LTR7Y-driven GFP记者可以用于单纯状态人类ESCs的隔离104年)(图3(e))。这是还发现,报告基因的启动子驱动HERVH-derived lncRNAESRG标志着天真的人类的ESCs [105年)(图3(e))。所有之前的例子展示的力量lncRNA报告基因研究lncRNAs的监管和跟踪他们的表情。
4所示。激活和镇压lncRNAs基因组编辑技术
因为CRISPR / Cas9-based基因组编辑技术可以有效地删除大片段基因组的(86年),它被用来执行全基因组筛选lncRNA功能(106年]。多个gRNAs被用来对付一个lncRNA完成lncRNA基因表达的有效消融;因此,配对gRNA图书馆只能目标几百lncRNAs [106年]。使用这种方法,lncRNAs癌细胞生存已确定的关键。另一种方法来调节lncRNAs CRISPR-Cas9是通过CRISPR干扰(CRISPRi) [107年),这是构成停用Cas9 (dCas9)融合转录阻遏物,如带锁。通过招聘dCas9-KRAB lncRNAs的启动子区域与多个gRNAs,阻碍了lncRNAs转录阻遏蛋白的表达被带蛋白质(图4(一))。CRISPRi应用于操纵lncRNA (GAS5,段H19,MALAT1,NEAT1,,TERC,XIST)K562细胞中表达108年]。除了这些lncRNAs CRISPRi应用于探测cheRNA的功能绅士在K562和人类的ESCs H1 [109年]。这是在全基因组范围内适应执行lncRNA镇压屏幕在各种细胞类型包括人类诱导多能干细胞(万能)110年]。通过这种方式,许多lncRNAs被发现作为人类万能干细胞的自我更新监管机构(110年]。基因组编辑的效率是由染色质的表观遗传状态,如染色质构象。基因组编辑效率和取得CRISPR常染色质的基因是高于在异染色质111年]。这可能偏见介绍公司CRISPR-mediated筛选基因表达的监管机构。
(一)
(b)
(c)
(d)
(e)
(f)
修改CRISPR适用不仅消耗基因表达激活基因表达。CRISPR激活(CRISPRa),它利用dCas9融合多个副本的病毒转录激活物如VP16强劲,激活基因表达将RNA聚合酶II TSS (107年,112年]。这种方法可以用来激活ESCs lncRNA表达(图4 (b))。传统上,在lncRNAs的功能研究方面,质粒或transgene-based lncRNAs的过度使用。然而,不同于蛋白质编码基因,一些lncRNAs函数在转录过程中,也就是说,生产记录(63年,94年]。因此,外源表达lncRNAs可能不反映lncRNAs的真正功能。此外,多个亚型存在一些lncRNAs [94年]。很难过多表达所有亚型在同一时间。更重要的是,对于一些lncRNAs缺乏聚尾巴或来自内含子113年),重要的是克隆分数超过其表达式。此外,在独联体lncRNA表演,引入lncRNA转基因超表达的其他基因的位置不能反映lncRNAs真正的功能。以上困难lncRNA超表达可以征服的使用CRISPRa lncRNA激活。最近,Joung集团应用在全基因组范围内识别lncRNAs CRISPRa呈现黑素瘤细胞的耐药性vemurafenib (114年]。CRISPRa直接激活内源性基因的表达他们的基因位点107年),因此,它使lncRNA转录的功能区域,使同时激活多个lncRNA亚型。这些方法可以应用到已经被lncRNA监管机构的功能研究多能性维护。
5。其他潜在应用的研究已经被lncRNAs基因组编辑工具
CRISPR / Cas9是一个多才多艺的基因组编辑和表达调控的工具。除了应用程序编辑ESCs的遗传位点,CRISPR / Cas9可以采用调查lncRNA生物学ESCs的其他方面。大量的核lncRNAs可能与染色体交互调节基因的表达(115年,116年]。表达的抑制这些lncRNAs CRISPR / Cas9-mediated截断推动者邻近基因的差别会导致对这些基因的表达(109年,117年]。研究这些lncRNAs的角色,一个有价值的工具,名为CRISPR-Display被开发提供一种lncRNA-protein复杂DNA位点(118年]。功能的RNA域可以插入gRNAs,允许识别的直接影响ectopically针对lncRNAs染色质(图4 (c))。此外,该系统可以多路调查的影响招聘lncRNAs同时在几个基因位点。此外,最近发现CRISPR系统可以与细胞rna编辑。Cas9直接结合的DNA或rna削减援助PAMmers [119年]。这使得信使RNA的RNA的乳沟或下拉通过Cas9-gRNA RNA-RNA杂交(119年]。它可以用来分裂lncRNAs Cas9或下拉与dCas9 lncRNAs ESCs分析的潜在相互作用蛋白质lncRNAs(数字4 (d)和4 (e))。有了这个系统,dCas9与GFP融合是针对mrna跟踪他们定位在活细胞的指导sgRNA [120年]。这个系统也可以用来研究lncRNA地位已经和跟踪lncRNA本地化生活已经被(图4 (f))。
6。结论和观点
近年来,成千上万的lncRNAs已确定。他们中有几个是在已经扮演了一个重要的角色(116年]。然而,基因组编辑技术的发展刚刚开始被广泛应用于已经被研究lncRNAs的功能。考虑的不同功能lncRNA基因位点及其记录(s),多个基因组编辑方法应该用于区分的功能已经被lncRNA成绩单及其基因位点。lncRNAs是重要的生物标志物在胚胎发育和疾病进展。建立lncRNA记者在活的有机体内将使这些过程的监控。新兴CRISPR基因组编辑技术的发展打开了新的大门已经被lncRNA生物学。未来的研究应该采取这些小说策略已经被调查lncRNAs的功能。这些基因组编辑工具还应该利用探索lncRNAs生理功能的一个系统的范围。
的利益冲突
作者宣称没有利益冲突的存在。
确认
支持这项工作由天津城市的自然科学基金(15 jczdjc65600)和中国国家科学基金会(31671352)和资金的国家千青年人才项目和南开大学。