生物医学研究的国际

在这一页上

文摘介绍材料和方法结果讨论结论数据可用性的利益冲突作者的贡献确认补充材料引用版权相关文章

研究文章|开放获取

体积2022年| 文章的ID4035462| https://doi.org/10.1155/2022/4035462

预测RNA 5-Methylcytosine网站利用序列的基本特点和分布

Lei陈 ,^1、2 ZhanDong李,³ 石漆张,⁴ Yu-Hang张 ,⁵ 道黄 ,^6、7 和Yu-Dong蔡 ¹

学术编辑器: Hesham h·阿里

收到了 2021年9月15日

修改后的 2021年12月07

接受 2021年12月22日

发表 2022年1月13日

文摘

甲基化是一种最常见的和相当大的修改在生物系统由多个酶。最近的研究表明,甲基化已被确定在不同的RNA分子。RNA甲基化修饰有各种类型,如5-methylcytosine (m⁵C)。然而,对个人甲基化网站,其功能仍有待阐明。测试所有的甲基化网站在很大程度上依赖于高通量测序技术,这是昂贵和劳动力消耗。因此,计算预测方法可以作为替代品。在这项研究中,多个机器学习模型被用来预测可能的m RNA⁵C网站信使rna序列的基础上,在人类和小鼠。每个站点是由来自几个特性 - - - - - -即RNA的子序列包含中心等网站。强大的max-relevance和min-redundancy (mRMR)特征选择法来分析这些特性。结果特性列表是输入增量特征选择方法,结合四个分类算法,建立高效的模型。此外,相关的网站功能使用的模型也被调查。

1。介绍

甲基化是一种最常见的和相当大的修改在生物系统由多个酶。生物甲基化的底物不同,DNA是最常见的。先前的研究在甲基化主要集中在DNA甲基化,揭示其在开发过程中特定的转录活动的调控作用,老化,和发病机理1]。然而,最近的研究普遍发现甲基化不同的RNA分子,包括mRNA, snoRNA, microrna,核糖体RNA(不仅限于功能mRNA) [2]。核糖核酸甲基化使基因表达的转录后的控制通过改变细胞的RNA如何与其他组件的相互作用的一个重要组成部分epitranscriptome [3]。核糖核酸甲基化是积极参与转录后的监管生物过程,如RNA拼接,运输、稳定、可译性,具有较强的与哺乳动物发育和疾病的关系(4- - - - - -6]。

在各种各样的RNA甲基化修饰,N⁶-methyladenosine (m⁶),氮上的甲基化修饰在第六的位置腺苷基地,是最普遍的内部mRNA修改,占总数的50%甲基化核苷酸(2,7]。米⁶广泛影响mRNA的新陈代谢,广泛分布在各种各样的RNA转录,包括编码和非编码区域。m的沉积⁶转录组的修改有其独特的模式:m⁶修改网站有一个典型的共识序列DRACH (D = G, A,或U;R = G或;H = C或U),这是广泛分散在编码序列和翻译区(UTR)和终止密码子区域附近的高纯度8]。最近的证据表明,m⁶pre-mRNA拼接的RNA甲基化起着至关重要的作用,信使RNA稳定监管、mRNA出口,信使RNA降解,翻译规范和microrna的处理9- - - - - -11]。米⁶修改是动态的,它可能是可逆的,可能不同的基因和不同组织(12,13]。的数量增加⁶映射研究特定基因的列表包含一个不成比例的高水平的m⁶一个被揭露。例如,韩寒等人发现一系列的m⁶甲基化基因与突触前膜、突触后膜,和突触生长在阿尔茨海默病(AD)小鼠模型,表明m⁶一个可能参与广告的出现14]。而米的功能⁶修改是上下文相关的,动态的,许多m⁶物种间散播他们的网站是守恒的。三分之一的哺乳动物mrna共享相同的m⁶修改,并与单核苷酸特异性(很多都是守恒的15]。

另一种RNA甲基化改性,即5-methylcytosine (m⁵C)碳5甲基化的胞嘧啶,也作为一个重要基因表达的监管机构,包括RNA本地化,核糖体的组装、翻译调控、mRNA稳定。在所有的mRNA甲基化网站,m的比例⁵在人类细胞中C可以高达20% (16]。米的分布⁵C网站mRNA不是随机;在海拉和老鼠细胞,m⁵C甲基化是富含5和3utr而非编码区域(16]。像米⁶,米⁵C函数的动态行为的方式。米⁵C甲基化发生在睾丸的发育动态,帮助维持稳定的孕产妇mRNA在胚胎发育17]。

尽管RNA的甲基化在生物过程中起着关键作用,重视转录后的调控,其功能在个人甲基化网站仍有待阐明。测试所有的甲基化网站在很大程度上依赖于高通量测序技术,这是昂贵和劳动力消耗;因此,计算预测方法可以作为一个替代18]。如前所述,m的分布⁵C的mRNA有自己的浓缩模式并不是随机的。有足够的数据和统计方法,预测准确⁵C RNA甲基化网站,获得一个增强的理解他们的功能是可行的。

在这项研究中,多种机器学习模型应用于预测可能的m⁵C RNA信使RNA序列的甲基化网站的人类和老鼠。每米⁵C、包含等网站的子序列中心提取的RNA序列。的特点 - - - - - -即产生了由RNA2Vec [19)精制代表子序列。强大的max-relevance和min-redundancy (mRMR)特征选择方法20.)是用来分析所有功能。获得的特性列表是输入增量特征选择(IFS) (21)的方法,结合四个分类算法,建立高效的模型。除了预测模型,我们也研究了相关的网站功能使用的模型,试图发现特殊的模式在老鼠和人类⁵C网站。这些预测结果的比较可以帮助获得动态RNA甲基化的形象和构筑RNA甲基化网站和人类疾病之间的关系。

2。材料和方法

2.1。数据

米⁵C是一种常见的RNA在哺乳动物中修改。人类和小鼠m⁵C数据从一个先前的研究(iRNA-m下载⁵C,http://lin-group.cn/server/iRNA-m5C/download.html)[22]。事实上,人类的m⁵在第一次使用C数据23),从原始数据中提取从RMBase检索数据库(24]。原始数据是由CD-HIT处理程序(25),这样任何剩余序列的序列相似性小于0.7。因此,120积极和120 - m⁵C网站获得。至于老鼠米⁵C数据,它是构建在22]。这是直接从RMBase检索数据库(24)不是由CD-HIT加工项目(25),因为它的规模太小。鼠标数据由97积极和97 - m⁵C网站。网站在m⁵C网站有一些特别的模式,它可以帮助确定m⁵20 C网站RNA序列,上游站点和20下游站点捡起。这些网站的m⁵C网站中心建造了一个与41 bp子序列。一些功能将会从这个子序列中提取出代表m⁵C站点。

2.2。问题描述和研究设计

对于一个给定的RNA序列,有必要确定m⁵C网站。机器学习模型能给一个深度调查当前已知的m⁵C网站和学习一种特殊的模式做出预测。预测过程可以视为一个函数 ,制定在哪里表示该网站设置为人类或鼠标RNA序列输入网站是否是一个m表示⁵C网站。

一般来说,我们要发现一个优化函数,其损失是最小的。因为机器学习算法被用来设计等功能,我们采用以下步骤:(1)人类的任何网站或鼠标⁵C数据,网站周围捡起组成子序列,可以显示周围的信息调查的网站。这一步是部分中描述“特性工程”(2)每个子序列是由一定数量的特征,可以反映其基本信息。这一步是部分中描述“特性工程”(3)采用特征选择方法分析所有功能和生产功能列表。这一步是部分中描述“Max-Relevance Min-Redundancy (mRMR)特征选择”(4)IFS方法应用等特性列表找出哪些分类算法和哪些特性可以产生最佳性能(最小的损失)。这一步是部分中描述的“增量特征选择(IFS)。“四个分类算法的描述中使用IFS方法中可以找到部分的“分类算法。”部分中列出的损失是由一个测量“绩效评估”

2.3。工程特性

建立有效的模型识别m⁵C在RNA序列,是非常重要的从这个网站组成的子序列中提取基本特征,20上游站点和20下游站点。本研究采用了自然语言处理的方法来提取特征,这是进一步用于表示包含m的子序列⁵C站点。

RNA2Vec [19为每个]采用提取序列特性 - - - - - -即(子序列的长度 )。详细,该方法采用整个人类基因组语料库。滑动窗口技术被用来RNA序列分割成几个固定长度的单词。如果一个RNA序列长度制定了这是分成话说,说。获得所有的话都送入手套算法(26),一种Word2vec方法,提取的特征的话,即的特性, - - - - - -即。在这里,我们选择。特征4-mers直接检索https://github.com/HsiaoYetGun/MiRLocator/blob/master/RNA2Vec/RNAVectors.txt。每个4-mers由30特性。

给定一个41 bp长的RNA子序列党卫军,制定在哪里是米⁵C网站,我们从这个子序列中提取所有4-mers。因为总是对所有调查子序列相同,4-mers包含这个网站被丢弃。34 4-mers可以从每个RNA子序列。30特性得到RNA2Vec收集在一起,代表着子序列。因此,1020 ( )特征是采用编码每个子序列与41 bp。

2.4。Max-Relevance和Min-Redundancy (mRMR)特征选择

mRMR是一个强大的特征选择方法(20.,27- - - - - -30.),评估特征的重要性来自两个方面:(1)相关类标签和其他功能(2)冗余。互信息(MI)用于量化相关性和冗余。对两个变量和 ,他们的MI是计算在哪里和的边际概率密度和 ,分别为, 代表的联合概率密度和。一般来说,高MI表示强烈的相关性或高冗余的两个变量。mRMR方法试图保持低特性相关性高的类标签和其他功能冗余。然而,这是一个np难问题。mRMR方法采用启发式方法评估功能,哪些调查所有功能列表,即mRMR特性列表。在一开始,这个列表是空的。为每一个功能不在这个列表中,计算其关联类标签,来衡量 ,在哪里是一个变量代表类标签,冗余特性,已经在列表中,通过测量之间的平均MI和特性在当前列表。计算这两个值的差。区别是最高的特性选择并添加到列表。当列表中的所有功能,程序停止。功能在这个列表显示功能的重要性。一般来说,高排名的功能更重要的比那些低等级。

mRMR计划用于本研究从下载http://penglab.janelia.org/proj/mRMR/。为了方便起见,这是使用默认参数执行。

2.5。增量特征选择(IFS)

尽管mRMR方法产生一个功能列表,这仍然是一个问题,应该选择哪些特征来构造模型。针对这一点,本研究使用IFS方法(21),这可以帮助选择适当的特性对于任何给定的分类算法。详细的基础上mRMR特性列表,如果产生几个区间作为一个特征子集的一步。例如,第一特征子集mRMR顶部功能列表,第二个有前两个功能特征子集,等等。然后,一个模型可以构造基于一定的分类算法在训练数据,样品由功能在每个特性子集。所有构造模型评估了一个交叉验证方法(31日]。模型产生最佳性能拿起来被称为最优模型。在这个模型中使用的特征子集称为最优特征子集。

2.6。分类算法

如前所述,IFS方法需要一个分类算法。在这里,四个分类算法被使用,包括(1)随机森林(RF) (32),(2)支持向量机(SVM) [33),(3) - - - - - -最近邻(资讯)34),(4)决策树(DT) [35]。这些算法已经广泛用于解决各种健康问题(36- - - - - -48]。简单描述如下。

2.6.1。随机森林

射频是一个强大的和经典分类算法。事实上,它是一个包含几个DTs的算法。每个DT是使用两个随机选择过程。第一个过程是选择样本,而第二个过程是选择的特性。给定查询示例中,每个DT收益率预测。射频集成了这些预测与多数投票。尽管DT是一个相当弱分类算法,射频更健壮。因此,它总是一个重要候选人构建预测模型。

2.6.2。支持向量机

支持向量机是另一个强大的和经典分类算法。它的主要思想是寻找一个超平面分离在两类样本。然而,在许多情况下,不存在这样的超平面。SVM将原始数据映射与非线性模式在低维空间到一个新的数据在高维空间与线性模式。然后,超平面构造等新空间通过最大化样品在两个类之间的时间间隔。最后,它预测新样本的类标签根据超平面的这个新数据点属于哪一边。

2.6.3。 - - - - - -最近的邻居

然而,是一个简单而且有效的分类算法。它不是一个严格的机器学习算法,因为没有培训程序。几个计算步骤进行,以确定一个测试样本的类,如计算测试样本和训练样本之间的距离,排名所有训练样本的距离,选择排名靠前的训练样本(即。,最近的邻居),估计这样的类标签分布测试的样本,并预测类标签样本作为最高的分布频率。

2.6.4。决策树

它的目标是学习人类理解分类和回归模型。它通常使用IF-TEHN格式来描述特征的角色和权重在分类或回归模型,从而在白箱模型解释规则。到目前为止,已经提出了几种类型的DT。在这部作品中,CART算法采用基尼指数构建DT模型。

快速实现上述四个分类算法,我们使用相应的包在Scikit-learn收集(https://scikit-learn.org/stable/)。他们使用默认参数执行。

2.7。性能测量

在这项研究中,世纪挑战帐户集团(49)在10倍交叉验证(31日)是用来评估每个模型的性能。显然是两种分类模型建立;因此,MCC使用二进制问题如下: TP、TN、FP和FN代表真阳性的样本数据,真阴性,假阳性和假阴性预测,分别。世纪挑战帐户集团值范围从−1 + 1。当一个分类模型的性能最好,其MCC达到+ 1。

此外,我们进一步计算其他测量充分评估模型的性能,包括敏感性(SN)一样(回忆),特异性(SP),精度(ACC),精密, - - - - - -衡量。他们可以通过计算

2.8。频率特性的可视化

序列中的每个特性与四个网站了解生物序列中提取特征的意义。后一个分类算法得到最优特性,每个特性都捡起的相关网站,每个网站的频率计算和绘制插图作为一个酒吧。

3所示。结果

在这项研究中,我们采用了的特点 - - - - - -即由RNA2Vec代表了m⁵C网站。一些机器学习算法被用来分析这些特性,进一步构建高效的模型识别m⁵C在RNA序列。整个过程如图1。在这一节中描述的详细结果。

3.1。m的选择⁵C Methylation-Associated鼠标的功能

老鼠米⁵C数据,mRMR方法是1020年首先用来分析功能。一个mRMR特性列表。这个列表是送入IFS方法,综合四种分类算法。在每个功能子集,建立了一个模型基于一个分类算法和被10倍交叉验证进一步评估。每个模型的性能,包括锡、SP, ACC, MCC,精密, - - - - - -measurem补充文件中提供S1。MCC被选为测量的关键。因此,一条曲线绘制在图2世纪挑战集团定义为每个分类算法 - - - - - -轴的数量和特性 - - - - - -轴。为资讯、射频和支持向量机,他们可以提供完美的性能当最高3、10和3特性。相应的最佳资讯/射频/ SVM模型可以用这些特性。这些模型的详细性能表中列出1。所有测量值达到最大值为1.000。DT, MCC最高为0.990,可以通过使用195强特性。因此,最优DT模型建立与这些特性。其详细的性能是列在表中1。它可以观察到,所有测量都非常高。所有这些表明,模型与功能产生RNA2Vec非常有效的识别鼠标m⁵C网站,也证实了这些功能的实用程序来预测鼠标m⁵C网站。

3.2。m的选择⁵C Methylation-Associated特性对人类

为人类的米⁵C数据,同样的程序进行。四个分类算法的性能在所有可能的特征子集提供补充文件S2。同样,一个曲线绘制每个分类算法(如图3)。它可以发现四分类算法产生了MCC值最高的0.576,0.627,0.742,和0.790,分别。这样的表现获得通过使用前15名,84年、543年和114年的特性。因此,最佳DT /资讯/射频/ SVM模型可以设置这些功能。这些模型的详细性能表中列出2。显然,这些模型的性能远远低于模型老鼠。

3.3。频率特性分析

本研究的目的不仅是建立有效的预测模型⁵C网站还在米发现小说的模式⁵C站点,从而提供更多生物的见解。因此,我们进行了特征频率分析在这一节中。

老鼠米⁵C数据,建造了四个优化模型,采用列表中的一些高级特性。对于每一个模型,选择特性相关的每个站点的数量统计。条形图是绘制显示每个站点的数量(如图4)。节中详细讨论将获得“m5C Methylation-Associated鼠标功能。”

为人类的米⁵C数据,我们进行相同的操作。对于每一个优化模型,选定的数量特征与每个站点图所示5。显然,数据4和5截然不同的显示模式,表明老鼠和人类的区别⁵C网站。节“m5C Methylation-Associated特性在人类,”讨论。

3.4。与之前的模型相比

本研究使用了老鼠和人类⁵在[C数据报告22]。在这项研究中,几个不同的分类算法模型构建和评估10倍交叉验证,包括DT,射频,支持向量机,朴素贝叶斯、贝叶斯网和逻辑回归。模型的性能与DT,射频,支持向量机是列在表中3和4。便于比较,同样我们的模型与分类算法的性能还提供了在这两个表。老鼠米⁵C数据,我们的模型与DT略优于模型(22]相同的分类算法。至于其他两种分类算法,模型与其中一个给了完美的表现。为人类的米⁵C数据,DT提供更好的性能比模型(在我们的模型中22),而其他两种分类算法产生较低的性能比模型(在我们的模型中22]。然而,差距不是很大。作为一个整体,我们的模型和22几乎在同一水平上。

正如上面提到的部分,本研究的目的进一步在m有特殊的发现模式⁵C网站。这是本研究的独家贡献与之前的研究相比。

4所示。讨论

多个机器学习模型被用来区分样本/网站有或没有一种不同的RNA甲基化(人类或鼠标),专注于m RNA甲基化的重要模式⁵C (50- - - - - -52]。IFS的帮助下,最优数量的基本特征被选为RNA甲基化的预测。41元序列预测的分布特性进行了综述评价的区别的贡献不同的RNA核糖核酸位点甲基化(53]。详细分析的结果⁵C甲基化在下面可以看到鼠标或人体组织中,随着各自的分布模式。

4.1。米⁵C Methylation-Associated功能鼠标

多个生化的特性被用来编码41元序列(53)的RNA。RNA的微分贡献评估网站的m⁵C甲基化,四个机器学习模型应用(DT,资讯、射频和支持向量机)来识别特征的最佳组合⁵C甲基化的预测。的分布特性各自的RNA基因座如图4。从功能分布,确定所有选中的功能属于所选序列的后端,从23日nt到41元,仅次于候选人m⁵C甲基化网站(21元)。特别是,两个地区第27 - 31 (nt和34-37 nt)是由至少三个机器学习模型预测与m⁵C甲基化。根据最近的出版物基于m的生物功能⁵C、m的两种⁵C在多个网站的子组rna是我(1)类型⁵C,其次是G-rich三胞胎中的一个主题,(2)II型m⁵C,相邻下游UCCA主题;在以下区域都有特定的序列特征⁵C甲基化位点(54),这与本研究的预测结果。进一步的研究也证实,下游的特定区域⁵C位点序列可能有不同的上下文,这表明feature-enriched地区预测列表中当前研究绝对可以与m⁵C甲基化效率。2019年,在哺乳动物识别系统分析mRNA 5-methylcytosine上下文捕获的下游的m序列⁵C位点相间不同m⁵C位点甲基化状态,由一个特定5-methylcytosine叫做NSUN2甲基转移酶(55,56]。相比之下,前的序列⁵C位点与NSUN2野生型小鼠没有明显变化,淘汰赛,或救援状态,这意味着m⁵C位点及其下游的序列,特别是10元以下序列(55,56),这与本研究的预测分布。此外,另一个类似5-methylcytosine甲基转移酶NSUN6鼠标是一个信使rna⁵C甲基转移酶(54]。甲基转移酶II型的m⁵C、m⁵C的目标基因有一个象征性的下游UCCA尾巴位于第一个模棱两可的峰值(只有通过射频预测方法)在本研究的预测结果(1 - 4甲基化区域后nt) [54]。此外,不同于生物NSUN2监管的影响,侧翼地区15元左右被发现有另一个碱基对地区低,其中包括更多的变异,通过使用相同的过程来检测甲基转移酶的序列淘汰赛,救援,和野生状态54]。这一发现表明序列在这样的地区的重要性。总之,m的预测分布⁵已经验证了C methylation-associated位点最近的出版物。

4.2。米⁵C Methylation-Associated特性在人类

m⁵C-associated特性分布在40侧翼序列上游下游(20和20)从人体组织也确定了。根据同一出版物(54,55),以下1 - 4元(22日至26日进行的nt)和13 - 15元(34-37 nt)也与m的功效⁵C甲基化,这与本研究的预测。见数据4和5,下游地区的特征峰(21-41 nt)非常类似人类和小鼠之间的数据,反映了m的相似性⁵C methylation-associated模式在不同的物种。然而,明显的区别也观察到,这意味着生物差异的存在⁵C甲基化在不同的物种。在最近的人类,出版物显示分布的RBP目标密度(rna结合蛋白),它反映了绑定功效相关的地区,是重要的⁵C候选站点,渐渐地,在两个方向上都不是突然下降(56,57]。因此,在m序列⁵C在每个方向也不是随机的,而是与特定的序列特征。进一步说,2015年,一个分析监管同源蛋白的酵母和人类相同的蛋白家族(Nop2 / NSUN / NOL家庭)表明,特定的绑定域(例如,SAM-binding域)可能位于m⁵C位点,它们可能会影响监管效果。因此,虽然他们没有直接验证,一些核苷酸坐落在m⁵C位点可能是必不可少的甲基化状态的预测58]。

4.3。生物识别的意义⁵C Methylation-Associated特性

正如上面总结的,我们确定了m⁵在老鼠和人类C-associated特性。确定的生物学意义⁵C甲基化特性可以聚集成两部分:(我)具体分布和多样化⁵在人类或鼠标C相关特性。在本部分中,我们确定了那只老鼠⁵C甲基化是通常只与28-31 nt和34-37 nt地区41 nt子序列,而在人体组织,除了19元区域,大多数41元序列的位置与m⁵C甲基化。这些结果确定重点监管区域与m⁵C甲基化和监管之间的差异的影响⁵C甲基化在不同的物种,进化反映出保护m⁵C甲基化调节机制(2)下游监管网络与m⁵C甲基化对基因转录和翻译至关重要。一般来说,米⁵C与鸟嘌呤甲基化可以帮助结合氢稳定完整的RNA结构和折叠成独特的空间构象(59]。根据最近的出版物,m⁵C调节器NSUN2已被证明改变m⁵C的能力在某些RNA的地区。基因像p27(KIPI),CDK1,p21,ErbB2都是由m⁵C甲基化和进一步与肿瘤发生相关(59,60]。序列位点的m⁵C甲基化已被证明是特别影响下游细胞增殖和炎症相关通路(61年,62年),表明m的特定的生物学意义⁵C甲基化。因此,识别不同的贡献来自不同序列的核苷酸位置可以帮助演示的具体监管效果异常⁵在不同的致病条件C甲基化

因此,调节m loci-related字符的识别⁵C甲基化不同物种之间不仅可以帮助我们揭示了一致性和演化守恒⁵C甲基化相关序列,而且连接特定的序列位点与重要的m⁵C methylation-associated表型或疾病。

5。结论

总之,正如上面所讨论的,顶部最优预测列表中的甲基化网站受到了最近的出版物。RNA的甲基化模式验证在多个不同物种进行比较的结果⁵C methylation-associated位点在人类和小鼠组织。区别的特性分布模式不同的甲基化模式也被比较的结果⁵C的分布模式。因此,结果不仅评估不同位点的区别的贡献重要RNA甲基化模式但还揭示了m的站点分布差异⁵C甲基化类型物种之间(人类和老鼠)。

数据可用性

原始数据用来支持本研究的发现在iRNA-m是可用的⁵C (http://lin-group.cn/server/iRNA-m5C/download.html)。

的利益冲突

作者宣称没有利益冲突有关的出版。”

作者的贡献

ZhanDong Li Lei Chen和石漆张了同样的工作。

确认

这项工作得到了中国科学院的战略重点研究项目(XDA26040304和XDB38050200),国家重点研发项目(2018 yfc0910403),中国的基金的组织微环境和肿瘤重点实验室中国科学院(202002)。

补充材料

辅料S1:性能IFS的老鼠⁵C网站。辅料S2:人类m IFS的性能⁵C网站。(补充材料)

引用

m·格林伯格和d Bourc 'his”,不同角色的DNA甲基化在哺乳动物发展和疾病,”自然评论分子细胞生物学,20卷,不。10日,590 - 607年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
h·史、j . Wei和c .他”在哪里,什么时候,如何:上下文相关的功能的RNA甲基化作家、读者、橡皮擦,“分子细胞,卷74,不。4、640 - 650年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
x, x,和c,“Epitranscriptome测序技术:解码RNA的修改,自然方法,14卷,不。1,23-31,2017页。
视图: 出版商的网站 | 谷歌学术搜索
杜k, l·张,t·李和t .太阳,“m6A RNA甲基化控制神经发育和参与人类疾病,”分子神经生物学卷,56号3、1596 - 1606年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
a . m .赫克和c j . Wilusz“小变化,重大的影响:m的影响⁶多能性的RNA甲基化对基因表达和发展,“Biochimica et Biophysica学报(BBA)基因调节机制,卷1862,不。9日,第194402条,2019年。
视图: 出版商的网站 | 谷歌学术搜索
a . k . Chokkalla s l·梅塔和r . Vemuganti”Epitranscriptomic m6A RNA甲基化调控的大脑发育和疾病,”脑血流量和代谢杂志》上,40卷,不。12日,第2349 - 2331页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
顾,x,戴c . et al .,“RNA在癌症m6A修改:分子机制和潜在的临床应用,”创新,1卷,不。3,第100066条,2020年。
视图: 出版商的网站 | 谷歌学术搜索
s . Zaccara r·j·里斯和s . r .,“读、写、擦除mRNA甲基化,”自然评论分子细胞生物学,20卷,不。10日,608 - 624年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
k . w . Min, r·w·菌s Davila et al .,“剖析m6A RNA修改确认前2 mRNA稳定的与年龄有关的规定,“衰老细胞,17卷,不。第三条e12753, 2018年。
视图: 出版商的网站 | 谷歌学术搜索
j . y . Lee崔承哲,o . h .公园,和y k金,“分子机制推动信使rna降解m6A修改,“遗传学趋势,36卷,不。3、177 - 188年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
Lesbirel和s . a .威尔逊“m⁶-甲基化酶复杂和mRNA出口。”Biochimica et Biophysica学报(BBA)基因调节机制,卷1862,不。3、319 - 328年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
J。”。刘,k . Li j . Cai et al .,”m的景观和监管⁶和米⁶是methylome在人类和小鼠的组织。”分子细胞,卷77,不。2,页426 - 440。e6, 2020年。
视图: 出版商的网站 | 谷歌学术搜索
中情局山地白杨,m·e·埃文斯,t·潘,他和c,“动态RNA基因表达的修改规定,”细胞,卷169,不。7,1187 - 1200年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
m·汉z . Liu y徐et al .,“m6A mRNA的异常甲基化参与阿尔茨海默氏症,”神经科学前沿,14卷,p。98年,2020年。
视图: 出版商的网站 | 谷歌学术搜索
赵张z l .问:陈y l . et al .,“单碱基antibody-independent m6A的映射的方法,”科学的进步,5卷,不。7篇文章eaax0250 2019。
视图: 谷歌学术搜索
l . Trixl a .逻辑单元,“动态RNA修改5-methylcytosine及其新兴作为epitranscriptomic马克,”威利跨学科评论:RNA,10卷,不。1,文章e1510, 2019。
视图: 出版商的网站 | 谷歌学术搜索
太阳x, y, b . f . et al .,“5-methylcytosine促进mRNA出口——NSUN2甲基转移酶和ALYREF m⁵C读者。”细胞研究,27卷,不。5,606 - 625年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
吴x, z, k . Chen等人“m6Acomet:大规模的功能预测个人m6A RNA甲基化网站从一个RNA co-methylation网络,”BMC生物信息学,20卷,不。1、1 - 12,2019页。
视图: 出版商的网站 | 谷歌学术搜索
y, j . Cai y, h .赵和h .沈,“通过Sequence-to-Sequence MicroRNA亚细胞定位预测模型”2018年IEEE国际会议数据挖掘(ICDM),IEEE,新加坡,2018年。
视图: 谷歌学术搜索
l . h . Peng Fulmi, c .丁”的基于互信息的特征选择标准max-dependency, max-relevance, min-redundancy,”Ieee模式分析与机器智能,27卷,不。8,1226 - 1238年,2005页。
视图: 出版商的网站 | 谷歌学术搜索
h·a·刘,r . Setiono增量特征选择。”应用智能,9卷,不。3、217 - 230年,1998页。
视图: 出版商的网站 | 谷歌学术搜索
h . Lv z . m . Zhang j . x Tan, s·h·李·w·陈,林和h,“5-methylcytosine网站评价不同计算方法的识别、”简报的生物信息学,21卷,不。3、982 - 995年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
p, h .叮,w . Chen和h·林”识别RNA 5-methylcytosine网站通过伪核苷酸组成,”分子生物系统,12卷,不。11日,第3311 - 3307页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
刘w . j .太阳,j·h·李,s . et al .,“RMBase:资源解码RNA从高通量测序数据修改的景观,“核酸的研究,44卷,不。D1, D259-D265, 2016页。
视图: 谷歌学术搜索
朱l .傅妞妞,z, s .吴和w·李,“CD-HIT:加速集群下一代测序数据,”生物信息学,28卷,不。23日,第3152 - 3150页,2012年。
视图: 出版商的网站 | 谷歌学术搜索
j·彭宁顿、r . Socher和c·d·曼宁“手套:全球词向量表示,”学报2014年会议上实证方法在自然语言处理(EMNLP)多哈,卡塔尔,2014。
视图: 谷歌学术搜索
张,t .曾庆红,b .胡锦涛et al。”歧视起源组织甲基化肿瘤细胞系的签名和Dys-methylated规则,”在生物工程和生物技术前沿,8卷,p。507年,2020年。
视图: 出版商的网站 | 谷歌学术搜索
s .张x y锅,曾庆红t . et al .,“拷贝数变异模式识别MACROD2大肠癌亚型、”在生物工程和生物技术前沿,7卷,p。407年,2019年。
视图: 出版商的网站 | 谷歌学术搜索
t . l . Chen曾庆红,x, y . h, t·黄和y . d . Cai”确定甲基化模式和与乳腺癌相关的基因亚型,”国际分子科学杂志》上,20卷,不。17日,第4269页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
赵x l·陈,j . Lu”相似性方法预测药物副作用的异构信息,“数学生物科学卷,306年,第144 - 136页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
r . Kohavi”,交叉验证的研究和引导精度估计和模型选择”人工智能国际联合大会,14卷,不。2、1995。
视图: 谷歌学术搜索
l . Breiman“随机森林”,机器学习,45卷,不。1,5-32,2001页。
视图: 出版商的网站 | 谷歌学术搜索
c·科尔特斯和诉Vapnik支持向量网络。”机器学习,20卷,不。3、273 - 297年,1995页。
视图: 出版商的网站 | 谷歌学术搜索
t .封面和p·哈特,“最近邻模式分类,”IEEE信息理论,13卷,不。1,-,1967页。
视图: 出版商的网站 | 谷歌学术搜索
r·沙法维恩因为和d . Landgrebe“决策树分类器的调查方法,”IEEE系统,人,控制论,21卷,不。3、660 - 674年,1991页。
视图: 出版商的网站 | 谷歌学术搜索
中州。张,z, t .曾庆红et al .,“检测multiomics签名factor-specific炎症对气道平滑肌的影响,“遗传学前沿第599970条,卷。11日,2021年。
视图: 出版商的网站 | 谷歌学术搜索
x, h·李,曾庆红t . et al .,“识别蛋白质的亚细胞定位和网络功能嵌入的,”遗传学前沿第626500条,卷。11日,2021年。
视图: 出版商的网站 | 谷歌学术搜索
中州。张、曾t . l . Chen t·黄和y . d . Cai”确定蛋白质功能关联功能规则基于基因本体和KEGG途径,”Biochimica et Biophysica学报(BBA)——蛋白质和蛋白质组学,卷1869,不。6日,第140621条,2021年。
视图: 出版商的网站 | 谷歌学术搜索
中州。张,h·李,曾庆红t . et al .,“识别转录组签名和规则SARS-CoV-2感染,”细胞和发育生物学的前沿第627302条,卷。8日,2021年。
视图: 出版商的网站 | 谷歌学术搜索
m . Onesime z杨,戴问:“基因组岛通过卡方检验和随机森林算法预测,“计算和数学方法在医学卷,2021篇文章ID 9969751、9页,2021。
视图: 出版商的网站 | 谷歌学术搜索
y, y, z, x,和戴,“使用递归特征选择和随机森林,改善low-similarity序列,蛋白质结构类预测”计算和数学方法在医学卷,2021篇文章ID 5529389、9页,2021。
视图: 出版商的网站 | 谷歌学术搜索
杨y l·陈,“识别药物病协会通过使用多个药物和疾病网络,”目前的生物信息学,2021年16卷。
视图: 出版商的网站 | 谷歌学术搜索
j。周,l·陈,t . Wang和m .刘”iATC-FRAKEL:一个简单的多标记的web服务器与他们的指纹识别解剖的化学类药物治疗,”生物信息学,36卷,不。11日,第3569 - 3568页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
朱y, b .胡锦涛,l·陈,戴,“iMPTCE-Hnetwork:多标记分类器识别代谢途径与异构网络类型的化学物质和酶,”计算和数学方法在医学卷,2021篇文章ID 6683051, 2021。
视图: 谷歌学术搜索
y贾、r .赵和l .陈“相似性机器学习模型预测化合物的代谢途径,”IEEE访问,8卷,第130696 - 130687页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
l . Chen s . Wang黄懿慧Zhang et al .,“确定键序列功能改善CRISPR sgRNA功效,“IEEE访问5卷,第26590 - 26582页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
b . h . Liu, l·陈,l . Lu”识别蛋白质亚细胞位置嵌入功能从网络,”目前蛋白质组学,18卷,不。5,646 - 660年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
w·陈,l·陈,戴问:“iMPT-FDNPL:识别膜蛋白类型与功能域和自然语言处理的方法,”计算和数学方法在医学卷,2021篇文章ID 7681497, 2021。
视图: 谷歌学术搜索
b·马修斯,”预测的比较和观察T4噬菌体溶菌酶的二级结构,”Biochimica et Biophysica学报(BBA)蛋白质结构,卷405,不。2、442 - 451年,1975页。
视图: 出版商的网站 | 谷歌学术搜索
h·l·贾陈、刘et al .,“潜在m6A和m5C甲基化在中国非洲猪瘟病毒株的基因组,”Virologica中央研究院,36卷,不。2、321 - 324年,2021页。
视图: 谷歌学术搜索
Z.-X。刘,l·m·李·h·l .太阳,和s . m . Liu m6A修改和癌症之间的联系,“在生物工程和生物技术前沿》第六卷,89页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
大梁,m . Salditt-Georgieff s Bachenheimer et al .,“adenovirus-specific核和细胞质RNA的甲基化”核酸的研究,3卷,不。3、749 - 766年,1976页。
视图: 出版商的网站 | 谷歌学术搜索
f . y . Dao h . Lv黄懿慧杨h . Zulfiqar h·高和h·林,“计算识别N6-methyladenosine网站在多个组织的哺乳动物,”计算和结构生物技术杂志18卷,第1091 - 1084页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
j .刘黄t . y . Zhang et al .,”序列和structure-selective mRNA m5C NSUN6甲基化的动物,”国家科学评论,8卷,不。6、2021。
视图: 谷歌学术搜索
黄t w·陈,j . Liu n .顾和r·张,“全基因组鉴定mRNA 5-methylcytosine在哺乳动物中,“《自然结构和分子生物》上,26卷,不。5,380 - 388年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
唐问:李,李x h . et al .,“NSUN2-mediated m5C甲基化和METTL3 / METTL14-mediated m6A甲基化合作加强p21翻译,“细胞生物化学杂志》上,卷118,不。9日,第2598 - 2587页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
j . e . Squires h·r·帕特尔·m·Nousch et al .,“人类普遍发生5-methylcytosine编码和非编码RNA,”核酸的研究,40卷,不。11日,第5033 - 5023页,2012年。
视图: 出版商的网站 | 谷歌学术搜索
g .资产阶级m·奈伊,加斯帕et al .,“真核核糖体rna修改酵母5-methylcytosine-methyltransferases和人类proliferation-associated抗原p120”《公共科学图书馆•综合》,10卷,不。7篇文章e0133321 2015。
视图: 出版商的网站 | 谷歌学术搜索
k . e . Bohnsack c . Hobartner和m . t . Bohnsack“真核5-methylcytosine (m5C) RNA甲基转移酶:机制,细胞功能和链接到疾病,”基因,10卷,不。2,p。102年,2019年。
视图: 出版商的网站 | 谷歌学术搜索
美国,y, j .沈et al .,“m5C RNA甲基化主要影响ErbB PI3K-Akt信号通路在胃肠道癌症,”分子生物科学前沿7卷,2020。
视图: 出版商的网站 | 谷歌学术搜索
W.-H。李,r·a·莫顿j . i . Epstein et al .,“监管序列的甲基化胞嘧啶核苷pi-class附近的谷胱甘肽S-transferase基因伴随人类前列腺癌形成,”美国国家科学院院刊》上,卷91,不。24日,第11737 - 11733页,1994年。
视图: 出版商的网站 | 谷歌学术搜索
m . j . y . Li Li罗et al .,“小说长非编码RNA NMR促进肿瘤进展通过NSUN2和BPTF在食管鳞状细胞癌,”癌症的信卷,430年,页57 - 66,2018。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

224年

下载

646年

引用