研究文章|开放获取
ray ming陈, ”核苷酸序列的随机性SARS-CoV-2及其相关的亚科”,计算和数学方法在医学, 卷。2020年, 文章的ID8819942, 8 页面, 2020年。 https://doi.org/10.1155/2020/8819942
核苷酸序列的随机性SARS-CoV-2及其相关的亚科
文摘
的起源和演化,在解决COVID-19 SARS-CoV-2一直是一个重要问题。研究该病毒的这些主题将增强我们的知识,帮助我们开发疫苗或预测的路径突变。有许多理论和临床研究在这个领域。在本文中,我们设计出一个结构度量指标,直接测量任意两个核苷酸序列之间的结构差异。为了探索机制的进化是如何工作的,我们将SARS-CoV-2及其相关家庭的核苷酸序列与程度的随机性。因为这种随机生成的核苷酸序列之间的距离非常集中在较低的平均方差,他们有资格作为基本参考优秀的候选人。这样的引用可以应用于测量其他Coronaviridae序列的随机性。我们的研究结果表明,相对随机性比率非常一致和集中。这个结果表明他们的随机性非常稳定和可预测的。研究结果也显示出Coronaviridae及其亚科之间的演化行为。
1。介绍
COVID-19有巨大的影响对所有生命的工作。发展稳定的和可信赖的疫苗(1,2),需要跟踪和分析SARS-CoV-2的属性,与MERS-CoV夫妇(3)和冠betacoronavirus的亚科。除此之外,它还需要比较的属性相关的家庭:alphacoronavirus, deltacoronavirus, gammacoronavirus [4]。在Coronaviridae betacoronavirus是最致命的亚科。类别,冠、MERS-CoV SARS-CoV-2出现在2003年,2012年和2019年,分别。评估和分析它们的属性,有许多基因,临床、统计和分析工具。在所有的理论或临床研究,遗传的分析提供了一个直接的方法来深入研究Coronaviridae[的结构5,6]。有一些研究者关注地理,人口,病毒的基因组分析提取一些模式(7,8]。虽然这些病毒的起源和演化曾为例,研究了MERS-CoV [9和“非典”10,11)——仍然是一个长的路要绘制出这些病毒之间的交互。目前,有许多理论和证据的进化和突变的调节机制SARS-CoV-2 [12- - - - - -14]。尽管如此,果断解决揭示这样的机制仍然依赖于进一步的研究和发现。在本文中,我们分析其属性的随机性,即。,核苷酸序列的随机性的程度。我们设计一个结构指标表,并将其应用于测量各种之间的距离Coronaviridae核苷酸序列和随机生成的核苷酸序列。这些距离可以显示多远Coronaviridae是关于随机核苷酸序列。
我们利用冠状病毒基因组的数据从NCBI数据集15]。然后,我们测量距离为每个单独的Coronaviridae的亚科。我们的结果显示这种结构性指标揭示了属性的随机性挺合适的。因此,随机序列之间的相对距离相当稳定,concentrated-this特性使得随机性可行的概念。从这些设置,我们就可以计算它们的相对随机性比率(存款准备金率)和从存款准备金率提取我们的发现和结果。的方法实现这一概念的特点是部分3,实现部分中列出的结果4和达成的结论部分5。
2。理论设置
为了明确测量结构之间的距离,我们设计出一个结构指标在这以前将应用于后者的部分。
对于任何一个向量 ,我们使用或表示其th元素和 表示它的长度。我们也使用欧几里得范数来表示。
2.1。常见的有限区间(CFI)
让表示所有升有限序列的集合。让 , 是任意的。定义最大下界 。定义最小上界 。让 表示的子序列元素的隔和 。让表示所有的元素的集合 。让 。让有限的 是任意的。让 表示排序向量的所有元素 。定义一个差分算子在有限的向量 ,在哪里 。
定义1。对于任何 ,任何 ,定义 通过 。
定义2。(公共子序列)。
如果
,
,我们定义
通过
。
这是常见的两种结构之间的结构。
定义3。(提升有限序列)。
让
表示所有真正提升向量的集合的第一个元素和最后一个元素
。让是工会的一组
,也就是说,
。
定义4。(结构度量)。
定义一个距离函数在通过
。
要求5。 是一个规 。
证明。它可以证明,根据定义4,通过所有可能的情况下对间隔的关系考虑在内。
要求6。如果 在一组是一组指标 ,然后 也是一个指标 。
定义7。它紧跟着一个度量的定义。
例1。假设核苷酸序列 , 上面给出了。
让表示含氮碱基的位置序列中的 。让表示公共子序列的位置f 和 。然后,这项研究的结果发表在表1。让 。现在我们定义 去年平等直接来自定义在哪里4。自 因此, 。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
权重都是预定的 每个含氮碱基。这些值也可以调整根据专业判断。例如,可以决定权重的相对频率基地。例子1后者的算术计算奠定了基础。
3所示。方法
有几个步骤计算相对随机性比率(存款准备金率)。(我)生成一组1000个随机核苷酸序列的长度都是固定在30000年。生成的随机序列展示在表(核苷酸)2(2)每个序列被认为是一个节点。然后我们计算这些节点的距离矩阵。这4个指标组成的指标是一个加权度量衡量结构距离对每个含氮碱基。具体计算例子所示1(3)创建一些有图案的核苷酸序列和随机序列的距离计算。这些序列是不必要的。他们只生成用于比较。创建的(其次是规则)核苷酸序列及其距离展示在表3(iv)结构之间的距离SARS-CoV-2核苷酸序列和随机的计算。这项研究的结果发表在表4(v)结构之间的距离MERS-CoV核苷酸序列和随机的计算。这项研究的结果发表在表5(vi)非典核苷酸序列和随机结构之间的距离的计算。这项研究的结果发表在表6(七)结构之间的距离alphacoronavirus核苷酸序列和随机的计算。这项研究的结果发表在表7(八)结构之间的距离deltacoronavirus核苷酸序列和随机的计算。这项研究的结果发表在表8(第九)gammacoronavirus核苷酸序列和随机结构距离的计算。这项研究的结果发表在表9(x)存款准备金率对每个亚科是计算的方法来计算部分中解释4所示。2
|
|||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4所示。结果
我们用R程序4.0.2(版本),特别是涉及一个包“Biostrings”来帮助我们实现的理论背景。的程序中提到的部分3在本节中,我们目前的结果。我们将随机含氮碱基的长度是30000,这是几乎长度对冠状病毒的家庭。我们也使用R为我们的实验样本1000个样本(序列)(由于电脑的能力)。
4.1。实验:核苷酸序列的随机性
消除对角线后,我们计算一些描述性的值 元素:最小、最大、意思和标准的整个距离矩阵的推导过程。最大最小值是127.1和134.7。均值为130.88,标准差是0.83。自标准推导很小,结构之间的距离任何一对随机核苷酸序列高度集中在是说这是一个很好的参考属性为我们进一步分析。现在,让我们展示一些图案序列随机序列之间的距离。
例2。假设 捆绑和重复7500次 ;此外, 捆绑和重复3750次 ;最后,(一个斐波那契序列模式与国防部操作,或国防部4,1、2、3和4被等同于“A”,“C”,“G”,和“T”分别捆绑和重复5000次 如下面所示:(我) (2) (3)
之间的距离和随机序列表中列出3。
结构图案之间的距离序列和随机的明显不同的结果相比,随机序列。
4.2。核苷酸序列的距离
我们进口SARS-CoV-2基因组编码和拯救他们S4DSC2 [15]。自从S4DSC2规模太大(4617),或 ,不能由我们的电脑,我们样品只有20人。这项研究的结果发表在表4“序列”,列的顺序采样序列数据集;“最小值”和“Max”是最小和最大距离给定序列的随机序列,分别;“的意思是”之间的平均距离是给定的序列和随机序列;“Sd”这样的标准推导的距离;“兰德”是距离的平均距离矩阵的随机序列;“存款准备金率”是相对随机配给,也就是“的意思是“结束”的意思是兰德。”,后者表、列的含义是相同的;我们将跳过措辞。MERS-CoV,数据下载的大小是530。我们样品20随机。这项研究的结果发表在表5。冠,数据下载的大小是10647。我们样品20随机。这项研究的结果发表在表6。alphacoronavirus,数据下载和过滤的大小是1002。我们样品20随机。这项研究的结果发表在表7。deltacoronavirus,数据下载和过滤的大小是149。我们样品20随机。这项研究的结果发表在表8。gammacoronavirus,数据下载和过滤的大小是427。我们样品20随机。这项研究的结果发表在表9。
5。结论
通过观察所有表中给出的结果,我们可以达到以下语句:(我)随机结构之间的距离(核苷酸)较低的序列是高度集中的标准推导。这个特性证明结构度量下的参照作用(2)有图案的核苷酸序列有较低的手段和较低的标准推导距离随机序列(3)相对随机性Coronaviridae比率(存款准备金率),躺在1.01和1.08之间,更接近完整的随机性比率(或1)相比,那些图案的核苷酸序列,到处都是0.84在我们的例子(iv)总的来说,随机性betacoronavirus高于alphacoronavirus或deltacoronavirus,进而高于结构之间的距离SARS-CoV-2和随机序列。这也许可以解释为什么betacoronavirus高于其他亚科的突变(v)betacoronavirus, SARS-CoV-2几乎是固定的存款准备金率为1.04。这表明SARS-CoV-2的突变是稳定在这一刻
这些发现提供了一些深刻的知识结构随机性的程度SARS-CoV-2及其相关的家庭。这些知识与其他研究成果和发现会帮助我们在地图上标出这些病毒的动态结构和演进。
数据可用性
作者以合理的数据请求(https://www.ncbi.nlm.nih.gov/sars-cov-2/;https://www.ncbi.nlm.nih.gov/datasets/coronavirus/genomes/)。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作是支持的教育部人文社会科学基金(批准号20 xja-gat001)。
引用
- d·e·戈登·g·m·张成泽m . Bouhaddou et al .,“SARS-CoV-2蛋白质交互地图显示药物再利用的目标,“自然,卷583,不。7816年,第468 - 459页,2020年。视图:出版商的网站|谷歌学术搜索
- j . v .拉撒路,s . c . Ratzan A Palayew et al .,“全球调查的潜在接受COVID-19疫苗,”自然医学,2020年。视图:出版商的网站|谷歌学术搜索
- Y.-S。钟,j·m·金·h·金等人。,“中东呼吸系统综合症冠状病毒的遗传特性,韩国,2018年,“新发传染病,25卷,不。5,958 - 962年,2019页。视图:出版商的网站|谷歌学术搜索
- 美国佩恩,“家庭Coronaviridae”病毒,149卷,2017年。视图:谷歌学术搜索
- m·f·博尼p . Lemey x江et al .,“进化起源的SARS-CoV-2 sarbecovirus血统负责COVID-19大流行,”微生物学性质,5卷,不。11日,第1417 - 1408页,2020年。视图:出版商的网站|谷歌学术搜索
- k·g·安德森,a·兰姆伯特利普金i, e·c·霍姆斯和r·f·加里”近端SARS-CoV-2起源”,自然医学,26卷,不。4、450 - 452年,2020页。视图:出版商的网站|谷歌学术搜索
- d . Mercatelli和f . m . Giorgi地理分布和基因组SARS-CoV-2突变,2020年。
- j·b·多德l . Andriano d . m . Brazel et al .,“人口科学帮助理解COVID-19的传播和死亡率,”美国国家科学院院刊》上,卷117,不。18日,第9698 - 9696页,2020年。视图:出版商的网站|谷歌学术搜索
- s . Milne-Price k . l . Miazgowicz诉j·明斯特,“中东呼吸系统综合症冠状病毒的出现,“病原体和疾病,卷71,不。2、121 - 136年,2014页。视图:出版商的网站|谷歌学术搜索
- j·崔、f·李和z l .施“致病性冠状病毒的起源和演化,”自然评论微生物学,17卷,不。3、181 - 192年,2019页。视图:出版商的网站|谷歌学术搜索
- e·c·霍姆斯和a·兰姆伯特“病毒进化和SARS冠状病毒的出现,“英国伦敦皇家学会哲学学报。系列B,生物科学,卷359,不。1447年,第1065 - 1059页,2004年。视图:出版商的网站|谷歌学术搜索
- m . Kandpal和r . v . Davuluri识别特定地理SARS-Cov-2突变的随机森林分类和变量选择方法,”统计数据和应用程序,18卷,不。1,2020。视图:谷歌学术搜索
- a . Danchin后k .蒂米斯,“粒度SARS-CoV-2变体:相关性症状、流行病学、免疫力(群、疫苗),病毒起源和遏制?”环境微生物学,22卷,不。6,2001 - 2006年,2020页。视图:出版商的网站|谷歌学术搜索
- t .表象,“SARS-CoV-2遗传多样性与进化”,感染、遗传与进化,第81卷,第104260页,2020年。视图:出版商的网站|谷歌学术搜索
- 国家医学图书馆”,冠状病毒基因组NCBI的数据集,”https://www.ncbi.nlm.nih.gov/datasets/coronavirus/genomes/。视图:谷歌学术搜索
版权
版权©2020 ray ming陈。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。