文摘

例如,单点突变基因单核苷酸多态性(SNP)或罕见的基因突变,是一个单核苷酸的改变为另一个基因组序列。他们中的一些人会产生相应的蛋白质序列的氨基酸替换(错义突变);而另一些则不会。本文着重于基因突变导致氨基酸序列的改变相应的蛋白质以及如何评估其影响野生型特征。现有的方法和方法预测突变蛋白质稳定性的影响,结构和动力学概述和讨论关于他们的基本原则。可用资源,作为独立的应用程序或网络服务器,也指出。是强调理解这些影响背后的分子机制由于这些错义突变检测至关重要致病突变。本文提供了一些示例3 d应用程序的基于结构的方法模型的影响蛋白质稳定性和蛋白质相互作用引起的错义突变。

1。介绍

人类DNA并不是完全相同的个体,这导致自然种族和民族群体之间的区别,以及在健康个体和个人容易感染疾病。在DNA序列层面上,可能是大或小的差异,最小的是一个单核苷酸的差异。如果这样的差异发生在人口的一部分,但不是在一个单一的情况下,不同的是称为单核苷酸多态性(SNP) [1,2]。的单核苷酸多态性发生在非编码,而其他编码单核苷酸多态性发生地区(3]。非编码区域的单核苷酸多态性发生不影响基因产物,即蛋白质序列没有改变,这种类型的snp称为沉默突变(4]。然而,沉默突变也可以发现编码地区因为每个氨基酸是由一个以上的密码子编码。因此,即使突变改变了密码子,尽管它仍然是有可能的,蛋白质序列不受影响。然而,仍然沉默突变可能影响细胞的功能通过改变基因的表达和调控。

在另一端的频谱产生的单核苷酸多态性(nsSNPs),导致蛋白质序列的变化。最引人注目的变化是引发的无意义突变,导致过早终止密码子和产生截断,通常非功能性蛋白质(4]。错义突变,另一方面,是一个氨基酸的变化到另一个。这种突变可以多态性是否观察到重要的一部分人口,或者它可能是一种罕见的错义突变,如果发现一个人或一小群人,,例如,在一个家庭。在这两种情况下,在蛋白质水平,这些突变称为单点突变和他们是本文的重点。

错义突变,一般来说,nsSNPs广泛调查在过去透露他们的似是而非的对蛋白质稳定性的影响5- - - - - -10),蛋白质-蛋白质之间的关系(11),活性部位的特点(5,6),和许多其他人12- - - - - -20.]。同时,重要的工作是投资目录自然发生的基因差异,在一般人群中发现的,可能是无害的SNP数据库(21- - - - - -23)和那些已知疾病相关的在线孟德尔遗传在人(人类)24- - - - - -26]。人类包括全文描述疾病表型和基因,映射,分子遗传学,PubMed引用,和许多其他特性(26,27]。人类目前所提供的美国国家生物技术信息中心(NCBI) [28和编辑约翰霍普金斯大学的维克多•a . McKusick博士。到2011年,超过21000项,包括数据和13100年建立的基因位点和表型的描述中包含人类Entrez数据库(28]。SNP数据库是用来组织和系统化基因测序的大量的信息。到目前为止,开发了多个SNP数据库如dbSNP数据库(21,29日,30.),人类基因组变异数据库(HGVbase) (22),人类基因突变数据库(HGMD) (31日),和TopoSNP数据库(23,32- - - - - -35]。

这样的存在数据库结合可用生化数据的单点突变对蛋白稳定性的影响和交互提示的发展在网上方法来预测突变的影响相应的野生型特征蛋白质或组合。目前,该方法可以分为几类:第一原理方法计算折叠或结合自由能变化基于详细的原子模型(36- - - - - -46];基于统计方法的潜力(47- - - - - -55),利用已知蛋白质结构蛋白质数据银行(56];方法采用经验势结合物理力场和自由参数配备实验数据(57- - - - - -65年];机器学习的方法,训练与已知实验数据库,然后用来预测新发现的突变的影响(66年- - - - - -72年]。

2。合理的遗传差异引起的影响的概述

遗传差异可能会影响细胞的功能以多种方式,大致可分为几个类别下面。

2.1。活动网站、反应动力学和反应参数

如果突变发生在一个活跃的站点,那么它应该考虑致命因为这样的替换将影响生物反应的关键部件,而反过来,会改变正常的蛋白质功能(73年,74年]。同时,生化反应非常敏感的精确几何活动网站对反应物和产物;因此,任何构象变化改变活跃的网站也会影响生化反应;然而,保守的突变不会扰乱蛋白质功能的多。因此,即使突变并不发生在活性位点,但非常接近,催化组将摄动的特点5,6,75年]。在这种情况下,突变可能不是完全废除生化反应但可以改变反应的动力学76年]。此外,生化反应强烈依赖于一个特定的(优化)细胞环境如pH值、温度和盐浓度。因此在活细胞,这些细胞蛋白质的行为是由环境(77年,78年]。改变反应速率,pH值、或盐和温度依赖性远离本机参数会导致故障的蛋白质。等电点(π)是一个非常重要的参数,它是指蛋白质的净电荷的pH值是零。最近,这是表明,五个错义突变涉及指控组织钠碘同向转运(NIS)基因,产生一种叫做碘转运体的蛋白质和碘化与运输缺陷,可能会导致一个明显的π转变和影响转移膜的静电相互作用域的NIS蛋白。这些替换可能会更多,,反过来,影响蛋白质稳定性、贩卖蛋白质和碘化运输活动(79年]。

2.2。蛋白质折叠动力学,蛋白质稳定性、灵活性和聚合

蛋白质折叠的过程是线性的多肽转换成原生三维结构的梯度驱动的势能(80年,81年]。蛋白质折叠动力学的重要性体现,蛋白质miss-folding参与许多疾病(12]。一种氨基酸替换关键折叠的位置可以防止形成细胞核,使剩余的结构迅速凝结(12]。蛋白质的稳定性也是一个关键特征功能的蛋白质(5,6,71年,82年- - - - - -86年),因此,在本机蛋白质氨基酸突变可以大大影响其稳定性(76年,77年,87年)通过微扰构象限制(例如,用一个小残侧链大,反之亦然,从而导致骨干应变或超紧密堆积作用)或物理化学效应(替换亲水残基与疏水残基之间,埋葬的带电残留,破坏氢键,氢键,s的债券)(88年]。结果表明,80%的错义突变与疾病相关的氨基酸替换,影响蛋白质稳定性的几个千卡每摩尔(84年]。此外,错义突变也可以改变蛋白质的灵活性(5,89年,90年]。当蛋白质携带它的功能,经常反应需要一个小型或大型构象变化发生特定的特定的生化反应。因此,如果一个突变使蛋白质更刚性或柔性相比,本机结构,那么它会影响蛋白质的功能(91年,92年]。此外,构象的灵活性是主要的机制影响蛋白质聚合倾向(93年),从而影响蛋白质的灵活性可能会导致蛋白质聚合,形成原纤维(94年]。

2.3。蛋白质之间的相互作用,Protein-DNA、Protein-RNA和蛋白质膜

如果一个错义突变发生在热点的绑定接口,在导致交互至关重要95年,96年],然后绑定亲和力会显著影响由于几何约束和/或充满活力的影响(7,97年]。例如,当用一个小的侧链代替笨重的侧链绑定的口袋里,有一个狭窄的入口的伙伴组织将被阻塞和绑定过程完全或部分预防(6,98年- - - - - -101年]。同样,protein-DNA接口可以影响DNA的突变监管(13- - - - - -15]。突变发生在蛋白质膜界面能影响跨膜信号流程,与膜蛋白协会,和功能的各种渠道和泵16,17]。

2.4。亚细胞定位和蛋白质表达

亚细胞定位是一个非常重要的因素,它提供了一个特定的环境对蛋白质功能、蛋白质相互作用,蛋白质活动信号通路,以及许多其他功能。运送到正确的蛋白质间可以形成必要的野生型与生物伙伴的互动和参与相应的生物网络信号和代谢途径。否则,mislocalizing错了亚细胞中的蛋白质间会有有害影响的其他蛋白质功能(20.]。通常,影响亚细胞定位是一个突变,突变发生在信号区域。例如,错义突变Otopetrin 1影响亚细胞位置和原因nonsyndromic otoconia发育不全和随后的平衡缺陷小鼠(102年]。Fanconi贫血症是一种遗传疾病相关的错义突变FANCA蛋白质。这些错义突变影响FANCA蛋白质的亚细胞定位,使其无法搬到细胞核和激活FA / BRCA通路(103年]。

蛋白表达是基因表达的子组件,常用来表示测量的蛋白质浓度在一个特定的细胞或组织。错义突变会影响dnc转录因子导致改变相应的蛋白质的表达。改变野生型蛋白表达在隔间里设计函数将扰乱正常的细胞周期,进而可能导致疾病(20.]。最近,泛函分析pancreatitis-associated错义突变进行胰腺分泌的胰蛋白酶抑制剂(SPINK1)体内的基因,编码的胰腺分泌胰蛋白酶抑制剂(PSTI)。结果表明,致病的错义突变R65Q蛋白表达减少了近60%,和其他四个致病性错义突变G48E, D50E, Y54H, R67C造成完全或几乎完全丧失PSTI表达式(104年]。排除的可能性减少mRNA转录或不稳定会导致蛋白表达降低,这是猜测,这些致病错义突变可能导致细胞内保留各自的突变蛋白。这是暗示一个潜在的病理机制统一信号肽和成熟肽突变(104年]。

在本节中,我们提出了合理的突变可以导致的影响。事实上,突变经常影响正常蛋白质功能的结合分子上面列出的影响(5,6,8]。例如,在genotype-phenotype相关性的研究TGFBI(转化生长因子,beta-induced)突变,这是显示一个错义突变V613G强烈地撼动了野生型蛋白keratoepithelin 3.1千卡/摩尔;此外,同样的突变也可能导致不当折叠由于替代通用的主体结构是不受限制的侧链,因此可以采用任何构象,导致错误折叠的蛋白质。同时,结果表明:V613G也促进了β褶板结构的形成的TGFBI已知有利于形成淀粉样蛋白(105年]。同样,另一项研究在网上调查18个错义突变电子转移黄素蛋白(ETF)与多个酰coa脱氢酶缺乏症(MADD),并发现这些18个错义突变可以通过分子的影响分为两组:改变蛋白质折叠和组装、影响催化活性的功能性网站,和干扰的交互和他们的生物伙伴,在这种情况下,脱氢酶(106年]。

3所示。方法和方法预测突变的影响

目前在这个领域的努力旨在预测以来有害突变预测可用于诊断和药物设计等。作出这样的预测使用的特性可以分为三类:(a)氨基酸属性,如尺寸、极性侧链,侧链的灵活性,以及形成氢键的能力和其他几何因素;(b) 3 d蛋白质结构属性,如稳定性、亲和力的receptor-ligand复杂,和结构的灵活性;(c)进化属性序列保护和系统发育树。回顾这些方法几乎是不可能的一个接一个,因为大多数当前的方法是使用这些功能的组合27]。表1分子建模方法显示了几个示例应用程序,免费为学术界、研究错义突变的分子机制影响野生型蛋白的性质。比较他们的性能提供了参考65年,107年]。在接下来的段落,我们详细解释一些可用的资源。

至关重要的是确定上述特性中最丰富的特性使成功的预测。这种必要性启发一些作品其中最近的一项研究评估32特性一起使用互信息的功能影响氨基酸替换,以在活的有机体内化验。执行顺序,贪婪算法来识别高度信息特征的子集(108年]。最后,得出两个特性描述溶剂易访问性的“野生型”和“突变”的氨基酸残基,另一个特征进化属性基于superfamily-level多个比对生产最好的准确性(109年]。另一个调查开发形式和计算方法基于结构模型和系统发育信息表明氨基酸替代蛋白功能的影响。这样一个协议,大约26% - -32%的自然发生的错义突变预测影响蛋白质功能(110年]。

氨基酸属性通常被认为是一个重要的特征,这可能在蛋白质折叠中起到至关重要的作用,稳定蛋白质复合物的相互作用,蛋白质功能,尽管有时他们可能会误导11]。侧链的属性如体积、极性、酸度、碱度、构象的灵活性和形成和盐桥形成氢键的能力,区分。因此,兼容性替换的显性等位基因可以用来制造的预测是在最近的一项研究[111年),结合氨基酸属性和结构信息来识别有害突变通过分析对蛋白质稳定性的影响。

另一种方法来评估突变对蛋白稳定性的影响是评价ΔG折叠自由能的变化(折叠)。ΔG之间的区别(折叠)野生型蛋白突变体,通常称为ΔΔG(折叠),是一个衡量的突变对蛋白稳定性的影响5,6,64年,65年,107年,112年]。如果ΔΔG的变化(折叠)是负的,那么预测突变将会破坏蛋白质。相比之下,如果计算改变是积极的,突变预计将稳定蛋白质。相同的考虑是有效的预测影响receptor-ligand绑定(113年]。众多的调查报告在过去的揭示原生结构的稳定性的变化(71年,82年- - - - - -86年],大分子相互作用[11],或改变野生型(WT)网络,形成氢键的影响稳定(5,114年,115年]。目前,一些独特的方法来预测蛋白质的稳定性和亲和力改变由于突变已经开发出来,他们可以分为四类:(a)第一原理方法,使用详细的原子模型来计算折叠/绑定自由能变化引起的突变(36- - - - - -46)这些方法是科学合理的,但相当计算昂贵,可能不是最好的选择在大型组突变的情况下116年];(b)方法基于统计势(47,48被证明是成功的在预测蛋白质稳定性的变化在突变(49- - - - - -55];(c)方法利用经验潜力,结合物理力场,和自由参数配备实验数据(57- - - - - -62年];(d)的机器学习方法,利用训练数据库(66年- - - - - -70年]。

蛋白质的三维结构不仅可以用于能源计算,如上所述,但是映射突变到它并使用几何因素来预测突变的影响(117年]。最近,这种方法,alpha-shape从计算几何的方法,用于将所有nsSNP站点划分为三类:(a)型P: nsSNPs位于口袋或无效;(b)型S: nsSNPs发生在凸区域;我和(c)类型:nsSNP网站是完全埋在蛋白质。发现88%的致病性nsSNPs P型和很少的类型我32]。沿着这条线,3 d结构组合使用了机器学习(支持向量机)和随机森林方法。这是证明这些方法优于筛选算法由Ng和Henikoff [118年),并表示,将结构信息作出准确的预测至关重要,如果没有足够的进化信息(119年]。基于3 d结构,solvent-accessibility词也是一个重要的功能,这是通常用于调查错义突变的影响。它已经表明,使用solvent-accessibility术语,Cβ密度和分数来自同源序列将做最准确的预测120年]。最近的研究考虑了几种蛋白质结构参数如溶剂可及性、位置在β链,或活跃的站点对nsSNPs预测的影响。发现大约70%的疾病有关的突变和溶剂无法埋在121年- - - - - -124年),这样的突变具有很强的对蛋白质结构的影响,折叠,稳定,和正常功能121年,123年]。

综述了另一个重要功能是进化的特性。在同源蛋白质,通常被认为是高度保守的残留蛋白质稳定性的关键,互动,和功能。的进化方法之一,假定残留位于一个高度保守的位置很可能是至关重要的,是提取保护从多个同源蛋白质序列比对得分。另一个广泛使用的计算方法是命名为“进化痕迹”的方法(125年- - - - - -127年]。它使用基于同源序列的系统发育信息根据进化的重要性等级残留基于守恒的残留的蛋白质家族。之后,这种进化保守残基被映射的代表结构。此外,一组守恒的残留可能发生在蛋白质复杂的界面。基于残留的提取功能重要,一种方法是开发利用进化跟踪方法来识别活跃网站根据可用的蛋白质的结构和功能接口。该方法测试SH2和SH3模块化信号域和激素受体的DNA结合域。这是证明该方法可以描述功能表位和识别基本残留绑定特异性(128年]。

为了培养正确的机器学习算法和基准测试情况下,适当的数据库是必需的。一个特定的例子是催化部位地图集数据库(129年),177年收集原始手工的注解条目和2608同源条目,覆盖大约30%的酶在蛋白质数据银行56]。同时,预测功能残基的计算方法也发达的(125年,130年,131年]。选择结构和序列的功能是用来表示一种氨基酸对蛋白质功能多态性影响,并发现-32% ~ 26%的天然nsSNPs会影响蛋白质的功能110年]。

4所示。网路分析突变的影响

过去几年,几个方法被实现成的网路预测由于突变对蛋白稳定性的影响。厄里斯的网络服务器是基于美杜莎力场(132年),基准测试595突变体与可用实验数据导致RMSDΔΔG预测之间的2.4千卡每摩尔卡尔(折叠)和相应的实验值(ΔΔG经验值(折叠))(112年,132年,133年]。FoldX也许是最流行的web服务器(63年]预测折叠自由能变化由于突变,它是基于经验势(64年]。I-Mutant 2.0/3.0是基于支持向量机(SVM):机器学习方法)网络服务器利用3 d结构或连续的信息来预测蛋白质稳定性变化在单点突变(71年,72年,134年]。其他的网路包括网站定向突变(SDM) [54)和Mupro方法(135年]。

在并行,有网路预测突变在蛋白质相互作用的影响。COILCHECK是一个互动的网络服务器,它衡量的力量之间的相互作用涉及两个螺旋卷曲螺旋结构利用nonbonded和静电相互作用和氢键的存在和盐桥。它可以用来评估卷曲螺旋区域的力量,认识到弱和强区域,合理化的表型行为单一突变和变异设计实验(136年]。最近,DrugScorePPI被报道,这是一个快速而准确的计算方法来预测对亲和力的影响,结合自由能的变化在丙氨酸突变蛋白质接口。这个网络服务器的主要动机是识别热点残基在蛋白质接口,这将指导生物实验和发展的调节器(蛋白质间交互作用137年]。

有许多网络服务器是用来预测如果突变致病或不提供预期的能量变化的大小的信息。SNPs3D [138年)是一个主要的资源和数据库,它提供了各种疾病/基因在分子水平上的关系。这个服务器有三个模块:(a)确定候选基因参与一个特定的疾病;(b)组候选基因之间的关系;和(c)分析可能nsSNPs正常蛋白功能的影响。非常方便用户快速获取可用的信息所以gene-pathway-disease互动的发展模式。另一个在线预测蛋白质编码变异的分子和结构的影响是最近开发的,SNPeffect 4.0 (139年]。它使用序列和基于结构的生物信息学工具,如聚合预测(探戈)[140年),淀粉样蛋白预测(华尔兹)[141年),chaperone-binding预测(地狱)142年),和蛋白质稳定性分析(FoldX) [63年)来预测单核苷酸多态性的影响。此外,它还包含对催化的影响的信息网站,转译后的修改,和所有已知的人类蛋白质从Uniprot变体。同时,SNPeffect允许用户提交定制蛋白变异分析SNP效果和情节表型特性为用户选择的一组变量之间的相关性(139年]。dbSNP在NCBI数据库列表在人类基因组900万个snp,但包括注释信息非常有限。填补这一空缺,LS-SNP开发注释nsSNPs [83年]。它可以映射nsSNPs到蛋白质序列、功能通路,和比较蛋白质结构模型和预测的位置nsSNPs造成影响。结果可以用来发现功能基因SNP候选人,单体型,或通路,也理解nsSNPs负责功能的分子机制的影响(83年]。同时,基于排序的协议不能容忍的宽容(筛选)118年)据报道,预测如果一个错义突变会影响蛋白质的功能。评估一个错义突变的影响,筛选利用蛋白质的进化特性,考虑替换可能会影响蛋白质功能的保守立场。因此,筛选作出预测所有可能的影响在蛋白质序列中的每个位置替换使用序列同源性(143年]。Polyphen(多态性表型)是一个工具,预测可能产生的影响的一种氨基酸替换人类蛋白质的结构和功能使用简单的物理和比较注意事项。它结合了不同的特性,比如序列,进化属性和结构信息预测如果nsSNP会影响蛋白质功能和执行效果最佳,如果结构信息是可用的。由这个网络服务器(超过11000 nsSNPs注释86年]。Polyphen的新版本,即Polyphen-2,最近发布了(144年]。其功能包括高质量的多序列比对管道和概率分类器基于机器学习方法,并优化了高通量下一代测序数据的分析(144年]。筛选和Polyphen发展后,Parepro(概率预测氨基酸替换),基于两个独立的数据库HumVar和NewHumVar。预测是如果一个nsSNP将有害或对蛋白质功能没有影响。筛选和Polyphen相比,Parepro达到一个更高的马修斯相关系数(MCC)和整体精度(Q2)讨论了使用HumVar数据集上的20倍交叉验证测试(145年]。StSNP是一个网络服务器引用数据从NCBI dbSNP,基因和蛋白质数据库从Entrez, PDB的蛋白质结构,并从KEGG路径信息,使努力提供结合,关于nsSNPs综合报道。研究人员可以使用StSNP检查中的代谢途径可能疾病相关通路之间的关系和特殊的nsSNPs,疾病和链接与当前可用的分子结构数据(146年]。AUTO-MUTE是一个以知识为基础的计算诱变用来预测人类nsSNPs疾病的潜力。在这项研究中,1790中性和变异人类nsSNPs 243多样的人类蛋白质结构。训练模型,这种方法达到76%交叉验证的准确性(147年]。

5。应用基于结构的方法来预测突变对蛋白的影响稳定和蛋白质的相互作用

在本节中,我们概述几个例子利用结构信息来预测蛋白质的突变对野生型的影响特点和蛋白质复合物。

5.1。应用分子动力学(MD)模拟预测突变的影响

凝血因子V(阵线”的前身是一个重要的促凝血的代数余子式加速FXa-catalyzed凝血酶原激活凝血系统。它包含几个域是一个大型的糖蛋白,A1-A2-B-A3-C1-C2 [8]。一个错义突变D2194G C2的域被证明导致低表达水平和可能影响稳定的相应的蛋白质。调查D2194G影响的分子机制相应的野生型蛋白,MD模拟进行了WT的和突变体结构,揭示了灵活性改变在这个突变(8]。程序CHARMm [148年),和总模拟时间为900 ps。均方根波动(RMSFs)α碳原子的C2域/残留计算一系列的快照。WT和突变结构的比较如图1(一)。得出结论,该地区2075 - 2085和2140 - 2150 WT结构和突变结构灵活。循环2042 - 2053(图1 (b)),这是接近突变的网站,更灵活的变异结构。同时,循环2060 - 2067在变异,变得更加灵活,这种效果是由于循环的流动增加2042 - 2053。Asp的替代通用电气将导致大腔和刚性的糖(Tyr2196)将自身插入域和试图填写这腔和来弥补缺失的突变体的负电荷。这些事件可以提高循环的灵活性的原因2042 - 2053。

5.2。应用能量计算预测突变在人类精胺合成酶的影响

在本节中,我们描述了三个错义突变的分子机制在人类精胺合成酶(SMS)引起Snyder-Robin综合征(SRS) (149年- - - - - -151年演示应用程序的基于结构的方法和能量计算来预测对蛋白质稳定性的影响和蛋白质相互作用[5]。

短信(人类:300105)是一种酶转化亚精胺(SPD)成精胺(SPM)这两个是两个多胺控制正常哺乳动物细胞生长和发展152年- - - - - -155年]。SMS的正常功能的重要性如下三个临床错义突变,c。267 g > A (p.G56S) (150年],c。496T > G (p.V132G) [151年],I150T [5),短信将导致x染色体精神发育迟滞障碍叫SRS(人类:309583)。同时,人类SMS的3 d结构与基质SPD或产品SPM实验确定(156年]。短信的3 d结构的基质社民党和产品MTA (PDB ID: 3 c6k)如图2。短信包含两个亚基形成二聚体,每个单元包括两个终端域:n端结构域在二聚作用中起着关键作用,c端域包括活性部位。二聚短信功能的重要性也证明了一系列删除实验在体外(156年]。此外,两个错义突变G56S和V132G位于二聚体界面,而另一个错义突变I150T发生在c端域和非常接近活动网站。

这三个突变体在网上SCAP的程序在豺包(157年),基于本土的3 d SMS结构。然后,修补包被用来进行能量最小化和计算(158年]。这是表明错义突变G56S会强烈降低二聚体亲和了近14千卡每摩尔,但另外两个没有影响。基于三维结构的分析,总结原因,G56S强烈降低二聚作用是因为Ser的突变体的侧链是指向二聚体界面,没有足够的空间来港这侧链(图3(一个))。相比之下,而突变V132G位于二聚体界面,Val的侧链本机结构并不指向接口和接近大空腔(图3 (b));因此这种替代可以很容易地适应没有引入任何空间限制。第三突变、I150T非常远离二聚体界面(图2);因此,不应该影响到二聚作用。

关于折叠的能量计算,预计这些错义突变,破坏蛋白质单体2.8千卡/摩尔(G56S), 1.1千卡/摩尔(V132G)和3.5千卡/摩尔(I150T),分别。图4(一)给本机结构和突变结构的比较和放大到G56S突变网站。突变体结构,我们可以看到这种突变发生在一个急转弯,和几乎所有其他氨基酸的替换将引入压力。图4 (b)显示本机的叠加结构和变异,放大V132G突变网站。很明显,Val指向内部的侧链,因此,替换与通用电气将留下一个大洞在单体,进而会影响稳定。此外,考虑到物理化学性质特征,Val和g有不同的疏水性。I150T的不稳定主要是由于Ile之间的物理化学性质完全不同,这是一种疏水渣,用力推,亲水渣。

因此,结合三维结构,氨基酸的物理化学性质,和能量的计算,结果表明,可以成功地预测分子的影响由于这三个错义突变。这种分析有助于更好地了解这些错义突变影响短信功能,进而揭示分子SRS的起源。

6。结论

在本文中,我们概述了当前最先进的方法计算领域的建模nsSNPs和罕见的错义突变的影响。指出可用资源以及简短描述它们的功能和准确性。描述的基本概念和主要研究方向及其优缺点进行了讨论。

确认

作者感谢尼古拉斯·史密斯校对。>和大肠Alexov的部分支持由国家卫生研究院,NLM格兰特,批准号1 r03lm009748。>谢谢”烤里脊牛排奖学金”,这是在美国由法国大使馆的支持。