文摘
尿崩症(DI)是一种罕见的内分泌、遗传疾病发病率较低的估计每25000 - 30000活产。这种疾病的特征是多尿症和补偿性polydypsia。DI的多样化的根本原因可以中央缺陷,没有功能的精氨酸加压素(AVP)被释放从垂体或肾脏可以结果的缺陷(肾原性的DI, NDI)。NDI是一种障碍,患者无法集中尿液尽管AVP的存在。这抗利尿激素调节水重吸收的过程中形成的prourine肾脏。它结合2型受体(V2R)肾脏诱发cAMP-driven级联,导致aquaporin-2水通道的插入到顶端膜。突变的基因V2R和aquaporin-2经常导致利尿。我们调查了一个结构模型的V2R绑定和游离状态对蛋白质稳定性使用一种新型能源配置文件的方法。此外,这些技术被应用于野生型和aquaporin-2选择突变。我们表明,我们的结果很好地反映实验水用户体验分析,这证实了我们的理论方法的适用性问题。
1。介绍
膜蛋白在许多生物过程中发挥了重要的作用。尽管已知膜蛋白结构的总人数从337增加到1515的结构在过去的8年里,高度的冗余和这些结构的平均质量显著降低结构的整体状况数据(1]。目前,只有398 nonredundant膜蛋白结构可通过蛋白质结构数据库,如蛋白质数据库(PDB)或跨膜蛋白的蛋白质数据银行2,3]。因此,膜蛋白是知之甚少。研究膜蛋白的结构和错误折叠,其他方法,如small-molecular-force光谱学、应用和发展4]。Mutation-induced膜蛋白错误折叠结构是许多人类疾病的原因,也就是说,尿崩症,遗传性耳聋,色素性视网膜炎,囊性纤维化,家族血胆甾醇过多,等等(4- - - - - -7]。
尿崩症(DI)的特点是多尿症(日产量15 - 20 L高度稀释尿液)和补偿polydypsia。在普通人群中,评估在一个案例中每25000 - 30000人(8- - - - - -10]。DI的新生婴儿过敏的症状,可怜的喂养,可怜的体重增加,脱水。可以区分两类。首先,中央尿崩症(CDI)是由中央缺陷,没有或不足的功能精氨酸加压素(AVP)从垂体释放。相反,肾脏可能导致缺陷肾原性的尿崩症(NDI)。四种不同类型的抗利尿有关原因和继承是已知的(11- - - - - -14]:(我)获得抗利尿,它可以产生的副作用长,超过吸毒(即。、锂);(2)常染色体隐性遗传NDI, AQP2基因编码产生aquaporin-2突变造成的;(3)显性遗传NDI, AQP2基因编码产生aquaporin-2突变造成的;(iv)x连锁遗传NDI, AVPR2基因编码产生的突变引起的AVP 2型受体(V2R)。
NDI的x连锁遗传变异是一个障碍,一个人的影响是无法在肾脏浓缩尿液尽管AVP的存在。这个nanopeptide(10个氨基酸)作为抗利尿激素。它结合V2R作为受体激动剂和引发cAMP-driven级联,作为一个结果,导致插入顶端的aquaporin-2收集管膜。作为一个螺旋膜水通道、融合与细胞膜aquaporin-2顶端等离子体膜对水的渗透性增加。因此,水可以通过顶端膜并导致prourine浓度平衡。错误折叠V2R突变体困在endoplasmatic网的主要原因是x连锁NDI变种的起源。通常与基底外侧膜V2R保险丝能够绑定到avon。此外,插入突变体和AVP通常无法绑定。因此,困V2R突变体或正常插入但不是功能性V2R突变预测的感应aquaporin-2插入结果多尿症和利尿。常染色体隐性或显性遗传AQP2基因的突变导致的错误折叠aquaporin-2,因此,插入功能aquaporin-2水通道。这个结果在上述典型NDI症状阐明(15,16]。突变V2R aquaporin-2导致结构不稳定。这些不稳定的分析涉及的理解过程中扮演一个重要的部分膜蛋白mutation-induced疾病,特别是在尿崩症。
在本文中,我们将展示一个新颖的方法基于蛋白质的膜蛋白稳定性分析能源配置文件。蛋白质能量配置文件的概念是一种新型的粗粒度模型结构和化学蛋白质性质转换为一维能量表示。蛋白质能量配置文件可以被任何给定的蛋白质结构计算在不到半秒使其有价值的快速分析的结构关系。这种方法是解释在材料和方法部分。其应用结构模型绑定和游离状态的V2R avon将详细阐明。此外,基于能量剖面的膜蛋白的结构模型分析应用于aquaporin-2的野生型和选择突变体结构模型。最后,在能源特点和相关性显著差异实验数据将会详细讨论。
2。材料和方法
2.1。研究蛋白质的描述
2.1.1。V2后叶加压素受体(V2R)
V2后叶加压素受体属于g蛋白耦合的类受体。它包含七个膜生成螺旋线由细胞外和细胞内循环连接,分别。绑定的V2R兴奋剂avon诱导激活的蛋白质导致变构结构重组(17]。一旦V2R被激活,它能够与胞质蛋白交互激活腺苷酸环化酶触发cAMP-driven级联。因此aquaporin-2插入顶端膜(15,16]。AVP的结合位点V2R坐落在跨膜螺旋II-IV,残留88 - 96,119 - 127,311 - 317和284 - 291,主要是参与约束(18,19]。
V2R因为没有已知的蛋白质结构,V2R的三维结构模型是使用I-TASSER蛋白质结构建模管道(20.]。基本上I-TASSER构建蛋白质模型使用迭代装配过程和多个线程比对基于模板结构。在表1PDB_IDs,相应的生物序列描述和身份V2R使用模板的结构,。梯度最小化建模结构是由NAMD2手段(21]。进一步的MD模拟应用到模型通过使用CHARMM27力场(22]。研究整体模型的质量和结构稳定性,额外的MD模拟进行。的平均表示支柱的结构模型被发现是2.7。
2.1.2。Aquaporin-2
水通道蛋白提供高渗透毛孔,水跨膜。四个相同的子单元形成一个稳定的四聚物通过质膜跨越。每个亚基包含七个螺旋线形成的孔隙直径3。水的选择性是实现主要是通过76年和192年的两个天冬酰胺残留(人类aquaporin-1编号)23]。进一步选择性残留His180, Gly188、Cys189 Gly190, Ile191, Arg195 Phe56。说明残留的aquaporin-1结构参与水绑定在图给出1(23,24]。此外,水通道蛋白表现出两个高度保守的Asn-ProAla图案位于两个相反的会议螺旋在所有已知的水通道蛋白的结构。这表明这种结构特征及其重要性的高保护水运输活动。结果表明,这两个螺旋形成一个双极电场改变水分子取向和防止质子通过通道。进一步的分子模拟研究揭示了一个二级自由能量势垒由Phe56诱导,His180, Arg195。它位于约8除了主双电场的蛋白质在细胞外的一面。这两个双极电场作为一个结果,形成收缩区域只允许单个水分子通过孔隙的结束。MD模拟Arg195突变体显示对应的二级双相的稳定电场Arg195,因此,影响水选择性的蛋白质(25- - - - - -27]。虽然没有高分辨率aquaporin-2结构,发现所有特性已知的水通道蛋白结构和知识能够可靠地分配aquaporin-2由于这些残留在所有已知的大部分高保护人类的水通道蛋白。
protein-energy-profile-based分析的结构模型是必要的。因此,最可靠的结构模型从ModBase检索数据库(28]。这个模型是使用aquaporin-5的高分辨率结构作为建模模板(PDB_ID 3 d9)。两个蛋白质共享68%的序列的身份。使用模型展览93%的高覆盖率的模板结构。重新评估的质量模型,蛋白质结构分析工具VADAR(1.8版本,请参阅[29日])应用。一个评价标准是质量指标,总结了侧链错误折叠,立体化学的重叠,为每个残留原子包装不足。质量指标低于4报告为低质量。的质量指标阴谋aquaporin-2图所示2。可以看出,平均质量指数aquaporin-2模型的所有残留的点到高质量水平只有几个弱点。因此,该模型可以应用于protein-energy-profile-based方法。
2.2。蛋白质能量理论概要文件
自从Anfinsen的基本工作,即本机蛋白质构象是由氨基酸残基相互作用的总和,因此,通过氨基酸序列(30.),许多粗粒度和细粒度的,所有的原子模型描述residue-residue交互开发和适应。他们要么是基于第一原理方法使用物理法或利用现有实验得到的知识结构和统计分析。后一种方法,所谓的以知识为基础的能源潜力(KBPs),假设自由能函数描述蛋白质结构的行为,根据玻耳兹曼定律,与高频低能状态观察。KBPs不同级别的系统细节描述:从所有原子模型和势简化粗粒度模型。基于物理的方法来预测蛋白质结构用分子力学力场详细描述蛋白质在原子和能源方面包含静电和范德瓦耳斯相互作用以及共价键的多肽链31日,32]。然而,这些原子详细模拟只是很小的可行的通常短于150个氨基酸的蛋白质。
粗粒度模型计算蛋白质能量配置文件,这里描述,属于KBPs的方法。它的基础源于(34- - - - - -36]。它类似于描述的方法在艾森伯格的工作等。37]。艾森伯格的方法将蛋白质的三维结构通过分析一维表示的结构环境中的每个残留结构。所描述的这种环境埋残留表面侧链和侧链的表面暴露于极性原子以及当地的二级结构的残渣。相比之下,这里描述的方法分析了环境调查残渣的但接近它的能量恢复pseudoenergies派生统计物理。这些pseudoenergies基于每个氨基酸的趋势被埋或暴露在溶剂。玻耳兹曼原则应用到这些倾向,每个氨基酸的pseudoenergy可以近似。例如,暴露半胱氨酸半胱氨酸以来拥有更高的能源如预期通常是埋在蛋白质结构(38]。基于[34,35),我们定义了一个内部/外部属性生成氨基酸buriedness分布,因此,允许pseudoenergy近似。让表示20标准氨基酸之一。和描述氨基酸的绝对频率被指定为“内部”和“外部”的内部/外部属性,分别。内部/远离房地产的定义是 在哪里表示所有的质心5一个球体周围的原子。一般来说,统计数据可以计算任意给定的一组蛋白质,但冗余和生化的特性需要被考虑。例如,统计螺旋膜蛋白显著不同统计导出了球状蛋白质。交换数据或计算的基础上,而不适当的蛋白质结构设置会导致错误的结论。这里,数据被使用这个属性342 nonredundant派生螺旋膜蛋白质。这些蛋白质结构的列表可以在跨膜蛋白的蛋白质数据银行1]。应用逆玻耳兹曼原则,pseudoenergy的可以近似如下: 自和都声明为常量在这个模型中,从计算可以省略: 两两相互作用的能量的其他残留物对应的环境和内部的环境组成结构(39]。因此,预期价值的倾向观察环境的组成与交互的能量。可以用衍生氨基酸分布近似: 因此,根据玻耳兹曼原则,环境的能量被定义为 ,因此, 环境是由接触函数定义改编自(36表示为 最后的总能量是 在哪里定义一个给定的蛋白质结构。通过省略在模型中,由此产生的给出了任意单位实体(a.u。),直接上市与能量成正比或。蛋白质能量的对应的n-tupel。
类似的方法讨论艾森伯格的工作等。37)、能源配置文件可以通过动态规划保持一致。因此,一个能量得分函数实现。它是派生的攻击力等同的间隔之间的距离高斯积分的能量分布。得分两个能量,每个能量分配给其在高斯积分区间。之间的距离两个积分对应于成对能量分数。这个进球是用于调整两个给定的能源配置文件和通过动态编程,如Needleman-Wunsch算法(40[]或均为算法41]。对齐的意义是允许的估计权重得到的分数最好的得分和平均排列分数派生的变更和调整给定的能源配置文件。如前所述(42),这种加权分数称为分数(dScore)和被定义为距离 与 在这里,表示最好的成对能量分数。一般来说,重要的能源配置文件比对对应dScores小于2.5的禁令。对齐的两个相同的能量配置文件对应一个dScore 0的禁令(图3)。
(一)
(b)
2.3。相关性的能源结构和氨基酸序列
氨基酸的关系稳定和氨基酸能量可辩解的折叠的蛋白质和其能源景观。折叠的过程可以被描述为一个函数的损失的亥姆霍兹自由能在一个氨基酸相互作用能的状态。通常,折叠蛋白质的稳定状态是可自由支配的时间最小化能源(43]。配置文件是一个能量转换的能源格局的蛋白质点的最小自由能。这导致这样的结论:一种氨基酸的能量值由能源配置文件是氨基酸的稳定的转换的结构。
调查相关的能源配置文件结构和氨基酸序列,七个蛋白质结构(a3h a1w PDB_IDs: 1, 1, 1, 1 b1j 1 bhe 1 o8w 3 gbs)分享没有相似的结构,函数序列,或受到PDBeFold服务(44]搜索相同和相似的蛋白质结构的蛋白质数据银行。总的来说,PDBeFold发现653重大打击。对于每一个打击,身份和结构序列对齐分数(QScores)得救了。两个相同的蛋白质结构承受QScore 1.0。相比之下,两种不同的蛋白质共享QScore 0.0。之后,蛋白质能量配置文件查询的蛋白质结构和相应的计算和一致。的斯皮尔曼相关系数结果dScores并保存QScores以及计算序列的身份。由此产生的斯皮尔曼相关系数(我)QScore dScore:,(2)序列dScore身份:,(3)序列QScore身份:。
对应的散点图如图4。高度相关的能量剖面相似性序列同一性和结构相似性导致的结论是,能量剖面相似性达到至少相同的相关序列在蛋白质结构的身份。这意味着能量的传递性的蛋白质的氨基酸序列和结构。
(一)
(b)
(c)
此外,二级结构元素的通信控股能源研究。因此,342年能源nonredundant集的概要文件螺旋膜蛋白被分散,根据二级结构元素标记。片段长度是五残留。600片段中随机挑选的整个片段集和集群使用神经气体(46]。在聚类过程中,标签被忽略,只有评价聚类性能。集群是评估使用归一化互信息(敝中断)47]。这个过程在100年重复迭代来验证结果值。这里,平均敝中断被发现在一个低水平的意义在0.06这意味着存在几乎没有相关的二级结构能量螺旋膜蛋白质。标记的过程重复片段根据膜拓扑区域。敝中断被发现是0.34,这表明几乎线性可分性的能量配置文件碎片根据膜拓扑区域。结果平均敝中断0.14球状蛋白质能量配置文件根据二级结构元素进行标记片段显示良好的聚类。这表明蛋白质能量配置文件的相关蛋白质的结构特点,因此,相关蛋白质结构的稳定性。
2.4。应用能量V2后叶加压素受体
为研究能量、绑定功能,V2受体突变的影响,V2R的结构模型是研究水平的能源配置文件。因此,分子对接服务器用于对接模拟V2R模型和AVP激素。在[48),证明了半经验的PM6部分费用计算方法,这是实现分子对接软件的服务器,允许一个对接精度42正确建模ligand-protein复合物的一组53 ligand-protein复合体由x射线实验。关于分子对接服务器的性能以及充满活力的轨迹计算,而计算对接模拟AVP和V2R(数据未显示),模型的结构及其在束缚态激素被评估为正确建模,用于进一步的分析。V2R模型的概要文件的能量约束和游离状态计算检测活力差异引起的构象变化激素绑定。
binding-induced活力检测出这些变化,推导出能源配置文件使用多个能量剖面对齐对齐算法(MEPAL)已改编自42]。在这个过程中,所有给定的蛋白质能量配置文件相互一致的结果在一个距离矩阵和相应的dScores矩阵条目。在下一步中,分层集群执行使用未加权的pair-group与算术平均法(UPGMA)和聚类步骤,记录。第三,根据跟踪所有能量聚类步骤概要介绍了渐进多能源使用相同的技术概要对齐受雇于成对能源概要对齐。因此,重要的差异和相似之处可以检测到多个能源配置文件。此外,该方法允许扣除的共识能源配置文件和节能。能量在每一个配置文件是派生的共识中的对齐列计算成对能量分数的能量在这个特殊的位置。这些分数最高的能量的总和是代表的共识。保护是由成对的和派生的能量分数和规范化的理论最好的总和。因此,最优保护在一列= 1.0 (49]。
2.5。应用能量Aquaporin-2及其同系物
探讨蛋白质aquaporin-2稳定,近水通道蛋白同系物的MEPAL计算。适当的蛋白质是aquaporin-4 (PDB_ID: 3 gd8) aquaporin-1 (PDB_ID: 1 fqy)的同源模型aquaporin-3法律辩护基金(模板PDB_ID: 3),和aquaporin-2的结构模型。第一个模型从ModBase数据库检索和显示质量低于aquaporin-2模型(数据未显示),但适合进一步分析。
2.6。应用能量Aquaporin-2和两个很好的描述突变体
比较水平的能源配置文件的aquaporin-2突变体,两个aquaporin-2模型通过引入两个突变D150E和G196D生成的氨基酸序列。由于两种突变是描述在文献[45),相关的蛋白质能量/稳定可以开发和实验观察。
两个突变体的建模是由SwissModel [50,51)使用aquaporin-2模型模板结构。每个产生的能量剖面模型计算。MEPAL能量配置文件生成的野生型和突变体建模的两个和追究显著差异。此外,能源配置文件树的距离计算采用UPGMA聚类的基础上能量剖面距离矩阵。
3所示。结果与讨论
MEPAL输出分为三个部分。上部可视化能源配置文件通过色素残留一个字母编码的能量。中间部分显示了共识。保护见下部。
的MEPAL V2R绑定和游离状态avon透露精力充沛的环境差异氨基酸Ala84(图5(一个)),Ile130(图5 (b)),和Pro322(图5 (c))。这表明这些氨基酸参与激素绑定。文献中描述他们的突变是导致功能丧失和激素亲和力(52- - - - - -56]。这个观察强调AVP-V2R建模复杂的质量和粗粒度的能量模型讨论了这项工作。总之,AVP的绑定影响结构的稳定性和折叠在只有几个点,而小结构调整和重组。因此,这部小说energy-profile-based方法带来了更多的证据和数据的功能V2R和描述突变的影响。
(一)
(b)
(c)
距离的分析树生成的能量剖面距离矩阵的研究水通道蛋白表明高相似性aquaporin-2和aquaporin-4的能源配置文件。派生的能量剖面距离aquaporin-3的其他结构对应于重要但不相似(见图6)。
四水通道蛋白的MEPAL对齐显示几个大力高度保守的区域。其中两个对应于面向相反Asn-ProAla图案。MEPAL输出周边地区的第二个Asn-ProAla图案如图7。在这个图中,第二个Asn-ProAla主题是突出了一个红色的盒子。
这些主题及其周围的能量保护氨基酸证实这些残留在水上运输的重要性。此外,残留Gly188(突出显示正确的绿星在图7)、Phe56 Cys189、Ile191 His180,参与水运输,显示顺序的差异和充满活力的保护(没有显示在图7)。详细,保守氨基酸Gly188 Phe56显示轻微或没有差异有关他们的能量。Cys189 aquaporin-2 Ile191没有保护,3和4;但这些变化没有影响水平的能源配置文件。His180(左绿星所反映出的图7)显示顺序和充满活力的保护除了aquaporin-3水通道蛋白。我们假定这些细微差异不显著影响水通量。进一步的兴趣点在于Arg195(红星所反映出的图7)。这是守恒的残留在所有四个蛋白质但积极变化。这些差异源自构象变化的残渣和构造环境。基于我们提到的事实部分2.1。2aquaporin-1之间,我们假定这些分歧,2,3,4导致残留Gly188变化及其周边残留影响运输选择性和水通量。它还需要说aquaporin-3之间的显著差异在能源配置文件进展和其他结构可能结果不可靠aquaporin-3模型。
树的距离aquaporin-2野生型建模及其两个突变体(D150E和G196D)表示强烈的相似之处的能量两个突变体(图的配置文件8(一个))。这导致这样的结论:两个突变体诱导相同的精力充沛,结构和功能变化。它需要解决自动建模技术可能不够敏感模型single-point-mutated结构基于模板。两个场景来自这些担忧。首先,两个不同single-point-mutated显著模型和模板在结构上的区别。或者,就像第二个场景中,两种模型和模板显示相同的折叠构象骨干和侧链构象。在第一个场景中,由此产生的三个能源配置文件将导致long-branched彼此差别很大的延伸距离树。在第二个场景中,所有能源配置文件的两两比较结果与短分支距离树表示给定的高能剖面相似性。但是当看到远处的树aquaporin-2野生型和它的两个突变体建模(图8(一个)),突变体的能源配置文件匹配很好,不同的能量剖面明显野生型。这是一个强烈的迹象表明这两种模型可以评估正确建模。
(一)
(b)
虽然两种突变导致能量变化在整个能源配置文件,我们集中讨论突变网站(图8 (b)红色箭头)。突变D150E诱发两周围残留的能量增加,因此,减少精力充沛的保护在这些位置(图8 (b),最高)。有趣的是,在这个地区,突变G196D诱发D150E几乎相同的能量增加。突变的建模G196D变体,突变诱发只有轻微的能量差异顺序周围的残留物(图4 (b),底部)。此外,在这个地区,G196D突变导致相同的能量变化D150E突变。有趣的是,两种突变不影响能量守恒Asn-ProAla主题(以红色突出显示矩形)。此外,我们指向G188的能量变化,参与残留水运输(突出了一个橙色箭头)。两种突变导致Gly188一位精力充沛的增加和减少能量在这三个调查能量守恒。因此,它支持发现突变D150E和G196D影响transcellular水运所描述在文献[45]。
4所示。结论
我们研究了膜蛋白参与NDI的稳定性理论假设的基础上。这些理论方法是基于所谓的能量剖面计算中演示了这项工作。这些稳定性分析的基础上,我们能够执行证据对水通量的减少可以诱导突变aquaporin-2。此外,残留的相关性和能量守恒氨基酸参与水运检测。此外,我们专注于选定的点突变在V2R和激素亲和力的影响。根据我们的数据,我们能够执行证据文献中描述。这表明,我们的方法可以成功地用于其他的病有关的研究膜蛋白突变。特别是能量守恒的轮廓区域被确定。一般来说,这种方法证明了其适用性有关类似生物的问题。
确认
这个项目是由自由州的萨克森和应用科学大学的Mittweida,德国。作者感谢丹尼尔Stockmann有益的讨论,动机,和强大的编程。