文摘
更详细描述的残基之间的相互作用,提出了网络模型的一种氨基酸,它包含两种类型的weight-similar重量和不同的重量。链接是基于一个自洽的重量统计不同类型的氨基酸之间的接触电势。在这个模型中,我们可以得到一个更加合理的残基之间的距离。此外,与网络参数,平均最短路径长度,我们可以得到一个更准确的反应分子的大小。这种氨基酸网络是一个“小世界”网络,和网络参数对蛋白质的构象变化十分敏感。对于一些疾病相关蛋白质,氨基酸网络的高度中央残留高度相关的热点。在相关药物的化合物,这些残留直接与药物相互作用或接触药物的残留。
1。介绍
在活细胞中,蛋白质是非常重要的分子,他们参与几乎所有的细胞功能。在这些生物活性,某些蛋白质的结构显示了明显的构象的灵活性。生物功能的正确和快速实现通过构象变化,需要有运动协调的不同部分的残留蛋白质。在这个过程中,一个快速的通信机制是至关重要的残基之间的信息共享对这些共同行动。事实上,这种信息交换是通过残基之间的相互作用。但是当我们把这些残留物以及它们之间的相互作用,蛋白质变成了一个非常复杂的系统。
另一方面,从复杂网络的角度(1,2),一个蛋白质分子可以被视为一个复杂的网络。在这个网络中,每个残渣可以简化为一个节点,不同残基之间的相互作用是作为链接。用这个有用tool-complex网络,一些新的研究思路和方法应用于结构关系的研究,和一些现象可以通过这个网络的分析来解释。等相关工作的识别“关键残基”通过网络parameter-betweenness [3]。在测量过程中蛋白质接触网络的拓扑结构,结果表明,折叠的动态能力是由蛋白质构象的拓扑性质(4]。通过生物网络,可以分析蛋白质结构的刚度和灵活性。此外,使用这种方法,细胞骨架可以讨论了张拉整体结构(5]。网络模型也被广泛用于药物设计和药物发现6]。
氨基酸的网络,每个残留是简化为一个单点,这个点是作为网络节点。一般来说,选择碳α随着网络节点。在其他一些网络模型,α和β碳碳之间的点是用来作为网络节点。这些节点之间的链接是取决于它们之间的距离。如果两个节点之间的距离小于一个截止值,然后将这两个节点之间存在某种联系。这个截止通常设置为7.0埃(7)或设置为8.5埃(3]。
有另一种类型的氨基酸网络模型。在这个模型中,每个残留也简化为一个节点。但是两个节点之间的联系是基于原子接触这两个残留物。截止值- 4.5埃(8),或5.0埃(9),作为标准原子之间的联系。如果有一个原子接触两个残留,将连接这两个节点的链接。不同的氨基酸网络模型,标准规定残渣联系人已经回顾和分析(10]。摘要Miyazawa-Jernigan潜在的用于构造链接的重量,所以侧链中心用于表示节点,并使用的截止值Miyazawa Jernigan也用于这项工作(11,12]。
的加权氨基酸网络链接是基于接触不同的残留,链接的重量之间的接触概率可以从不同的残留3),或重量可以来自一个统计残渣接触电势(11- - - - - -13]。与接触电势的链接权重,权重弹性网络模型用于计算蛋白质结构动力学(13]。网络模型的基于原子接触,链接的权重可以推导出原子接触节点的数量。此外,当氨基酸的多样性考虑,可以修改这些权重归一化因子(8]。
重量的链接,它可以分为两种类型。一个是类似的重量,另一个是不同的重量(14]。对于类似的重量,这个值描述两个节点之间的相似性。更高的价值意味着两个节点更相似,和它们之间的距离会更短。对于不同的重量,重量值更高,相应的两个节点之间的距离较长,意味着这两个节点之间的区别更明显。
氨基酸加权网络的相关研究工作正在进行中,许多问题需要探讨,如哪些参数应该选为重量以及如何分配重量与一个更合理的模式。在我们之前的工作中,我们提出了一个重量氨基酸模式15),但只使用一种weight-similar重量在前面的模型,所以我们不能得到更详细的描述残基之间的相互作用情况。
本文将修改前面的模型与两种类型的重量,和本文使用的重量是基于一个自洽的统计接触之间的能量残留(12]。在本文中,首先,加权网络的施工方法进行了比较。197年蛋白质同源性较低,加权氨基酸网络构建和这些网络的统计特征参数进行了研究,包括平均聚类系数()和平均最短路径长度()。第三,这种加权网络,为了得到一个关系网络参数的变化和改变蛋白质的构象,我们研究的平均最短路径长度的变化小的蛋白质CI2高温展开通路。最后,以FKBP-FK506作为一个例子,我们展示的应用氨基酸网络在药物设计。
2。理论和方法
在这个加权氨基酸网络,对于每一个氨基酸,侧链的几何中心选择代表了网络节点。一对节点之间的联系是取决于它们之间的距离。如果残基之间的距离和(标注)小于截止(),他们之间会有一个链接。摘要截止6.5埃。因此,未加权的氨基酸网络的邻接矩阵的元素可以表示如下:
基于残基之间的接触电势,可以构造加权网络。在前面的模型中,我们使用另一组潜在的联系。所有的物品接触电势是小于零,和排斥相互作用的计算残留很复杂。
在这项工作中,我们采用自洽interresidue接触电势来构建链接的权重。在这种接触电势,如果两个残留物被吸引在大多数情况下,它们之间的潜力会得到一个负值,如果他们拒绝一般,可能将是一个积极的价值。通过这种接触电势,邻接矩阵元素的加权网络可以表达为氨基酸 在这个定义中,我们把残基之间的接触电势和标记为体重的联系。的价值残留的类型有关吗和。残基之间的共价键和假设,链接权重为零。
在这种氨基酸网络,如果两个节点所吸引,他们之间的潜在负实数,所以,他们会得到一个负重量之间的联系。如果这两个节点之间的吸引力变得更强,体重的绝对值将成为一个更大的问题。然后,负重量可视为一个类似的重量。出于同样的原因,如果两个节点是厌恶,它们之间可能对应于一个正实数,以及它们之间的链接会得到一个积极的重量。当这两个节点之间的斥力强,链接将得到更大的积极的重量值。所以,积极的重量可以视为不同的重量。
因此,基于加权邻接矩阵,矩阵的距离可以构造和定义的元素可以编写如下。我们认为这个定义定义1:
当两个残基之间的相互作用是一个有吸引力的互动,相应的链接权重是相似的。在这个距离的定义,一个倒数函数的重量用于表示吸引一对节点之间的距离。更强的吸引力之间的交互残留,短于他人之间的实际距离。因为体重的吸引力是负的,一个更大的绝对值对应于一个较短的距离,距离矩阵中定义。
同时,如果排斥残基之间的相互作用,相应的链接权重是不同的。它们之间的距离的定义是一个线性组合函数的重量。更强的排斥作用,对应于它们之间的实际距离更长,会得到一个更大的距离值的距离矩阵。
这项工作中所使用的网络模型是一个无向模型,和链接就是代表这两个残基之间的相互作用的存在。链接的两端的地位是平等的。所以,加权网络和无关紧要的一个,邻接矩阵都是对称矩阵。距离矩阵,类似的重量和不同重量在相同的距离矩阵,同时共存的,距离矩阵也是对称的。
对比不同的定义,如果我们不区别对待类似的重量和不同,和不同的重量在这个模型中,使用下面的距离矩阵可以被定义为。我们标记它定义2:
另一方面,我们可以把不同的体重相似的重量。节点之间的距离可以被定义为下面,并贴上定义3:
此外,一个新的网络parameter-strength-is氨基酸引入到加权网络。节点的强度可以写成(16,17] 在哪里网络节点的数量和吗是加权邻接矩阵的一个元素。
加权网络的聚类系数可以计算使用下一个表达式(16,17]: 在哪里节点的强度吗,是它的程度。的手段和相同的表达式(2)。
节点的中间状态可以被定义为以下(18]: 分母是间最短路径的数量和,分子间最短路径的数量和通过节点。中间性是一个有用的措施,对节点对网络的重要性。为了反映不同节点的中间性的意义的介绍了分数的定义得分为如下(19]: 在哪里中间性的残渣,是所有蛋白质残留的中间性的平均值,然后呢这些中间状态的标准偏差值。
3所示。结果与讨论
3.1。比较不同距离的定义
合同潜在的用于构造加权网络,范围从1.19−0.76的值。相应的距离不同的权重,得到三种不同定义的距离矩阵,如图1(一)。从这个图中,我们可以看到,当残基之间的相互作用是一个排斥相互作用,如果链接权重是类似的重量,得到的距离距离定义3将急剧增加。但基于常识,这是不合理的。
(一)
(b)
另一方面,统计计算过程的自洽统计不同类型的氨基酸之间的接触电势,截止6.5埃,这截止仍被用于接触定义之间的残留。所以,两个网络节点之间的距离应小于6.5埃。在统计计算过程中节点之间的实际距离,实际结果表明,该距离范围从3.88到6.5埃。配给的最大值与最小值约为1.7。在定义3中,由于距离的大幅增加,这一比例大约是9。但对于定义1和2,这个配给大约是3。它可以得出结论,在定义3中,它不是一个合理的假设,积极的重量被视为类似的重量。
在我们以前的工作,只有一个类型的weight-similar重量。这个定义应该修正如下:与一个积极的体重应该分配一个不同的重量,定义的规则2。
同时,统计计算过程中节点之间的实际距离,正如上面提到的,结果表明,绝大多数的距离大约是5埃,而且大部分的这些节点之间的相互作用是一个有吸引力的一个。所以,中间的一部分weight-distance曲线应该是一个接近水平线。曲线的负重量,定义3比的定义水平2。这一现象表明,当链接权重是一个负值,类似重量的假设是更适合反映事实。
基于上述讨论,我们可以看到类似的假设是合理的负重量,重量和重量不同的假设适用于积极的价值。把这些放在一起,我们可以定义1,以下计算距离将使用定义在(3)。
197一组蛋白质从蛋白质数据库(PDB)中选择加权氨基酸网络构造。这些蛋白质包括四种结构类型:,,,。解决这些选定的蛋白质比1.8Å和序列身份还不到20%。蛋白质的大小改变从51到779年残留。计算距离矩阵,定义1。
回转半径是一个有用的参数来表示一个分子的大小。网络模型,也可以使用平均最短路径长度作为分子大小的指标。对于数据集,我们计算每个蛋白质的回转半径GROMACS [20.]。与此同时,我们可以得到的平均最短路径长度加权氨基酸网络。之间的关系与回转半径的平均最短路径长度如图1 (b)。相关系数的定义1中的路径长度与回转半径是0.96。相关系数是0.95定义2和0.79定义3。定义1得到最好的结果。
3.2。氨基酸网络的小世界特性
“小世界”特性是一个非常重要的角色对于复杂的网络,和“小世界网络”在现实生活中无处不在,如神经网络(21,22)和基因网络(23,24]。一个生动的例子“小世界网络”的“六度分离”(21,25]。在一个小世界网络,大多数节点不直接连接一个链接。但由于节点之间的捷径,大多数节点可以达到通过少量的其他步骤。随着节点数的增加,节点之间的最短路径距离充分生长缓慢,它可以表示为一个函数的对数网络中节点的数量。
复杂网络和随机网络,如果他们有相同的节点数和相同的链接数量,当某些条件得到满足,可以认为它拥有复杂网络的“小世界”特性。这些条件包括两个项目,第一个是平均聚类系数复杂网络的远比随机网络,第二个条件是,平均最短路径长度约等于的随机网络。这些条件可以显示以下表达式(21]: 在这种不平等,和随机网络的网络参数。聚类系数和平均吗平均最短路径长度。和可以用以下表达式计算(21]: 在这个表达式,节点数量和吗随机网络的平均度。
“小世界”网络,大多数从其他节点可以达到快速通过残基之间的“捷径”。所以,网络的平均聚类系数将得到一个相对较大的值,和平均最短路径长度(也被称为:特征路径长度)将保持尽可能小的随机网络。
197个蛋白质,我们构造加权网络和计算平均聚类系数和平均最短路径长度和距离矩阵的定义。数据2(一个)和2 (b)显示这些结果。同时,随机网络具有相同的大小,这两个参数计算结果如图2(一个)和2 (b)。从这两个数字,我们可以看到,加权氨基酸网络,包含相似和不同重量的链接时,存在一个明显的“小世界”属性。从其他作品,我们已经知道氨基酸网络是一个“小世界”网络,因此,这些结果证明区别介绍相似和不同的权重合理,施工方法的加权网络也是理性的。
(一)
(b)
在氨基酸网络,很少残留高度值。他们通常躺在球状蛋白质的核心,作为网络的中心8,26]。这些中心之间有更多的互动与其他残留残留,所以这些中心残留扮演着至关重要的角色,整个蛋白质结构的稳定性(7,8,27]。在一些其他的工作,为了体现当地环境的影响,残渣集群的分布进行了分析,结果是对数正态分布分布(28]。
3.3。平均最短路径长度的变化与构象变化
为探索网络参数的变化与蛋白质构象的变化,蛋白质CI2 (PDB代码:3 CI2)被选为研究对象。
与医学程序GROMACS 3.3 [20.),分子动力学(MD)模拟了在498 K为11.2 ns。这个仿真中使用的力场参数取自GROMOS96 43 a1和SPC / E水模型被使用。仿真后,这种蛋白质会展开,大多数二级结构解聚。然而,蛋白质仍然保持一个随机线圈状态。MD轨迹数据,我们提取结构的区间100 ps氨基酸,然后构造加权网络。在这个演变路径,随着构象变化,平均最短路径长度的变化规律(短:)进行了分析。这种变化的用于表示的构象变化,结果如图3。
演变路径,当结构变得松散,氨基酸的平均最短路径长度加权网络变得更长。在高温下,蛋白质的演变,疏水核心将被摧毁。在这个过程中,hydrophobic-hydrophobic链接,对蛋白质结构的稳定性很重要,必被折断。这些hydrophobic-hydrophobic链接都有负重量,这些链接的距离小于1。因此,当疏水核心有损,最短路径长度将增加更明显。从图3,我们可以看到定义1中的平均最短路径长度对构象的变化更敏感比其他两个定义。
3.4。氨基酸的应用在药物设计网络
药物作用的过程中,许多药物相关的蛋白质作为他们的目标。这一目标蛋白质的结构和动态举行一个非常重要的作用药物的治疗效果。残留位于绑定网站绑定至关重要和复杂的稳定性。这些残留物往往紧密和可以提供的主要部分结合自由能的减少。他们通常被称为热点,氨基酸网络的中心节点通常可以作为热点[预测19,29日,30.]。与支持向量机技术,提出了一种模型预测的血红素蛋白的结合位点29日]。这个模型包含三种类型的信息:第一个是序列信息,第二个是结构的几何信息,最后一个是基于一些氨基酸网络参数。一些基于氨基酸评分函数网络还提出了蛋白质对接(31日- - - - - -33]。在这里,我们用免疫抑制剂药物(吸收FK506)绑定protein-FKBP [34)作为一个例子来显示氨基酸网络在药物设计中的应用。
FKBP或吸收FK506结合蛋白(PDB ID: 1 fkf),是一种immunophilins蛋白,参与免疫反应的途径,作为免疫抑制剂药物的目标(吸收FK506)。通过绑定FKBP吸收FK506, T细胞的信号转导将被阻塞,然后会干扰正常的免疫系统反应(35,36]。
图4显示了复杂的结构与吸收FK506 FKBP。
结构,我们可以画出详细信息的复杂的结合位点包含哪些部分药物和蛋白质的哪个部分。我们可以发现,如上结构显示,螺旋和表的FKBP形成一个空腔,吸收FK506与FKBP浅腔有约束力。对于这种结构,我们构建其氨基酸网络,然后计算相关的网络参数(中间状态)与相应的分数。在这项工作中,只有得分值,大于或等于3.0,被认为是一个重要的,和相应的节点(在接下来的部分将讨论19]。1 fkf,计算结果表明,只有两个节点得到更高得分值:瓦尔63年和板式换热器99年。与此同时,FKBP之间的接触和吸收FK506计算。比残渣为吸收FK506拥有更大的体积,因此,我们使用原子吸收FK506 FKBP之间的联系。检99年有十个原子接触吸收FK506,这些联系主要是由于侧链板式换热器99年参与组装的绑定腔与其他残留物。对于Val63年与吸收FK506,虽然没有直接的互动,它有九个原子接触Trp59,Trp59通过20个原子接触和吸收FK506互动。高的节点得分值为1 fkf,要么是对应的热点或残留有直接互动与配体(19]。
我们也把复杂fkbp12雷帕霉素(PDB ID: 1 c9h [37)和1 fkb [38])来计算氨基酸评分值为每个节点的网络和与FKBP确定药物之间的联系。结果还表明,高的节点分数值与节点直接与药物相互作用或与药物直接接触。这三个蛋白,该地区从板式换热器99年瓦尔101年所有包含与药物的结合位点。一个是检99年1 fkf和1 fkb,瓦尔101年1 c9h。另一方面,当吸收FK506 FKBP绑定,我们可以发现FKBP的结构是弱小的变化,但吸收FK506的结构性变化很大。所以,我们可以推断出FKBP相关药物的结合位点是空间守恒的。这个有用的信息有助于一些新药的设计,具有更好的疗效比吸收FK506或更少有毒。
4所示。结论
修改加权氨基酸网络基础上提出了一种有潜在的联系。这个模型包含两种类型的重量,一个是同样的重量,另一个是不同的重量。通过分析不同距离的定义的影响权重的基础上,它是显示的距离定义包含两种类型的权重更加合理。平均最短路径长度有显著线性相关与分子的回转半径。197年一组蛋白质,通过分析网络参数的加权氨基酸网络,发现加权氨基酸网络拥有一个明显的“小世界”属性。此外,蛋白质CI2为例,通过分析变化的加权网络参数演变路径,是观察到的最短路径长度加权网络的蛋白质是展开时将日益上升。高度中央残留氨基酸网络发挥关键作用的蛋白质与药物的绑定。这些中央节点直接与药物相互作用或联系与残渣直接与药物相互作用。换句话说,这些中心之间的交互路径与药物残留,最多,他们之间有一个间隔。
这个修改后的加权网络,其中包含两种类型的权重,是比以前更合理的模型。这项工作有助于结构关系的研究,也有利于药物设计。
确认
这项工作得到了国家自然科学基金(批准号31070828,31070828,11032008),《中国博士后科学基金资助项目(批准号2012 t50247, 20100471587),项目创新人才的高等学习机构山西,和山西省自然科学基金(批准号2009021018 - 2)。本文的早期版本在国际会议上提出了ICISE 2010。