文摘
识别的抗原表位调用强有力的体液反应在免疫学领域是一个重要的问题。本地化抗原表位的实验方法是昂贵的时间、成本和精力;因此,它的低成本和高速度计算方法特性来预测b细胞抗原表位。在本文中,我们回顾最近的构象b细胞表位预测生物信息学资源和工具,包括数据库、算法、web服务器、和他们的应用程序在相关领域解决问题。刺激更好的工具的发展,一些有前途的方向也广泛讨论。
1。介绍
一个b细胞表位抗原被定义为一个地区或者一个特定的b细胞受体(BCR)或随后引起抗体的体液反应(1- - - - - -3]。b细胞表位可分为两种类型,其空间结构:线性表位或构象表位。班轮抗原决定基(也称为连续抗原表位)连续顺序是由残留,而一个构象表位(也称为不连续抗原决定基)的序列片段包含了相应的抗原折叠时在空间距离。据报道,超过90%的b细胞抗原表位是不连续的b细胞抗原表位(4,5]。
b细胞抗原表位的识别是immunodetection和免疫治疗应用相当重要,因为一个抗原决定基的最小单位是强大到足以引起的体液免疫免疫反应没有对人体有害的副作用(3,6]。表位预测的最终目标是帮助设计的分子,可以模拟一个真正的抗原决定基的结构和功能,在医学诊断和治疗和疫苗设计(2,7]。最可靠的方法来识别抗原决定基的x射线晶体学和核磁共振技术(8,9),但他们是费时和昂贵的。因此,计算方法和工具,低成本和高速度的优点,是用来预测硅的b细胞抗原表位。
抗原和抗体之间的相互作用是一个复杂的生化过程。抗体,“Y”字结构,结合抗原通过高度可变的epitopic地区互补决定区(CDR)。抗原和抗体之间的相互作用主要是通过分子间的连接低能量(如氢键、疏水作用和范德华力)和一些连接的分子间高能源(如盐桥)。此外,由于抗体与抗原相互作用通过深而窄antigen-binding谱号,我们有理由相信,抗原和抗体之间的相互作用涉及两个特定序列识别和相互结构识别。
到目前为止,b细胞表位预测的研究主要针对预测线性抗原表位(10- - - - - -24]。然而,由于大多数b细胞抗原表位构象抗原表位,班轮b细胞表位的预测已经有限的应用程序。近年来,一些计算方法提出了尽管是有限的数量和性能是不重要的25- - - - - -29日]。因此,提高b细胞表位预测的性能,集成多学科知识,结合不同的方法成为一个有前途的未来。
在这项工作中,我们回顾最近的构象b细胞抗原表位预测计算方法的进步,包括数据库、算法、web服务器、及其应用,指出一些问题在当前状态的艺术,并概述一些有前途的方向为提高构象b细胞抗原表位的预测。
2。基于结构的预测方法
基于三维结构的b细胞抗原表位预测抗原始于1999年(30.),预测方法的核心思想是通过3 d抗原结构和epitope-related倾向量表,包括几何属性和特殊的物理化学性质。近年来,随着各种组学和生物信息学的发展,相关实验数据构象b细胞抗原表位的迅速积累。epitope-related数据库的发展促进构象b细胞抗原表位的预测。在这里,我们审查的主要数据库和预测方法基于三维构象b细胞抗原表位抗原的结构。
2.1。数据库
实验数据的可用性在构象b细胞表位预测中起着举足轻重的作用。3 d抗原或抗原抗体的复杂结构存储在数据库(PDB31日],抗原表位和其他关联信息的数据被存储在一些特殊的数据库中。表1列出所有epitope-related数据库以及他们的功能注释。
PDB (31日)数据库编译化合物来自x射线晶体学和核磁共振实验。从PDB的大多数信息数据库是蛋白质的三维结构。一个可以搜索需要结构根据PDB-id主页,然后查看或下载多种格式的结构。清洁能源数据库(32)组成的带注释的抗原表位由实验方法决定的。数据库提供了一个友好的用户界面,和大多数抗原表位在数据库的上下文中可以交互式地查看他们的3 d结构。一个可以浏览所有的条目或搜索特定条目从相应的超链接的主页。IEDB数据库是最常用的和最权威的数据库表位预测(33,34]。IEDB 2.0发布以来,有38552个条目在b细胞表位和少量的集成预测工具为研究者提供很大方便。研究人员可以搜索感兴趣的b细胞表位的下拉菜单首页上的“高级搜索”。艾滋病毒分子免疫学数据库包含HIV病毒抗原表位是由实验(35]。t细胞和b细胞抗原表位抗原表位。该数据库提供了方便的研究特定的HIV病毒抗原表位。
之前的数据库是构象b细胞表位预测的重要资源。这些数据库中的数据提供了一个基础的计算生物学家获得基准和自定义数据集新算法开发和评估工具。
2.2。算法,程序,和他们的应用程序
与mimotope-based预测方法将在下面介绍,基于结构的构象b细胞抗原表位的预测方法有一个好处,那就是它们只需要抗原的结构。1999年,Kolaskar和Kulkarni-Kale使用3 d抗原的结构分析和定位构象抗原表位的日本脑炎病毒通过计算表面访问片段氨基酸(30.]。他们改进了算法和CEP公布2005年第一个构象表位预测网络软件(36]。CEP的基本理想是生成表面抗原片段,然后用这些碎片的空间距离和其他统计特征来定位抗原表位。基于结构的算法,web服务器(程序)和表列出简短的笔记2。
DiscoTope第二基于web的构象表位预测软件(37]。2006年,安德森等人收集的数据集包含76抗原抗体复合物。调查的角色区分抗原表位与nonepitopes的某些特性,大量的统计数据进行了研究,包括抗原决定基的长度和段的分布和单个氨基酸和帕克亲水性的偏好。通过结合统计、空间上下文,DiscoTope可以成功地预测抗原表位的位置在前面提到的数据集。2007年,Rapberger等人提出了一种新的构象b细胞抗原表位预测框架(38]。他们利用互补的抗原表位的几何形状和抗体抗体结合部位,以及测量结合能的抗原和抗体。方法是第一个考虑抗体抗原表位预测研究的信息。
b细胞表位预测的第一次会议于2007年在华盛顿举行。会议发表一个基准数据集格式的构象b细胞表位预测的3 d结构抗原从PDB选择数据库。基准数据集包括62三维结构与推断抗原表位抗原。这个基准测试数据集的建设加速发展的构象b细胞抗原表位预测和评价方法提供了依据。Ponomarenko和伯恩评估CEP DiscoTope使用基准数据集同年[39]。结果表明,两种方法的性能没有超过40%的精度和召回的46%。因此,方法更好的性能仍在伟大的需要。实现这一目标的一个方法是通过开发新的特性,结合他们。
在未来几年内,新提出的构象b细胞表位预测方法设法寻找有效的倾向量表或氨基酸结合可用的物理化学性质和几何结构属性。在2008年,提出了三种构象b细胞表位预测方法:ElliPro [40],PEPITO [41],PEPOP [42]。ElliPro属性的主要思想的班轮b细胞抗原表位预测方法桑顿et al。43]。ElliPro预测构象b细胞抗原表位结合抗原的几何特性和单个氨基酸抗原决定基的倾向。当结构不可用,ElliPro第一个模型的3 d结构抗原通过搜索其同系物在PDB或运行分析员(44]。PEPITO预测使用单一氨基酸的结合构象b细胞抗原表位抗原决定基倾向半球体接触在多个距离值。PEPITO重大的改进之一是,它采用半球体接触的紧密程度描述,后者的启发方法。PEPOP标识段顺序访问和连续的氨基酸组成的三维结构的抗原,然后根据他们的空间集群这些片段距离识别抗原表位。PEPOP的另一个贡献是设计免疫原性肽通过抗原表位鉴定的结果。
SEPPA [45],Epitopia [46],epc (47)在2009年出版。SEPPA采用“单元块残留三角”的概念来描述蛋白质表面的局部空间上下文和“聚类系数”来描述表面残留的空间紧凑。然后,两个特性相结合预测抗原表位。Epitopia采用分区的概念,将一个给定的抗原重叠的表面补丁。然后,分数中央残留的理化和structural-geometrical属性计算每个补丁之前使用朴素贝叶斯分类器预测蛋白的免疫原性的潜在地区。epc提出六个抗原表位的倾向,包括保护得分,侧链的能量分数,联系电话,表面平面化的分数,二级结构组成。的投票机制,epc达到共识的分数代表作为抗原决定基的可能性基于每个特性的规模。基于功能,我们训练SVM分类器预测构象表位(48,测试结果表明,不同的分类方法没有改善的准确性基于这些倾向的预测性能。
开发更好的特性,苏等人强调信息隐藏在抗体抗原和抗体的相互作用的过程中49]。他们定义了antibody-specific抗原决定基的倾向(希腊高级人才选拔委员会)推荐指数。然后,它被用来预测抗原表位结合DiscoTope的结果。本文首次尝试识别抗原表位结合不同的预测方法。2011年,太阳等人收集了最新的综合数据集做了详细的统计分析抗原决定基残留和nonepitope残留物从几个方面50]。抗原和抗体交互模式的研究揭示了抗体在抗原表位预测信息的重要性。同年,两个新的服务器应用程序由同一作者EPSVR和EPMeta epc (51]。EPSVR采用支持向量回归方法整合六个得分方面作为epc,虽然EPMeta metaserver结合EPSVR, epc, Epitopia, SEPPA PEPITO, Discotope1.2。2011年,张等人提出了一种新的表位预测方法(52]。的方法提出了一个概念“厚的表面补丁”,使内部残留的影响,相邻的残渣距离特性,考虑在内。它反映了不平等的贡献相邻残留结合位点的位置和随机森林算法用于处理不平衡数据。代表更高的预测精度方法与其他方法进行比较。
基于结构的构象b细胞抗原表位的预测方法都是基于抗原的结构特点,以及不同的方法使用不同的倾向量表。前面提到的大多数预测方法提供在线服务或程序(见表2)。在线服务有一个用户友好的界面。这些方法的使用很简单。研究人员输入PDB ID在PDB或上传本地文件格式,确定抗原链,并指定相应的阈值根据订单之后得到预测结果。姚明et al。(53)建立一个基准和评估所有现有的性能预测方法。结果表明,EPMeta精度最高的整体价值是所有条件和方法。在不同的情况下预测方法通常不给一个共识的结果,并考虑多种预测方法的结果是一个更好的选择。
2.3。当前的问题
b细胞表位预测基于抗原结构的三维结构已经取得了一些进展,即使这样的方法需要进一步改进。首先数据集,基于机器学习的方法是至关重要的,是相对较小的和不一致的。此外,由于nonepitopic氨基酸被定义为氨基酸不目前确定抗原表位的一部分,待定epitopic氨基酸很可能引入噪声统计学习的过程中。此外,每个方法的输入和输出格式是不同的,很难评估不同的方法的性能。
其次,为了评估的有效性和性能预测方法,这两种抗原结构和表位信息是必要的。清洁能源和IEDB带注释的抗原决定基网站结构的一部分,我们称之为注释的抗原表位,实际上是由湿实验功能性抗原表位。但是这种情况是不一样的对于其他结构。使用这些结构,需要确定结构的抗原决定基通过抗原和抗体之间的距离或访问的表面积(表面(ASA)和赛车54]和NACCESS [55)是常用的计算工具,设计ASA)损失在抗体绑定,我们称这种抗原表位抗原决定基的结构。的不同抗原表位的决心使得预测方法生产相对贫穷的性能结构epitopes-based比基于功能性抗原表位的数据集的数据集。
最后,抗体与抗原结合的空间结构,所以有一个丰富的信息隐藏在抗原和抗体的三维结构。理论上,特征提取的结构肯定会提高现有b细胞抗原表位的性能预测方法。然而,更复杂的提取特征的三维结构比处理的主要抗原序列。特性中提到这些论文没有足够的能力来区分epitopic残留。
3所示。Mimotope-Based预测方法
Mimotope-based预测是一个组合的方法需要affinity-selected肽抗体和抗原的3 d结构作为输入。达到affinity-selected肽,随机肽最初显示在丝状噬菌体的表面。然后,随机肽结合单克隆抗体与一定程度的亲和筛选,筛选了,放大。手术后3 - 5轮,由此产生的肽成为少而与高亲和力。这些affinity-selected肽被定义为mimotopes。Mimotopes和真正的抗原表位结合相同的单克隆抗体和抗体结合部位会引起免疫反应,所以他们有真正的抗原决定基的类似的功能56,57]。此外,一般选择mimotopes分享高序贯相似性意味着某些关键绑定图案和交互过程中物理化学参数存在。因此,映射这些mimotopes回源抗原有助于更准确地找到真正的抗原表位。在下面,我们审查的主要数据库和预测方法基于mimotopes构象b细胞抗原表位。
3.1。数据库
Mimotope-based方法既需要抗原的结构和mimotopes的序列数据。自从3 d抗原的结构可以从PDB或计算获得同源建模、少数mimotope序列来自噬菌体展示成为限制发展的基于mimotopes构象b细胞抗原表位的预测。近年来,几个数据库集成的结构数据,mimotopes数据,和其他联系信息已经发布在Immunoinformatics发挥着基础性的作用。表3列出当前mimotope的数据库中包含的信息。
ASDP策划数据库,将数据完整的蛋白质,蛋白质,蛋白质域,从噬菌体展示肽主要得到实验(58]。它是第一个mimotopes数据库。当前版本发布的2001年有195个条目。ASPD具有用户友好界面,研究人员可以搜索所需的信息通过SRS系统。遗迹肽是一个关系数据库,其中包含超过5000肽序列选择与药物小分子代谢产物以及随机克隆从父母库59]。遗迹肽是必不可少的的一部分遗迹遗物套件对于许多工具依赖于数据。PepBank是一个数据库基于连续的文本挖掘和公共肽的肽数据源(60]。使用可用的序列和数据库存储肽长度等于20种氨基酸或短。PepBank与一个简单的基于web的用户界面,像google一样的搜索功能,先进的文本搜索,爆炸,均为搜索功能。MimoDB是随机的信息门户,biopan结果库(61年,62年]。这是最新的和最大的mimotopes数据库。在2.0版本中,它有15633个肽从849篇论文和组收集到1818套。为每一个条目,目标,模板,图书馆,和结构信息。此外,MimoDB为简单和高级搜索提供了工具,结构可视化、爆炸,对准动态视图。
太阳的基准数据集是由我们的团队在2011年,它是特殊的构象b细胞表位预测基于mimotope分析。现在,我们已经建立了基准2.0。基准2.0由39复杂结构与66 mimotope集;39复杂结构包含16个抗原抗体复合物和23个蛋白质-蛋白质之间的关系结构。此外,我们提供24测试用例代表数据集,只有一个mimotope设置为一个复杂的结构。每组包含了复杂的结构,模板链,mimotopes从相应的噬菌体展示实验,表位信息。所有的数据集可以自由下载用于学术目的。基准数据集可以自由访问http://cs.nenu.edu.cn/bioinfo/benchmark%20datasets/index.html。
前面描述的是重要的参考资料的数据库mimotope-based b细胞表位的预测。这些数据库的大量mimotopes以及蛋白质结构数据库,构造一个基准是可行的开发和评价的新mimotope-based表位预测方法。
3.2。算法,程序,和他们的应用程序
Mimotope-based预测方法是必不可少的地图mimotopes回源表面抗原定位对齐序列和预测可能的epitopic地区最好的。可用mimotope-based算法,web服务器(程序),在表列出和简短的笔记4。
黄等人机密mimotope-based型表位预测分为两类:一个是sequence-sequence对齐方法,另一个是顺序结构对齐方法(63年]。在前面列出的预测方法、FINDMAP EPIMAP, MimAlign MIMOP属于sequence-sequence对齐方法的算法。这些方法的输入是mimotopes和抗原的主要结构。FINDMAP对齐的主题提取mimotopes抗原序列直接评级最好的匹配序列表位候选人(64年]。EPIMAP FINDMAP[的改进版本65年]。它对齐每个mimotope抗原序列,然后选择最相互兼容的排列的一组比对中排名前过滤掉虚假的比对与EPIFILTER程序。MIMOP莫罗等人于2006年提出了(66年),包括两个部分:MimAlign MimCons。MimAlign结合四个多序列比对的结果结合的抗原和mimotopes序列对齐。对于每一个组合的位置对齐,频率和分数计算。收敛的位置然后选择和集群基于拓扑。集群获得视为潜在epitopic地区。
其余的方法属于序列结构对齐方法。此外,黄这些方法分为5类根据均值序列结构对齐的63年]:motif-based方法、pairs-based方法patch-based方法,基于方法和混合方法。
motif-based方法旨在获取主题通过多个对齐mimotopes然后主题映射到表面的抗原定位b细胞抗原表位。欧洲议会议员、3敏捷、MIMOX, MimCons MIMOP算法属于这种。议员是第一个基于mimotope b细胞表位预测方法分析(67年]。议员们第一个模型表面抗原为固定长度的肽,然后将每个短肽的主题来自多个mimotopes对齐的。最好的对齐的短肽被视为候选抗原表位。3敏捷需要C的物化附近α——或Cβ原子个别氨基酸的考虑(68年]。给定的氨基酸在蛋白质、肽序列是本地化的软件在预定义的搜索距离相邻的氨基酸,氨基酸的肽。表面接触的氨基酸也可以考虑。然后重复过程的其余氨基酸肽。这个过程可能会花费几个小时。MIMOX是第一个自由访问web工具mimotope-based b细胞表位预测(62年]。它有两个部分。第一部分提供了一个简单的接口mimotope集的对齐,而第二部分MIMOX地图一个mimotope或一个主题来源于第一部分到相应的抗原和利率的所有集群残留定位天才抗原决定基。MimCons MIMOP的另一部分方法,评估mimotope序列的相似性并相应地集群。主题确定mimotope序列的每个集群。的可及表面抗原扫描找出所有可能的暴露共识模式。空间邻居氨基酸是识别和构成潜在的抗原表位。此外,MimAlign和MimCons可以运行独立或与他们的结果的总和。
pairs-based方法的基本思想是预测b细胞抗原表位的氨基酸组的统计特征。Mapitope和丹尼索瓦属于这种。2003年,Enshell-Seijffers等人描述mimotope-based方法预测抗原表位的hiv - 169年]。首先,他们定义氨基酸对(AAP)与一个预定义的中心碳原子之间的距离阈值两个邻居残留。其次,他们定义统计上显著的双(SSPs)通过计算每个AAP的概率。最后,SSPs映射到三维结构的hiv - 1抗原定位抗原表位。2007年,Bublil等人应用这个方法构象b细胞表位预测和提出了工具Mapitope [70年]。连续工作对丹尼索瓦等人把所有可能的空间,包括对由一个渣分离,两个残基,三个残留等等mimotopes考虑和确定抗原表位模式识别理论(71年- - - - - -73年]。这种方法是专门为阐明表位特异性抗血清。
patch-based方法的核心思想是将抗原的表面分成重叠补丁和选择high-scored候选抗原表位的氨基酸残基比较mimotopes和补丁基于氨基酸序列相似性或统计特征。SiteLight和EpiSearch属于这一类。SiteLight抗原表面分为重叠的补丁,然后将每个mimotope每个补丁。确定候选抗原表位,选择最佳匹配路径重复直到25%的抗原表面覆盖74年]。EpiSearch预测构象b细胞抗原表位的自动序列分析mimotopes和氨基酸的分布比较抗原表面补丁(75年]。mimotopes的氨基酸成分和3 d抗原的比较和量化评分函数为每个补丁的表面抗原。得分最高的输出文件中列出的补丁,也显示表面的蛋白质。
基于方法的主要思想是从抗原氨基酸模型作为一个图结构,使用图搜索方法来定位潜在的抗原表位。PepSurf和Pep-3D-Search属于这一类。PepSurf搜索最佳匹配路径图的构建从抗原mimotope序列使用彩色编码算法和动态规划算法(76年]。Pep-3D-Search寻找匹配的路径抗原表面的蚁群优化(ACO)算法(77年]。候选抗原表位被形成的聚类结果高的路径分数的值深度优先搜索算法。Pep-3D-Search提供了两种模式的b细胞表位预测:(1)mimotope-based搜索和(2)motif-based搜索。
最后一种mimotope-structure对齐b细胞表位预测方法是一种混合方法。MimoPro,这是我们的团队提出的2011年,是第一个试图整合不同的方法。方法采用patch-based和基于搜索的概念78年]。MimoPro的核心是一个搜索算法的一系列重叠的斑块表面的抗原。这些补丁然后转换为图使用一个适应性强的距离阈值(ADT)由紧性因素(CF),提出了一种新颖的参数的方法。然后在每一个补丁,一个完整的搜索进行保证最好的每个mimotope序列对齐。动态规划和分支界限方法也采用了避免重复搜索和进一步缩小搜索空间。
不幸的是,前面的14个方法的可用的服务。目前,只有三个可用的免费网络b细胞表位预测世界上服务平台。第一个是PEPITOPE [79年),它提供在线服务基于三种方法:Mapitope, PepSurf,总和。web服务的三种方法的限制,mimotope序列的长度不能超过14个氨基酸。此外,Mapitope PepSurf也可以在本地运行,和本地版本没有服务限制。第二个是EpiSearch和表位预测方法是EpiSearch只有75年]。EpiSearch mimotope序列的限制,不能超过30个氨基酸。第三预测平台PepMapper由我们的团队发布了2012年5月(80年]。PepMapper也提供在线服务基于三种方法:Pep-3D-Search, MimoPro,总和。由于Pep-3D-Search是基于经验的建立背景分布调整分数每个mimotope和抗原,如果的价值每mimotope大于调整分数,Pep-3D-Search不会给出任何预测结果。在所有这些方法中,只有MimoPro没有限制。的基于结构的构象b细胞抗原表位的预测方法,不同的方法使用不同的预测策略,不会给一个完全一致的预测结果。梁的想法(53),我们认为荟萃分析可能是一个更好的解决方案,我们现在正在从事证明这个想法。
3.3。当前的问题
Mimotope-based b细胞表位预测方法距mimotopes epitopic地区通过信息获得的实验方法。Mimotope-based预测统计更准确,但它需要mimotopes从实验数据的信息。然而,与x射线晶体学和核磁共振方法,体外筛选方法的代价很低。此外,该方法可以定位在一个指定抗原抗体抗原决定基交互上下文。
尽管如此,准确预测抗原表位仍有很长的路要走。在2011年,我们构建了一个基准数据集构象b细胞表位预测和评价五个mimotope-based预测软件产品(25]。结果表明,在没有方法精度的性能超过0.42和0.37的敏感性。表现不佳的预测是根植于几个方面。基准数据集的规模和多样性是不够的,以及许多mimotope-based b细胞表位预测中存在的问题需要进一步研究。MimoPro结合了不同的方法。利用ADT的新奇的想法反映了氨基酸之间的相互作用对的灵活性,MimoPro达到最高灵敏度的方法,但总体性能仍不满意。如何表达构象变化的抗原和抗体的相互作用,如何建立合理的数学模型通过整合mimotopes信息和氨基酸的统计特征,表面抗原和设计智能搜索算法的主要方向是进一步提高mimotope-based b细胞抗原决定基的性能预测方法。
4所示。其他方法
在本节中,我们将关注其他构象表位预测方法的发展除了基于结构的方法和mimotope-based方法。
4.1。序列的方法
序列预测方法仅依赖于抗原的主要序列和继承的想法衬垫b细胞抗原表位的预测。特别是采用倾向量表的方法来衡量每个残留的概率的抗原表位(37]。为了减少波动,通常是使用滑动窗口策略。
2010年,安萨里和Raghava提出一个方法来预测构象的主要序列b细胞抗原表位抗原(81年]。方法,稀疏编码方案(BPP)理化特性(PPP)和氨基酸成分(CCP)从重叠的氨基酸片段中提取切片抗原序列,用来训练SVM的预测。有两个新出版的方法预测构象b细胞抗原表位抗原序列在去年。这两种方法是最好的82年和张的83年)方法。首先他们都提取足够的字符序列,然后最好方法采用支持向量机分类,虽然张的方法采用了集成学习方法来处理各种特性表位预测。
实验要求高分辨率的蛋白质三维结构,大量的蛋白质的三维结构尚未解决,和b细胞表位预测方法基于抗原序列可能值得更深入的研究。与基于结构的预测方法相比,基于方法的性能没有改善很多,但是一想到序列的方法提供了构象b细胞表位预测创新研究的想法。
4.2。结合位点预测方法
抗原和抗体之间的相互作用是一个亚型蛋白与蛋白相互作用,所以一些方法,重点结合位点的预测蛋白质相互作用可以借来的构象b细胞抗原表位的预测。最近,姚明et al。53)建立一个基准和评估所有现有的基于结构的b细胞的性能预测方法,以及4结合位点预测方法:ProMate [84年],ConSurf [85年),受欢迎的86年),和码头87年]。结果表明,表演的结合位点预测方法来预测b细胞抗原表位都明显低于基于结构表位预测方法。事实上,抗原和抗体之间的相互作用不同于其他种类的蛋白质相互作用在某种程度上。例如,蛋白质结合位点通常是守恒的比其他表面残留维持蛋白质的功能,在抗原抗体结合位点(抗原决定基)不太保守由于生存竞争与宿主的免疫系统。因此,使用这些预测抗原表位的预测方法有一定的缺点。更重要的是,需要抗原和抗体结构预测方法,但表位预测方法是用来识别潜在的抗原表位抗原抗体时是未知的。然而,释放结构的表位预测更有实用价值。由于不同的目的,结合位点预测方法没有什么优势表位预测。
5。结论和前景
b细胞表位预测是重要的疫苗设计、诊断试剂的开发,抗原抗体相互作用在分子层面的解释。近年来,随着各种组学和生物信息学的发展,构象b细胞抗原表位的相关实验数据提出了迅速。有关数据库的建设促进构象b细胞抗原表位的发展预测。在这项研究中,我们对生物信息学资源进行系统回顾和构象b细胞表位预测的工具。尽管发展,总体性能还不令人满意。接下来,我们指出的几个方面,可能会提高构象b细胞抗原表位的性能预测。
建立大型和可靠的数据集。需要可靠的数据集应该满足的要求nonredundant抗原结构(绑定或取消绑定),定义良好的b细胞抗原表位,mimotope序列。Nonredundant和丰富的数据集可以避免b细胞抗原决定基的性能预测方法过于乐观。定义良好的b细胞抗原表位抗原决定基的前提下相关特征提取和直接影响预测性能。Mimotopes序列尤为重要的mimotope-based构象b细胞表位的预测。此外,大的和可靠的数据集进行训练和测试很重要。训练数据集用于特征提取和模型训练,而测试数据集负责测试的性能预测方法和评估不同的方法之间的性能。
提取有效的抗原决定基相关的特性。基于结构的构象b细胞表位预测的本质是模式分类。提取有效的抗原决定基相关特性是最重要的部分在基于结构的构象b细胞表位预测方法也是关键在b细胞表位预测。到目前为止,没有单一的特性或者组合的特性,能有效区分从nonepitopes抗原表位。提高构象b细胞抗原决定基的性能预测方法,选择有效的特征,或功能组合以及整合mimotope-based方法可能是一个有前途的领域。
设计智能搜索算法。mimotope-based构象b细胞表位预测的本质是寻找类似的序列mimotopes表面抗原。智能搜索算法可以改善方法的有效性,以及预测的性能。
确认
这项工作是由中国国家自然科学基金(没有。61172183),东北师范大学青年教师科学基金会(没有。12 qnjj005),吉林省的2012个博士后研究项目和科技项目的吉林省中医药管理局(2011 - zol16)。