开放访问
迈克尔·奥特(Michael Ott),jaroslaw Zola,Srinivas Aluru,Andrew D. Johnson,Daniel Janies,Alexandros Stamatakis,,,, “对当前HPC架构的大规模系统发育分析”,科学编程,,,, 卷。16,,,, 文章ID395908,,,, 16 页面,,,, 2008。 https://doi.org/10.3233/spr-2008-0247
对当前HPC架构的大规模系统发育分析
抽象的
由于其巨大的计算要求,系统发育推断被认为是生物信息学的巨大挑战。在当前的生物学研究中,大型多基因对准以及单核苷酸多态性(SNP)的综合数据集的日益普及和可用性,再加上一般序列数据的快速积累,对高性能计算提出了新的挑战。以RAXML为例,RAXML目前是最大可能性(ML)标准下最快,最准确的系统发育推断程序之一,我们演示了如何将系统发育ML函数有效地缩放到当前超级计算机架构(例如IBM Bluegene/L)/l)和SGI Altix。这是通过同时剥削粗粒和细粒并行性来实现的,这是每个基于ML的生物学分析所固有的。使用由270个序列和566,470个碱基对(单倍型地图数据集)和2,182个序列和51,089个碱基对组成的数据集评估性能。据我们所知,这些是迄今为止ML下分析的最大数据集。实验结果表明,细粒平行化尺度最高为1,024个处理器。此外,通过粗糙和细粒并行性的组合可以有效利用大量的处理器。我们还证明,我们的并行化量表在AMD Opteron群集上同样良好,其网络延迟与处理器速度比率较低。最后,我们通过包括对单倍型图数据集分析结果的生物学讨论来强调方法的实际相关性,该研究通过系统发育推断揭示了新的生物学见解。
版权
版权所有©2008 Hindawi Publishing Corporation。这是根据创意共享归因许可证,只要适当地引用了原始作品,允许在任何媒介中不受限制地使用,分发和繁殖。