开放访问
伊犁郑那 “优化多核系统的UPC程序“,科学规划那 卷。18.那 文章ID.646829.那 9. 页面那 2010年。 https://doi.org/10.3233/spr-2010-0310
优化多核系统的UPC程序
抽象
统一并行C(UPC)的分区全局地址空间(PGA)模型可以帮助用户在非统一内存访问(NUMA)多核共享存储系统上表达和管理应用程序数据局部性,以获得良好的性能。首先,我们描述了几种UPC程序优化技术,这对于在具有示例和定量性能结果的Numa多核计算机上实现良好性能。其次,我们使用两个数值计算内核,并行矩阵矩阵乘法和并行3-D FFT,以展示UPC应用的端到端开发和优化。我们的研究结果表明,优化的UPC程序在当前的多核系统上实现了非常好的和可扩展性能,甚至可以在某些情况下倾向于优化供应商优化的库。
版权
版权所有©2010 Hindwi Publishing Corporation。这是分布下的开放式访问文章创意公共归因许可证如果正确引用了原始工作,则允许在任何媒体中的不受限制使用,分发和再现。