科学规划

科学规划/2010年/文章
特刊

探索语言表达媒体到芯片碎片并行性

查看此特殊问题

开放访问

18. |文章ID. 646829. | https://doi.org/10.3233/spr-2010-0310

伊犁郑 优化多核系统的UPC程序“,科学规划 卷。18. 文章ID.646829. 9. 页面 2010年 https://doi.org/10.3233/spr-2010-0310

优化多核系统的UPC程序

抽象

统一并行C(UPC)的分区全局地址空间(PGA)模型可以帮助用户在非统一内存访问(NUMA)多核共享存储系统上表达和管理应用程序数据局部性,以获得良好的性能。首先,我们描述了几种UPC程序优化技术,这对于在具有示例和定量性能结果的Numa多核计算机上实现良好性能。其次,我们使用两个数值计算内核,并行矩阵矩阵乘法和并行3-D FFT,以展示UPC应用的端到端开发和优化。我们的研究结果表明,优化的UPC程序在当前的多核系统上实现了非常好的和可扩展性能,甚至可以在某些情况下倾向于优化供应商优化的库。

版权所有©2010 Hindwi Publishing Corporation。这是分布下的开放式访问文章创意公共归因许可证如果正确引用了原始工作,则允许在任何媒体中的不受限制使用,分发和再现。


更多相关文章

PDF. 下载引用 引文
订单印刷副本订购
意见331.
下载282.
引用

我们致力于尽可能快地分享与Covid-19相关的结果。我们将为已接受的研究文章提供无限的出版费用豁免,以及与Covid-19相关的报告和案例系列。评论文章被排除在此豁免政策之外。在此注册作为评论员,帮助快速跟踪新的提交。