开放获取
卡特·爱德华兹,丹尼尔·桑德兰,维姬·波特,克里斯·阿姆斯勒,山姆·米什, "多核性能可移植性:Kokkos多维数组库",科学的规划, 卷。20., 文章的ID917630, 26 页面, 2012. https://doi.org/10.3233/SPR-2012-0343
多核性能可移植性:Kokkos多维数组库
摘要
大型、复杂的科学和工程应用程序代码需要大量的计算内核来实现其数学模型。将这些计算内核移植到现代多核加速器设备集合是一个主要挑战,因为这些设备具有不同的编程模型、应用程序编程接口(api)和性能需求。Kokkos Array编程模型提供了基于库的方法来实现性能可移植到cpu -多核和GPGPU加速器设备的计算内核。这个编程模型基于三个基本概念:(1)多核计算设备,每个都有自己的内存空间,(2)数据并行核和(3)多维数组。内核执行性能,特别是对于NVIDIA®设备,非常依赖于数据访问模式。对于不同的多核心设备,最佳数据访问模式可能是不同的——可能导致针对不同设备的计算内核的不同实现。Kokkos Array编程模型通过(1)通过多维数组API将数据访问模式从计算内核中分离出来,以及(2)在编译内核时引入特定于设备的数据访问映射,从而支持性能可移植性内核。Kokkos Array的实现可以通过Trilinos [Trilinos网站,http://trilinos.sandia.gov/, 2011年8月]获得。
版权
版权所有©2012 Hindawi出版公司。这是一篇发布在知识共享署名许可协议,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。