开放获取
C.艾迪生,Y. Ren, M. van Waveren, "并行BLAS和LAPACK库开发中出现的OpenMP问题",科学的规划, 卷。11, 文章的ID278167, 10 页面, 2003. https://doi.org/10.1155/2003/278167
并行BLAS和LAPACK库开发中出现的OpenMP问题
收到了
2003年5月12日
接受
2003年5月12日
摘要
密集线性代数库需要有效地处理一系列输入问题的大小和形状。从本质上说,这意味着并行实现必须利用并行性。虽然OpenMP允许在共享内存环境中利用相对细粒度的并行性,但它目前缺乏一些特性,无法轻松地在多个数组索引上划分计算,或重叠顺序和并行计算。OpenMP等共享内存模式固有的灵活性在需要跨连续并行库调用优化性能时带来了其他困难。从分布式内存范例中借用的概念,如显式数据分布有助于解决其中一些问题,但在SMP上下文中,把重点放在数据而不是工作分布上似乎是错位的。
版权
版权所有©2003 Hindawi出版公司。这是一篇发布在知识共享署名许可协议,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。