文摘
本文两个重要的贡献。首先,本文调查数据放置在OpenMP程序的性能影响现代NUMA多处理器上运行。数据局部性和最小化的远程内存访问速度是至关重要的维持在这些系统的高性能。我们表明,由于低远程到本地内存访问延迟比当代NUMA架构,合理平衡页面布局方案,如循环或随机分布,产生适度的性能损失。其次,本文提出了一种透明的,用户级页面迁移引擎有能力挽回任何性能损失源于理想位置的页面在迭代OpenMP项目。本文描述了我们的OpenMP的主体运行时环境使用页面迁移实现隐式数据分布和再分配方案不需要程序员干预。我们的实验结果验证了所提出的框架并提供一个概念验证,没有必要引入数据分布指示OpenMP和保证简单或编程模型的可移植性。