基于邻接的有限元加速数据排序算法

摘要

在高性能计算中，处理器内存层次结构的有效利用是一个重要问题。在这项工作中，部分层次的网格拓扑遍历算法定义了网格顶点和区域的重新排序，增加了数据的空间局部性，提高了处理器有限元计算的整体缓存利用率。考虑了基于自适应创建的非结构化网格的示例，以证明在每个处理核心的负载是变化的但是均衡的情况下(例如，对于给定分区，元素平均分布在各个核心上)，该过程的有效性。在一个例子中，研究了当前基于邻接的数据排序对隐式分析的不同阶段的影响，包括元素数据阻塞、元素级计算、稀疏矩阵填充和方程求解。这些结果与重新排序只应用于网格顶点的情况进行了比较。计算在IBM Blue Gene (BG/L和BG/P)、Cray XT (XT3和XT5)和Sun Constellation Cluster等各种超级计算机上进行。我们观察到，在Blue Gene/L和Cray XT5上，重新排序可将每核性能提高24%和40%。CrayPat硬件性能工具用于度量内存层次结构中每一层的缓存未命中的数量。可以确定的是，当使用数据重新排序时，L1、L2和L3缓存miss的测量值下降，与观察到的总体执行时间下降密切相关。

科学的规划

摘要

版权

更多相关文章

相关文章