开放获取
Min Zhou, Onkar Sahni, Mark S. Shephard, Christopher D. Carothers, Kenneth E. Jansen, "基于邻接的有限元加速数据排序算法",科学的规划, 卷。18, 文章的ID273921, 17 页面, 2010. https://doi.org/10.3233/SPR-2010-0301
基于邻接的有限元加速数据排序算法
摘要
在高性能计算中,处理器内存层次结构的有效利用是一个重要问题。在这项工作中,部分层次的网格拓扑遍历算法定义了网格顶点和区域的重新排序,增加了数据的空间局部性,提高了处理器有限元计算的整体缓存利用率。考虑了基于自适应创建的非结构化网格的示例,以证明在每个处理核心的负载是变化的但是均衡的情况下(例如,对于给定分区,元素平均分布在各个核心上),该过程的有效性。在一个例子中,研究了当前基于邻接的数据排序对隐式分析的不同阶段的影响,包括元素数据阻塞、元素级计算、稀疏矩阵填充和方程求解。这些结果与重新排序只应用于网格顶点的情况进行了比较。计算在IBM Blue Gene (BG/L和BG/P)、Cray XT (XT3和XT5)和Sun Constellation Cluster等各种超级计算机上进行。我们观察到,在Blue Gene/L和Cray XT5上,重新排序可将每核性能提高24%和40%。CrayPat硬件性能工具用于度量内存层次结构中每一层的缓存未命中的数量。可以确定的是,当使用数据重新排序时,L1、L2和L3缓存miss的测量值下降,与观察到的总体执行时间下降密切相关。
版权
版权所有©2010 Hindawi出版公司。这是一篇发布在知识共享署名许可协议,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。