文摘
格点量子色动力学(量子色)模型基于四维时空连续体离散亚原子交互。晶格量子色的计算是一个重大挑战在物理学特别是建模与小晶格间距。在这项工作中,我们研究的主要内核例程的实现晶格量子色主导执行时间在细胞宽带引擎。我们解决这个问题的有效的SIMD执行和有限带宽的问题与片外存储器的数据传输。高效的SIMD执行,我们现在运行时数据融合技术组数据同样在运行时处理。我们还需要介绍分析减少稀缺的内存带宽的压力,限制了性能的计算。我们研究了两种实现的主要内核例程访问内存,从而表现出不同的模式允许不同的优化。我们展示的属性使人实现更有利的性能代价。格子大小明显大于本地存储,我们的实现达到31.2 GFlops单精度计算和16.6 GFlops PowerXCell 8我双精度计算,一个数量级比性能达到最通用的处理器。