文摘
的一个挑战实现良好的性能在多核架构的有效利用底层内存层次结构。虽然这是单核架构的问题,这是一个多核芯片的关键问题。在本文中,我们制定统一的多核模型(嗯)来帮助理解的基本限制在这些架构缓存性能。嗯无缝地处理不同类型的多核心处理器与不同程度的各级缓存共享。我们表明,我们的模型可以用来研究各种多核体系结构在各种应用程序。特别是,我们使用它来分析一个期权定价问题使用三项式模型并开发一个算法,算法内存缓存之间的交通水平。我们实现了算法的两个5310年英特尔四核至强1.6 GHz处理器(8核)。它达到峰值19.5 GFLOPs的性能,这是多核系统的理论峰值的38%。我们证明我们的算法优于compiler-optimized和auto-parallelized代码的7.5倍。