开放访问
亚历山大·拉米雷斯(Alejandro Rico),亚历克斯·拉米雷斯(Alex Ramirez),,,, “单元格上可用的任务级并行性”,科学编程,,,, 卷。17,,,, 文章ID741282,,,, 18 页面,,,, 2009。 https://doi.org/10.3233/spr-2009-0269
单元格上可用的任务级并行性
抽象的
CHIP多处理器(CMP)是一种明确的工业趋势,是进一步提高绩效的最有效方法。异构的CMP体系结构通过使用多种类型的处理器来沿此功率效率趋势迈出一步,这些处理器是针对他们将执行的工作负载量身定制的。编程这些CMP架构已被确定为在不久的将来的主要挑战之一,编程异质系统更具挑战性。允许程序员可以识别并行任务的高级编程模型以及任务间依赖项的运行时管理已被确定为用于编程此类异构CMP体系结构的合适模型。在本文中,我们分析了Cell SuperScalar的性能,SuperScalar是一种基于任务的编程模型,用于细胞宽带引擎架构,以扩展到更高数量的芯片处理器。我们的结果表明,PPE组件的低性能将某些应用程序的可伸缩性限制为少于16个处理器。由于PPE已被确定为限制元素,因此我们执行一组仿真研究,以评估阶外执行,分支预测和较大的缓存对任务管理开销的影响。我们得出的结论是,越来越多的执行是一个非常理想的功能,因为它将任务管理绩效提高了50%。我们还将内存延迟确定为性能的基本方面,而工作集并不大。如果任务管理将使用快速的私有内存来存储任务依赖关系图,而不是依靠高速缓存层次结构,我们会预计会产生重大的性能影响。
版权
版权所有©2009 Hindawi Publishing Corporation。这是根据创意共享归因许可证,只要适当地引用了原始作品,允许在任何媒介中不受限制地使用,分发和繁殖。