文摘
可用性的大规模并行处理器平台由成千上万,有可扩展的并行发展的重大动力稀疏线性系统动力学和预调节器。这个设计过程的一个组成部分性能模型的预测性能的发展,为解决和预调节器提供准确的成本模型。有一些工作在过去的描述迭代解决者本身的性能。在本文中,我们调查的问题描述带状预调节器的性能和可伸缩性。最近的研究表明联合预调节器的优越的收敛特性和鲁棒性,而先进的ILU预调节器以及代数多重网格预调节器的家庭。此外,结合使用时有效解决带状,带状time-to-solution预调节器能够明显更快。我们联合解算器,截断峰值算法是专门为并行设计的性能和宽容深内存层次结构。其常规结构也非常适合准确的性能表征。使用这些特性,我们本文得出以下结果:(i)我们开发并行的配方截断解算器,(2)我们开发一个高度精确pseudo-analytical并行性能模型解算器,(3)我们展示良好的预测能力的模型——基于我们认为我们解决的高可伸缩性。我们pseudo-analytical性能模型是基于分析每个阶段的解算器的性能表征。 These analytical models are then parameterized using actual runtime information on target platforms. An important consequence of our performance models is that they reveal underlying performance bottlenecks in both serial and parallel formulations. All of our results are validated on diverse heterogeneous multiclusters – platforms for which performance prediction is particularly challenging. Finally, we provide predict the scalability of the Spike algorithm using up to 65,536 cores with our model. In this paper we extend the results presented in the Ninth International Symposium on Parallel and Distributed Computing.