文摘

QR分解是最重要的一个操作在密集的线性代数,提供一个数值稳定的方法求解线性系统的方程包括超定的和欠定的系统。现代的实现QR分解,如LAPACK图书馆,遭受性能限制由于使用矩阵向量类型的操作分解阶段的面板。这些局限性可以通过使用更新的想法的QR分解,呈现一种算法,更可伸缩的,更适合在多核处理器上实现。它演示了如何细胞的潜在宽带引擎可以利用充分利用新算法,成功地利用芯片的功能单指令多数据并行性而言,指令级并行性和线程级别的并行性。