开放获取
库马尔,学术界。黄,p . Sadayappan前作空。约翰逊, ”的张量积形成的Strassen矩阵乘法算法内存减少”,科学的规划, 卷。4, 文章的ID636457年, 15 页面, 1995年。 https://doi.org/10.1155/1995/636457
的张量积形成的Strassen矩阵乘法算法内存减少
收到了
1994年9月17日
接受
1995年4月17日
文摘
在本文中,我们提出一个代Strassen战略矩阵乘法算法的程序使用一个基于张量积公式的编程方法。在这种方法,块递归程序,如快速傅里叶变换和Strassen矩阵乘法算法表示为代数公式涉及矩阵张量产品和其他操作。这样的公式可以系统地翻译高性能并行/矢量编码不同的架构。在本文中,我们提出一个nonrecursive Strassen算法的实现共享内存克雷Y-MP等向量处理器。之前的实现所需的Strassen从张量积公式算法合成工作存储大小的O (7n)乘以2n×2n矩阵。我们提出的修改制定工作存储需求是减少到O (4n)。修改后的配方展品充分有效的实现对共享内存的多处理器并行性。在克雷Y-MP8/64性能结果。
版权
版权©1995 Hindawi出版公司。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。