研究文章

NUMA系统多芯处理程序局部任务调度和数据分发

图7

性能数据分布加工作疏通和局部感调度 八节Opteron系统执行时间规范化工作移植使用内存页面插接 Numactl面向每一基准输入地图:48浮点向量,各1MBJacobi: 16384x16384浮点矩阵和块尺寸=512matmul:4096x4096浮动点矩阵和块尺寸=128sparseLU:8192x8192浮点矩阵和块尺寸=256减少量:256MB浮点数组和深度=10Numactl分页和局部感调度组合排除,因为局部感调度程序目前不支持查询numactl页面局部信息局部性定位与启发引导数据分布相配合,提高或保持性能比工作定位