研究文章

在火花SQL查询执行优化

表3

缓存大小的比较有和没有合并中间数据关联算法。

Id 1 2 3 4 5 6 7 8 9 10 11

输入数据(MB) 256年 896年 384年 1024年 1792年 1664年 640年 384年 256年 640年 256年
引发缓冲区(MB) 227年 792.2 340年 908.8 1590年 1476年 568年 340.8 227.2 568年 227.2
SSO缓冲区(MB) 178年 625.8 268年 715.2 1251年 1162年 447年 268.2 178.8 447年 178.8