研究文章

在火花SQL查询执行优化

表2

在成本模型参数。

参数 意义

X 读/写数据的大小
C0 寻找时间和旋转延迟时间
C1 传输1 MB数据所需的时间
Α 非本地数据数据总量的比例
T 的数量/O出现
|D| 阶段输入数据的大小
|D| 阶段输出数据的大小tr在本地时间阅读1 MB的数据
在本地时间写1 MB的数据
tb 时间1 MB数据传输网络
B 缓冲区大小的火星任务任务数量在舞台上