研究文章

查询执行优化SparkSQL

算法一

算法构建变量宽分布直方图
构造多维分布直方图
输入:H级险阻={ , . }
输出:H级宽度={ 一号结束 一号时段 一号> 2结束 2时段 2. m结束 m时段 m>}
程序化
++1H级宽度⟵ {}
启动attr一号脱机end ⟵ attr一号;
max ⟵ freq一号;T级freq一号
时段N级多做
+1
ifmax-freqe/freqe< 0.05并发
end ⟵ attr
T级T级+freq
iffreq最大值并发
max ⟵ freq
结束if
其余
H级宽度H级宽度+ T级>
启动attr脱机end ⟵ attr
max ⟵ freq;T级freq
结束if
句尾
结束过程