研究文章

在火花SQL查询执行优化

算法2

连接操作的元组数计算直方图的方法。
由直方图方法估计大小的连接操作
输入:HR= {h1r,h2r、…hnr},HS = {h1年代,h2年代、…h年代}
输出:总元组和后加入;
过程
⟵1;j⟵1;和⟵0;
nj;
如果hhj有重叠然后;
重叠⟵重叠两个直方图的桶;
templeft⟵h同学/(∗重叠h指标,最终h.start)
tempright⟵hj同学/(∗重叠hj指标,最终hj.start)
和⟵和+ templeft∗tempright /重叠
如果h指标<最终hj.end然后
+ 1
其他的
jj+ 1
如果
其他的
如果h指标<最终hj.start然后
+ 1
其他的
jj+ 1
如果
如果
结束时
结束程序