Hive Multiple Joins很慢

时间:2018-05-05 06:52:12

标签: hive hiveql

我的表A有6000万条记录,表B有2000万条记录,我根据关键列加入这些表。 (inner join on a.id=b.id)

我可以在10分钟内获取结果。之后验证表C中的另一列(我将表A和表B中生成的结果加入表C)(3000万条记录),并将列b与列c连接起来。(inner join on b.prfl_id=c.prfl_id)

但查询速度很慢,运行时间超过30分钟,甚至没有生成结果。任何快速获得结果的建议。 提前感谢您的建议。

此致

Saravanan

0 个答案:

没有答案