Hive连接查询非常慢

时间:2014-05-05 16:10:12

标签: hadoop hive hbase bigdata

我试图用6个减速器来跟踪查询,但我总是看到只有一个减速器启动了。不确定为什么要忽略tasks参数。请帮助。 (我使用旧版本的配置单元,因此不支持查询)

设置mapred.reduce.tasks = 6;

从test1左外连接test2中选择concat(test1.col_0,test1.col_1),其中concat(test1.col_0,test1.col_1)= concat(test2.col_0,test2.col_1)和concat(test2.col_0,test2) .col_1)IS NULL;

1 个答案:

答案 0 :(得分:0)

重新发布评论作为答案:

您可以尝试将第一个where子句转换为ON条件:

select concat(test1.col_0,test1.col_1) from test1 left outer join test2 ON concat(test1.col_0,test1.col_1) = concat(test2.col_0,test2.col_1) where concat(test2.col_0,test2.col_1) IS NULL;