如何在Pig Latin中的两列上进行外连接

时间:2011-11-07 15:45:25

标签: hadoop apache-pig

我在Pig中的单个列上进行外连接,如此

result = JOIN A by id LEFT OUTER, B by id;

如何加入两列,例如 -

WHERE A.id=B.id AND A.name=B.name

猪的等价物是什么?我在猪手册中找不到任何例子......有什么帮助吗?

2 个答案:

答案 0 :(得分:38)

上面的答案实际上是一个INNER连接,正确的猪声明应该是:

 join a by (id, name) LEFT OUTER, b by (id, name) 

答案 1 :(得分:26)

自己回答问题 -

join a by (id, name), b by (id, name) 

http://ofps.oreilly.com/titles/9781449302641/advanced_pig_latin.html