猪连接中多列的最大值

时间:2016-02-05 09:04:49

标签: apache-pig

我有2个数据文件要加载到猪身上。

A = LOAD 'temp.csv' USING PigStorage(',') AS (user:chararray,day:chararray,joinKey:chararray);
B = LOAD 'new.csv' USING PigStorage(',') AS (user:chararray,day:chararray,joinKey:chararray);
c = join A by (joinKey),B by (joinKey);
d = FOREACH c GENERATE MAX(A:day,B:day) as maxDay

这不起作用,因为没有分组。 如何实现2列的最大值。 获得最大值后,我需要存储与最大日期字段相关的用户。

0 个答案:

没有答案