按组中的更改过滤分组关系

时间:2014-09-08 16:09:34

标签: hadoop apache-pig

我是Pig Latin的另一个新手,希望得到一些帮助。

我有一个看起来或多或少的数据Feed:

{ time:chararray, id:chararray, value:chararray }
{ '1:00', 'id1', 'value1' }
{ '1:00', 'id2', 'value2' }
{ '2:00', 'id1', 'value1' }
{ '2:00', 'id2', 'value4' }
{ '2:00', 'id3', 'value3' }

我希望获得数据在时间间隔之间发生变化的所有实例。在这种情况下:

{ '2:00', 'id2', 'value4' }
{ '2:00', 'id3', 'value3' }

我知道如何在关系之间设置减法,但不知道如何在组中的包之间进行减法。请记住,我不知道时间字段中的值是什么(即,我不知道值是'1:00'和'2:00'),只是它们是时间的进展

0 个答案:

没有答案