Apache Pig中的UnGroup

时间:2013-02-01 06:16:10

标签: hadoop mapreduce apache-pig

Apache Pig是否支持UNGROUP操作?我想是的。所以任何人都可以帮我解决这个问题吗? 我有一行表格

1,a-b-c
2,d-e-f
3,g-h

我想将其扩展为

形式
1,a
1,b
1,c
2,d
2,e
2,f
3,g
3,h

任何帮助表示感谢。

1 个答案:

答案 0 :(得分:4)

您应该使用内置STRSPLIT将第二个字段拆分为多个标记,然后应用FLATTEN为每个元素创建一行。像这样:

A = LOAD 'input.txt' as (id, data);

B = FOREACH A GENERATE id, FLATTEN(STRSPLIT(data,'-'));