如何在Apache beam中的多个键(列)上实现groupBy?

时间:2018-02-16 06:30:53

标签: apache-beam

我正在使用Python,我想在Apache beam中的多个列上实现groupBy。例如,我有一个包含3列的以下数据集:

GM TV 7500.2 abc
在线2000.1 def
CONSOLE 1000.2 ghi
控制台6500.6 ghi
GM TV 4500.5 abc
CONSOLE 9500.4 ghi

如何根据第一列和第三列对数据进行分组?

1 个答案:

答案 0 :(得分:1)

您可以使用元组(column 1, column 3)作为GBK转换中的关键字。