Spark scala将数据框中的每个组与其他参考数据框连接起来

时间:2016-05-22 18:54:35

标签: scala join apache-spark dataframe

我有以下两个数据框。我想在输入数据帧上进行分组,并在日期列上将每个组与参考数据帧连接起来。

   %>input.show()

  sid|date                 |count
  200|2016-04-30 18:00     | 10
  100|2016-04-30 18:00     | 2
  200 |2016-04-30 21:00    | 5
  100|2016-04-30 21:00     | 4

    %>reference.show()
   id|date           
   1|2016-04-30 18:00  
   2|2016-04-30 21:00  

   expected output
   id|sid|date             |count
   1|200|2016-04-30 18:00  |10
   2|200|2016-04-30 21:00  |5
   1|100|2016-04-30 18:00  |2
   2|100|2016-04-30 21:00  |4

1 个答案:

答案 0 :(得分:1)

普通加入:

reference.join(input, Array("date"))
相关问题