sparkR中的第二和第三个功能

时间:2015-10-01 12:33:10

标签: r dataframe sparkr

在sparkR中,我有一个DataFrame data。它包含usergame

user包含用户,game包含用户玩过的游戏名称。只有14场比赛,分别是1,2,......,14。

所以

head(data)

给出了这个输出

user  game
3521     3
52      14
865      4
52       3

我想找到固定用户正在玩的第一款游戏。例如,用户52玩游戏14 3 3 5 10,这里游戏14是该用户正在玩的第一个游戏。

在sparkR中我这样做

su <- groupBy(data, data$user)
sus <- agg(su, FirstPlayed= first(data$game))
# Making it local
local_sus <- collect(sus)

这里我得到了正确的结果,因为我可以在sparkR中使用first函数。

我想找到第二个&#39;和第三个&#39;用户玩过的游戏,但我无法做到这一点,因为sparkR没有&#34;第二个&#34;功能

如何解决它 - 也许我应该使用except - 函数来删除第一个元素?

0 个答案:

没有答案
相关问题