INPUT empmname | logintime | logofftime
婆| 9.30 | 10.30
普拉萨德| 9.35 | 9.55
婆| 10.40 | 11.45
婆| 11.55 | 12.30
婆| 1.40 | 2.45
婆| 3.40 | 4.45
普拉萨德| 10.10 | 10.55
普拉萨德| 11.35 | 12.05
普拉萨德| 12.45 | 1.45
普拉萨德| 2.35 | 4.45
普拉萨德| 5.35 | 6.10
拉维| 9.00 | 9.55
拉维| 10.00 | 11.50
拉维| 1.05 | 1.20
拉维| 5.00 | 5.55
requriment:
mapreduce程序,找出哪个用户留了更多时间。
答案 0 :(得分:0)
这似乎是考试中的一个问题,我不会告诉你代码,但这里的逻辑应该是这样的:
以字符串形式获取数据,并根据' |'进行拆分。并获得开始和结束时间的差异并将其发送到reducer
在减速机上,添加所有"时间"对应单个员工
就这么简单。
顺便说一句,如果你想要使用hadoop
,你应该学会这样思考