mapreduce用于员工的起始和结束时间,以找出哪个员工更多时间

时间:2017-02-06 09:35:16

标签: hadoop mapreduce

INPUT empmname | logintime | logofftime

婆| 9.30 | 10.30

普拉萨德| 9.35 | 9.55

婆| 10.40 | 11.45

婆| 11.55 | 12.30

婆| 1.40 | 2.45

婆| 3.40 | 4.45

普拉萨德| 10.10 | 10.55

普拉萨德| 11.35 | 12.05

普拉萨德| 12.45 | 1.45

普拉萨德| 2.35 | 4.45

普拉萨德| 5.35 | 6.10

拉​​维| 9.00 | 9.55

拉​​维| 10.00 | 11.50

拉​​维| 1.05 | 1.20

拉​​维| 5.00 | 5.55

requriment:

mapreduce程序,找出哪个用户留了更多时间。

1 个答案:

答案 0 :(得分:0)

这似乎是考试中的一个问题,我不会告诉你代码,但这里的逻辑应该是这样的:

  1. 以字符串形式获取数据,并根据' |'进行拆分。并获得开始和结束时间的差异并将其发送到reducer

  2. 在减速机上,添加所有"时间"对应单个员工

  3. 就这么简单。

    顺便说一句,如果你想要使用hadoop

    ,你应该学会这样思考
相关问题