如何将mapreduce输出存储到变量中?

时间:2018-11-24 13:49:16

标签: mapreduce hadoop2

问题是要找到一个部门,该部门的项目数量比公司项目总数多40%。 我的想法是计算总数。项目数量,然后计算项目数量。明智的做法,并同时使用两个输出找出答案。

下面是查找项目总数的代码:

    public class totalNoProjectsMapper extends Mapper<LongWritable,Text,NullWritable,LongWritable> {

public static long sum = 0;     

@Override
public  void map(LongWritable key,Text value,Context context)throws IOException,InterruptedException
{
    String []tokens = value.toString().split(",");
    long no_of_projects  = Long.parseLong(tokens[2]);

    sum+=no_of_projects;

    context.write(NullWritable.get(),new LongWritable(sum));




}   

我希望将此作业的输出存储到变量中,以便可以将其用于另一个mapreduce作业(所有程序都在eclipse中位于同一Project中)

0 个答案:

没有答案
相关问题