我们可以在oozie工作流程中看到中间输出

时间:2015-06-12 14:01:15

标签: hadoop mapreduce oozie

在Oozie中,如果工作流程中有2个作业。第一个是mapreduce,第二个是Pig Script。 我们可以看到mapreduce作业的输出吗? 如果是,那么在哪里?

1 个答案:

答案 0 :(得分:0)

您可以通过两种方式检查中间数据。

1)创建oozie shell动作,调用shell脚本,将临时创建的中间文件移动到其他位置。

这是一个shell脚本,用于将文件中的所有图像移动到不同的文件夹。参考这个脚本。

## For all the images in a folder run through a loop

用于〜/ Desktop / My_pictures / * jpg中的文件    做

## basename will remove the path (~/Desktop/My_pictures) and also
## remove the extension you give as a second argument    

name =“$(basename”$ file“.jpg)”

## create the directory, the -p means it will create 
## the parent directories if needed and it won't complain
## if the directory exists.

mkdir -p~ / Desktop / My_pictures /“$ name”

## copy the file to the new directory

mv“$ file”“〜/ Desktop / My_pictures / $ name” 完成

2)删除pig动作并仅运行map reduce程序(Java动作)。

第一个适合您的要求。