oozie可以控制Hadoop之外的工作吗?

时间:2012-10-25 18:50:11

标签: oozie

从文档来看,oozie是否可以安排和控制Hadoop之外的工作并不是很清楚?有人可以对此有所了解吗?如果没有,是否有任何基于开源的工作流引擎可以做到这一点?

4 个答案:

答案 0 :(得分:2)

尝试考虑使用chronos(来自airbnb)高级版本的cron和基于mesos构建的UI。 airbnb.github.com/chronos /

干杯。

答案 1 :(得分:1)

我相信不。因为Oozie本身没有资源管理策略,所以它只是在合适的时间向Hadoop的工作跟踪器提交工作。此外,对于每个Oozie工作流,将有一个启动器作业,负责将工作流中的实际作业提交给Hadoop。启动器工作本身就是一个Hadoop工作。所以,我认为对于早于Oozie 3.2的版本,答案应该是否定的。

答案 2 :(得分:0)

您可以考虑尝试azkaban by linked in。它专为hadoop而打造。但是可以在azkaban的作业文件中指定unix命令。因此,您可以为可以使用命令行运行的任何应用程序开发工作流程。

答案 3 :(得分:0)

我一直在研究一种名为Soop的新工作流引擎。 https://github.com/radixCSgeek/soop它非常轻量级,使用类似cron的语法设置和运行非常简单。它可以运行任何Java POJO以及运行shell进程,因此您可以启动bash脚本或其他任何操作。