【发布时间】:2016-01-11 08:19:12
【问题描述】:
我有一个将调用 shell 文件的 oozie 工作流,Shell 文件将进一步调用 mapreduce 作业的驱动程序类。现在我想将我的 oozie jobId 映射到 Mapreduce jobId 以供以后处理。有什么方法可以在工作流文件中获取 oozie jobId,以便我可以将与参数相同的参数传递给我的驱动程序类进行映射。
以下是我的示例 workflow.xml 文件
<workflow-app xmlns="uri:oozie:workflow:0.4" name="test">
<start to="start-test" />
<action name='start-test'>
<shell xmlns="uri:oozie:shell-action:0.2">
<job-tracker>${jobTracker}</job-tracker>
<name-node>${nameNode}</name-node>
<configuration>
<property>
<name>mapred.job.queue.name</name>
<value>${queueName}</value>
</property>
</configuration>
<exec>${jobScript}</exec>
<argument>${fileLocation}</argument>
<argument>${nameNode}</argument>
<argument>${jobId}</argument> <!-- this is how i wanted to pass oozie jobId -->
<file>${jobScriptWithPath}#${jobScript}</file>
</shell>
<ok to="end" />
<error to="kill" />
</action>
<kill name="kill">
<message>test job failed
failed:[${wf:errorMessage(wf:lastErrorNode())}]</message>
</kill>
<end name="end" />
以下是我的 shell 脚本。
hadoop jar testProject.jar testProject.MrDriver $1 $2 $3
【问题讨论】:
标签: hadoop mapreduce workflow oozie