在你的mapred-site.xml中,有配置参数:yarn.app.mapreduce.am.staging-dir。
这个参数的说明是:
提交作业时使用的暂存目录。
默认设置为:
/tmp/hadoop-yarn/staging
这条路径被翻译成:
{Value of config parameter `yarn.app.mapreduce.am.staging-dir`} + Path.SEPARATOR + user + Path.SEPARATOR + STAGING_CONSTANT
例如在我的 mapred-site.xml 中,此值设置为:
<property>
<name>yarn.app.mapreduce.am.staging-dir</name>
<value>/user</value>
</property>
所以这条路径被转换成:
/user/{user}/{STAGING_CONSTANT}
这是:
/user/mballur/.staging/ => Where user -> mballur and STAGING_CONSTANT -> .staging
在此文件夹中,您将看到与作业相关的设置,当您的作业正在运行时。
例如如果我的应用程序 ID 是:application_1450100618247_0018,那么暂存文件夹将为:
/user/mballur/.staging/job_1450100618247_0018/
在此文件夹中,您可以看到以下文件:
job.jar
job.split
job.xml
job_1450100618247_0018_1.jhist
job_1450100618247_0018_1_conf.xml
这里的 job.xml 包含有关您的作业的配置信息。
但是,当作业完成(成功或失败)时,作业的暂存目录会被删除。
Job History Rest API:
如果您启用了历史服务器,那么您可以查看到目前为止执行的所有作业的历史记录。例如在此处查看链接:https://hadoop.apache.org/docs/r2.4.1/hadoop-yarn/hadoop-yarn-site/HistoryServerRest.html#Job_Conf_API
使用以下 REST 查询,您可以获得作业的配置:
GET http://<history server http address:port>/ws/v1/history/mapreduce/jobs/{job_id}/conf