Hadoop 历史服务器是如何工作的？

【问题标题】：How the Hadoop History Server is working?Hadoop 历史服务器是如何工作的？
【发布时间】：2018-11-13 02:42:20
【问题描述】：

我对配置文件中的两个属性感到困惑：

yarn-site.xml 中的属性yarn.nodemanager.remote-app-log-dir：

a.) 此属性控制 map/reduce 任务的日志将记录在哪里？

b.) 这是节点管理器 (NM) 的职责吗？
mapreduce.jobhistory.done-dir 来自mapred-site.xml 的属性：

a.) 与作业相关的文件（如配置等）存储在此位置？

b.) 这是 Application Master (AM) 的职责吗？
历史服务器 (HS) 是否结合这两种信息并在 UI 中显示整合信息？

【问题讨论】：

标签： mapreduce hdfs hadoop-yarn hadoop2

【解决方案1】：

假设您已启用日志聚合，

1.a. 这是日志聚合目录，通常是 NM 将容器日志聚合到的 HDFS。
1.b. 是的。
2.a. 是的。
2.b. 不会。MR JobHistory Server 会这样做，方法是从 ${mapreduce.jobhistory.intermediate-done- 删除 JobSummary 文件并将其他文件 mv 到 ${mapreduce.jobhistory.done-dir}目录}。
3. 是的。 MR JobHistory Server Web，包括作业信息（来自 ${mapreduce.jobhistory.done-dir}）和容器日志（来自 ${yarn.nodemanager.remote-app-log-dir}）。

【讨论】：

猜你喜欢

2017-08-10
2017-02-22
1970-01-01
1970-01-01
2019-03-23
1970-01-01
1970-01-01
1970-01-01
2011-08-28

相关资源

下载 2021-06-06
下载 2021-06-06
下载 2023-01-17

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode