【发布时间】:2018-10-22 13:56:42
【问题描述】:
我需要在运行 hive 查询时查看我的 HDinsights 集群中使用的节点数。我如何在运行查询时查看此内容。我知道 Ambari 视图提供了这一点,但我在哪里可以获得节点和使用的存储的确切数量。谢谢
【问题讨论】:
-
您需要从 Hive 日志中提取 YARN 作业 ID (在使用 JDBC/ODBC 的自定义代码时,这有点棘手,因为 Hive 不使用通常的通道进行异步通知) i> 然后在 YARN ResourceManager UI 中检查作业状态——或通过命令行
yarn application -status <id> -
注意,
job_xxxxxx_xxxx是旧的作业 ID 命名约定(Cloudera 附带的旧版 Job HistoryServer 仍在使用),RM 使用application_xxxxxx_xxxx -
容器放置的细节在RM中在当前“尝试”下可见——或者当工作结束时,可以从HistoryServer/TimelineServer中每个归档日志的header中提取出来
标签: azure hive mapreduce azure-hdinsight