【问题标题】:Understanding Hive MR Output了解 Hive MR 输出
【发布时间】:2015-06-25 00:06:39
【问题描述】:

当我运行 Hive 语句并启动相应的 MR 作业时,它通常有如下一行:

Stage-Stage-1:映射:33 减少:131 累积 CPU:8006.47 秒 HDFS 读取:1280804751 HDFS 写入:279261996966 成功

总 MapReduce CPU 时间花费:0 天 2 小时 13 分 26 秒 470 毫秒

我对解释那句话有一些疑问。

  1. 数字 1280804751、279261996966 的单位是什么?字节?块?有什么方法可以将它们转换为人类可读的格式?
  2. “总 MapReduce CPU 时间花费”是什么意思? “累积 CPU”是什么意思?

【问题讨论】:

    标签: hadoop mapreduce hive


    【解决方案1】:
    1. HDFS ReadHDFS Write 值以字节为单位。

    2. Cumulative CPU 是该阶段的 MapReduce 作业的所有任务的总 CPU 时间。 Total MapReduce CPU Time Spent 是查询所有阶段的总 CPU 时间。在您的示例中,只有一个阶段,因此两个值具有相同的持续时间。

    【讨论】:

      猜你喜欢
      • 2014-03-31
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-05-26
      • 2017-04-18
      • 2016-12-24
      • 2017-03-09
      • 2011-10-20
      相关资源
      最近更新 更多