【问题标题】:Is it possible to visualise the mapper results in a map-reduce process?是否可以在 map-reduce 过程中可视化映射器结果?
【发布时间】:2016-03-02 12:51:12
【问题描述】:

在文件 part-00000 中,我们可以找到所有过程的结果(map+reduce),但我想查看第一步(映射)的结果,然后是整个结果。

我正在使用 python map-reduce 脚本开发 Hadoop Cloudera。

【问题讨论】:

    标签: python hadoop dictionary cloudera reduce


    【解决方案1】:

    我猜你想输出map的结果或map的过程,一种解决方案是将map的结果输出到stderr。 前任: 如果是蟒蛇:

    import sys
    print >> sys.stderr, "result of map"
    

    如果外壳:

    echo -e "result of map" >&2
    

    然后,你可以在hadoop作业日志中看到map的结果

    【讨论】:

    • 是的,这就是我想要的,但我没有找到 hadoop 作业日志
    • 默认情况下,日志会打印在命令窗口,你可以找到tracking url,在浏览器中打开,你会得到包括sys.stdout、sys.stderr、syslog的日志
    【解决方案2】:

    如果这只是为了了解数据和密钥的初始分析目的,那么您可能希望将 Reducer 计数设置为 0 并获取地图的输出。 -D mapred.reduce.tasks =0 是java中的一种方式,对Python也是如此。

    【讨论】:

      猜你喜欢
      • 2012-04-04
      • 1970-01-01
      • 2013-12-29
      • 1970-01-01
      • 1970-01-01
      • 2011-05-12
      • 2016-12-28
      • 2018-02-19
      • 1970-01-01
      相关资源
      最近更新 更多