【问题标题】:Control intermediates results in hadoop控制中间体导致 hadoop
【发布时间】:2014-06-27 12:21:38
【问题描述】:

我想用 hadoop 控制 Map 和 Reduce 之间的中间结果。 我想指定在 Map 之后将这些结果复制到哪里。 我会选择会减少的数据。 总之,我想要地图的结果,然后再进行洗牌和排序,然后做什么 我想要。 如果您有解决方案,请告诉我。

谢谢

【问题讨论】:

    标签: hadoop mapreduce hadoop-streaming hadoop-partitioning hadoop2


    【解决方案1】:

    您可以在特定映射器获得 InputSplit 后处理数据。将逻辑指定到map 函数中。

    1. 我想指定在地图之后将这些结果复制到哪里

      使用 Context Java Class 和 FileSystem 在 FS 上刷新结果 (本地、hdfs、ftp、...)

    2. 我会选择会减少的数据

      我想要地图的结果,然后再进行洗牌和排序,然后做我想做的事 想要

      Mapper 类中指定map 函数的逻辑

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-10-13
      • 1970-01-01
      • 2018-08-07
      • 1970-01-01
      • 2018-11-24
      • 2013-10-31
      • 2011-08-27
      • 2011-11-11
      相关资源
      最近更新 更多