【问题标题】:hadoop-streaming: automate post-processing once job is completed?hadoop-streaming:工作完成后自动进行后处理?
【发布时间】:2012-04-03 13:52:30
【问题描述】:

第 1 步 - 我有一个基于可变时间的 hadoop 流式传输作业 关于要处理的数据量 步骤 2- 工作完成后,我需要 将所有数据转储导入 mongodb 并创建一个平面 csv 文件 其中

问题
有什么方法可以使用 hadoop 流将第 2 步粘合到第 1 步,避免手动执行第 2 步?

【问题讨论】:

    标签: python mongodb hadoop mapreduce hadoop-streaming


    【解决方案1】:

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2018-08-25
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多