【发布时间】:2012-04-03 13:52:30
【问题描述】:
第 1 步 - 我有一个基于可变时间的 hadoop 流式传输作业 关于要处理的数据量 步骤 2- 工作完成后,我需要 将所有数据转储导入 mongodb 并创建一个平面 csv 文件 其中
问题
有什么方法可以使用 hadoop 流将第 2 步粘合到第 1 步,避免手动执行第 2 步?
【问题讨论】:
标签: python mongodb hadoop mapreduce hadoop-streaming
第 1 步 - 我有一个基于可变时间的 hadoop 流式传输作业 关于要处理的数据量 步骤 2- 工作完成后,我需要 将所有数据转储导入 mongodb 并创建一个平面 csv 文件 其中
问题
有什么方法可以使用 hadoop 流将第 2 步粘合到第 1 步,避免手动执行第 2 步?
【问题讨论】:
标签: python mongodb hadoop mapreduce hadoop-streaming
【讨论】: