【发布时间】:2012-07-09 23:49:52
【问题描述】:
我现在在伪分布式模式下使用 hadoop。 我尝试了一些mapreduce,将其打包为jar,并将文件复制到hadoop。然后使用
./bin/hadoop jar *
启动它。
我的问题是:是否有任何其他方式可以做到这一点?如果我们有数千个作业要运行。我们不能只输入命令。我们在生产环境中做什么?
谢谢。
【问题讨论】:
-
通常情况下,我们在shell脚本中编写一些作业。就像:jobs.sh :bin/hadoop jar a.jar \r\n bin/hadoop jar b.jar,它们正在运行一个一个按先进先出顺序。这是一个批处理作业。如果您想在 hadoop 中并行运行作业,请尝试 Fair Scheduler 或 Capacity Scheduler
标签: hadoop