【发布时间】:2017-01-23 22:04:27
【问题描述】:
我正在以伪分布式模式运行一个简单的、get-my-feet-wet、map reduce 作业:
bin/hadoop jar tm.jar TestMap input output
第一次运行良好,但在第二次运行时,我得到以下信息:
Exception in thread "main" org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://localhost:9000/user/tom/output already exists
创建 HDFS 目录的初始命令,使用 hadoop 命令:
$ bin/hdfs dfs -mkdir /user
$ bin/hdfs dfs -mkdir /user/<username>
几个问题:
- 这些 HDFS 目录在哪里创建,如果已经存在,可以删除吗?
- 避免这种情况的最佳做法是什么?
【问题讨论】:
-
hadoop fs -ls /user/tom/output或hdfs dfs -ls /user/tom/output