【发布时间】:2015-01-06 01:11:24
【问题描述】:
希望你们都度过了一个愉快的假期。我正在尝试在 Amazon EC2 上设置 Hadoop 集群。使用命令hadoop fs -copyFromLocal d.txt /user/ubuntu/data 将数据文件从本地磁盘复制到 hdfs 时,出现数据复制错误。日志中的错误如下
15/01/06 07:40:36 WARN hdfs.DFSClient: 错误恢复 null bad datanode[0] 节点 == null
15/01/06 07:40:36 警告 hdfs.DFSClient:无法获取块位置。源文件 /user/ubuntu/data/d.txt" - > Aborting... copyFromLocal: java.io.IOException: 文件 /user/ubuntu/data/d.txt 只能复制到 0 个节点,而不是 1
15/01/06 07:40:36 错误 hdfs.DFSClient: 无法关闭文件 /user/ubuntu/data/d.txt
现在,我一直在查看 StackOverFlow 和其他论坛关于这个问题,我发现他们中的大多数人都在谈论 DataNode、TaskTracker 没有运行作为可能的原因和相关解决方案.但是这些东西在我的设置中运行良好。 JPS命令截图 http://i.imgur.com/vS6kRPP.png
来自 HadoopWiki,其他可能的原因是 DataNode 无法与服务器通信,通过网络或 Hadoop 配置问题或某些配置问题阻止了有效的双向通信。
我按照教程http://tinyurl.com/l2wv6y9 配置了hadoop-env.sh、core-site.xml、hdfs-site.xml 和mapred-site.xml。谁能告诉我哪里出错了?如果有人帮助我解决问题,我将不胜感激。
谢谢,
【问题讨论】:
标签: hadoop amazon-web-services amazon-ec2 mapreduce