【发布时间】:2015-03-07 00:13:43
【问题描述】:
我目前正在运行一个有 2 个节点的集群。 1个节点是主/从,另一个只是从。我有一个文件,我将块大小设置为该文件大小的一半。然后我做
hdfs dfs -put file /
文件被复制到 HDFS 没有问题,但是当我检查 HDFS 站点时,我看到创建的两个块都在一个数据节点中(这些块在我使用 -put 命令的数据节点上)。我什至尝试调用平衡器脚本,但两个块仍在同一个数据节点上。
我需要数据在所有节点之间(尽可能地)均匀分布。
我错过了什么吗?
【问题讨论】:
-
hdfs dfs -ls /file怎么说? -
文件将是纯文本文件。我不确定我是否理解你的问题。
-
您确实误解了我的问题。让我重新表述一下。你能发布命令
hdfs dfs -ls /file的结果吗? -
抱歉回复晚了,我刚开始工作。但这是你要求的。 bash-4.1$ hdfs dfs -ls /input/data1.txt 15/03/09 08:51:29 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... 在适用的情况下使用内置 java 类 - rw-r--r-- 1 blahblah 超群 390 2015-03-06 16:57 /input/data1.txt
标签: hadoop filesystems hdfs hadoop-yarn