【发布时间】:2017-01-19 00:34:39
【问题描述】:
我们有 4 个 datanode HDFS 集群 ...每个数据节点上有大量可用空间,大约 98gb ...但是当我查看 datanode 信息时..它只使用了大约 10gb 并且空间不足。 ..
我们怎样才能让它使用所有的 98gb 而不会用完如图所示的空间
这是磁盘空间配置
这是名称节点上的 hdfs-site.xml
<property>
<name>dfs.name.dir</name>
<value>/test/hadoop/hadoopinfra/hdfs/namenode</value>
</property>
这是数据节点下的hdfs-site.xml
<property>
<name>dfs.data.dir</name>
<value>/test/hadoop/hadoopinfra/hdfs/datanode</value>
</property>
尽管 /test 有 98GB 并且 hdfs 配置为使用它,但它并没有使用它
在进行配置更改时我是否遗漏了什么?我们如何确保使用 98GB?
【问题讨论】:
-
只是想一想,您的复制因子是否设置为默认值?我知道默认值为 3,但您使用的存储量似乎是 10 倍。我不是 100% 确定块的副本是否算作“实际”使用的存储......
-
否则,您在
dfs.data.dir属性中指定的目录是否真的存在?根据 Apache 网站......Directories that do not exist are ignored. -
它确实存在该目录,如果它不存在...start-dfs.sh 将失败,但它可以正常启动但仍然使用旧的...位置,它有 14gb
-
现在发布一个潜在的解决方案:)
标签: hadoop hadoop-yarn hadoop2