【发布时间】:2021-08-23 23:49:23
【问题描述】:
我在使用 HBase 和 HDFS 时遇到了问题,因为我知道 HBase 在 HDFS 之上运行,因此我认为它使用 HDFS 来存储其数据。问题是 HDFS 接近其最大空间利用率,并且它和 HBase 不断崩溃。
在相当长的一段时间内,我什至无法运行普通的 HBase shell 命令,例如 list 和 scan,因此我什至无法尝试从表中删除一些数据。但是,当我设法重新启动在单个节点中运行的 HBase 时,我截断了使用最大空间量的表,当我通过 du(磁盘使用)命令检查时,hdfs 目录更大。而且 HDFS 的空间利用率仍然很高。如果不从 HBase 中删除条目,如何释放 Hadoop 分布式文件系统中的空间?手动删除 HDFS 中的随机目录感觉非常草率,我不希望这样做。我应该增加 HDFS 保留空间吗?我应该减少复制吗?我应该强制压缩吗?
【问题讨论】:
-
你有表快照吗?如果是这样,数据可能由快照保存。
-
@shay__ 实际上,我们通过增加运行 HBase 和 HDFS 的 VM 的磁盘空间解决了这个问题。不确定这是否是一个值得回答的解决方案