【问题标题】:Data-node Alive from ambari isnt stable来自ambari的数据节点活动不稳定
【发布时间】:2018-12-05 18:04:41
【问题描述】:

我们有 ambari 集群版本 - 2.6.1 和 hadoop 版本 2.6.4

datanode 的数量是 - 10

从 ambari 仪表板我们可以看到显示以下内容的窗口:

   DataNodes Live

   9/10

但几分钟后,所有数据节点都处于活动状态:

   DataNodes Live

   10/10

几分钟后我们又看到了

   DataNodes Live

   9/10

似乎namenode超过时间间隔没有从datanode收到心跳消息,那么datanode将被标记为“dead”

我们检查以下内容:

  1. 主机解析正常(DNS 正常)
  2. IP 解析正常(DNS 正常)
  3. HDFS服务检查成功
  4. 每个数据节点都已启动 (ps -ef | grep datanode | grep -v grep)
  5. netstat -anp | grep '0.0.0.0:50010' 端口没问题
  6. systemctl status firewalld.service(防火墙应该是关闭的)
  7. sestatus SELinux 状态(禁用)
  8. MTU 配置为 9000(我们验证所有组件上的 9000 设置正确

我们还能做些什么来验证为什么 DataNode alive 不稳定?

【问题讨论】:

    标签: hadoop hdfs ambari namenode datanode


    【解决方案1】:

    我们将数据节点堆大小从默认值 - 2G 增加到 6G 从那时起,现在来自 ambari 仪表板的数据节点是稳定的

    【讨论】:

      猜你喜欢
      • 2014-02-14
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多