【问题标题】:Ganglia seeing nodes but not metricsGanglia 看到节点但看不到指标
【发布时间】:2015-10-27 13:15:46
【问题描述】:

我有一个有 7 个节点、1 个主节点和 6 个核心节点的 hadoop 集群。每台机器上都设置了Ganglia,web前端正确显示7台主机。

但它只显示来自主节点的指标(包括 gmetad 和 gmond)。其他节点和主节点有相同的gmond.conf文件,web前端清楚的看到节点。我不明白 ganglia 如何识别 7 个主机,但只显示带有 gmetad 的框中的指标。

任何帮助将不胜感激。有没有一种快速的方法来查看这些节点是否正在发送数据?还是这是网络问题?


update#1:当我远程登录到不是主节点的 gmond 主机并查看端口 8649 时,我看到 XML 但没有数据。当我在主机上远程登录到 8649 时,我看到了 XML 和数据。关于从这里去哪里的任何建议?

【问题讨论】:

    标签: hadoop mapreduce monitoring ganglia


    【解决方案1】:

    将此设置为您要监控的每个节点的所有 gmond.conf 文件:

    send_metadata_interval = 15 // or something.
    

    现在所有节点及其指标都显示在 master (gmetad) 中。

    如果您在单播模式下运行,即如果您在udp_send_channel 中指定host 而不是mcast_join,则需要此额外配置。在组播模式下,gmond守护进程可以随时互相查询,不需要主动发送监控数据。

    【讨论】:

      【解决方案2】:

      在 gmond 配置中,确保提供以下所有内容:-

      cluster {
        name = "my cluster" #is this the same name as given in gmetad conf?
        ## Cluster name
        owner = "unspecified"
        latlong = "unspecified"
        url = "unspecified"
      }
      
      udp_send_channel {
        #mcast_join = 239.2.11.71 ## Comment this
        host = 192.168.1.10 ## IP address/hostname of gmetad node
        port = 8649
        ttl = 1
      }
      
      /* comment out this block itself
      udp_recv_channel {
      ...
      }
      */
      
      tcp_accept_channel {
        port = 8649
      }
      

      保存并退出。重新启动您的 gmond 守护程序。然后执行“netcat 8649”。您现在可以查看带有指标的 XML 了吗?

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2016-06-11
        • 1970-01-01
        • 2011-03-29
        • 2020-10-11
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多