【问题标题】:Ambari dashboard retrieving no statisticsAmbari 仪表板未检索到统计信息
【发布时间】:2015-02-28 21:21:16
【问题描述】:

我在一个小型集群(4 台机器)上全新安装了 Hortonworks Data Platform 2.2,但是当我登录 Ambari GUI 时,大多数仪表板统计信息框(HDFS 磁盘使用情况、网络使用情况、内存使用情况等)都是没有填充任何统计信息,而是显示消息:

No data There was no data available.  Possible reasons include inaccessible Ganglia service

单击 HDFS 服务链接会给出以下摘要:

NameNode    Started
SNameNode   Started
DataNodes   4/4 DataNodes Live
NameNode Uptime     Not Running
NameNode Heap   n/a / n/a (0.0% used)
DataNodes Status    4 live / 0 dead / 0 decommissioning
Disk Usage (DFS Used)   n/a / n/a (0%)
Disk Usage (Non DFS Used)   n/a / n/a (0%)
Disk Usage (Remaining)  n/a / n/a (0%)
Blocks (total)  n/a
Block Errors    n/a corrupt / n/a missing / n/a under replicated
Total Files + Directories   n/a
Upgrade Status  Upgrade not finalized
Safe Mode Status    n/a

屏幕右侧的警报和健康检查框没有显示任何信息,但是如果我点击设置图标,这将再次打开 Nagios 前端,这里的一切看起来都很健康!

安装顺利(CentOS 6.5),就所有服务而言,一切看起来都很好(所有服务名称旁边的绿色勾号都开始了)。仪表板上显示了一些统计数据:4/4 数据节点处于活动状态,1/1 节点管理处于活动状态和 1/1 主管处于活动状态。我可以将文件写入 HDFS,所以它看起来像是神经节问题?

Ganglia 守护进程似乎工作正常:

ps -ef | grep gmond
nobody    1720     1  0 12:54 ?        00:00:44 /usr/sbin/gmond --conf=/etc/ganglia/hdp/HDPHistoryServer/gmond.core.conf --pid-file=/var/run/ganglia/hdp/HDPHistoryServer/gmond.pid
nobody    1753     1  0 12:54 ?        00:00:44 /usr/sbin/gmond --conf=/etc/ganglia/hdp/HDPFlumeServer/gmond.core.conf --pid-file=/var/run/ganglia/hdp/HDPFlumeServer/gmond.pid
nobody    1790     1  0 12:54 ?        00:00:48 /usr/sbin/gmond --conf=/etc/ganglia/hdp/HDPHBaseMaster/gmond.core.conf --pid-file=/var/run/ganglia/hdp/HDPHBaseMaster/gmond.pid
nobody    1821     1  1 12:54 ?        00:00:57 /usr/sbin/gmond --conf=/etc/ganglia/hdp/HDPKafka/gmond.core.conf --pid-file=/var/run/ganglia/hdp/HDPKafka/gmond.pid
nobody    1850     1  0 12:54 ?        00:00:44 /usr/sbin/gmond --conf=/etc/ganglia/hdp/HDPSupervisor/gmond.core.conf --pid-file=/var/run/ganglia/hdp/HDPSupervisor/gmond.pid
nobody    1879     1  0 12:54 ?        00:00:45 /usr/sbin/gmond --conf=/etc/ganglia/hdp/HDPSlaves/gmond.core.conf --pid-file=/var/run/ganglia/hdp/HDPSlaves/gmond.pid
nobody    1909     1  0 12:54 ?        00:00:48 /usr/sbin/gmond --conf=/etc/ganglia/hdp/HDPResourceManager/gmond.core.conf --pid-file=/var/run/ganglia/hdp/HDPResourceManager/gmond.pid
nobody    1938     1  0 12:54 ?        00:00:50 /usr/sbin/gmond --conf=/etc/ganglia/hdp/HDPNameNode/gmond.core.conf --pid-file=/var/run/ganglia/hdp/HDPNameNode/gmond.pid
nobody    1967     1  0 12:54 ?        00:00:47 /usr/sbin/gmond --conf=/etc/ganglia/hdp/HDPNodeManager/gmond.core.conf --pid-file=/var/run/ganglia/hdp/HDPNodeManager/gmond.pid
nobody    1996     1  0 12:54 ?        00:00:44 /usr/sbin/gmond --conf=/etc/ganglia/hdp/HDPNimbus/gmond.core.conf --pid-file=/var/run/ganglia/hdp/HDPNimbus/gmond.pid
nobody    2028     1  1 12:54 ?        00:00:58 /usr/sbin/gmond --conf=/etc/ganglia/hdp/HDPDataNode/gmond.core.conf --pid-file=/var/run/ganglia/hdp/HDPDataNode/gmond.pid
nobody    2057     1  0 12:54 ?        00:00:51 /usr/sbin/gmond --conf=/etc/ganglia/hdp/HDPHBaseRegionServer/gmond.core.conf --pid-file=/var/run/ganglia/hdp/HDPHBaseRegionServer/gmond.pid

我检查了每个节点上的 Ganglia 服务,进程运行正常

ps -ef | grep gmetad
nobody    2807     1  2 12:55 ?        00:01:59 /usr/sbin/gmetad --conf=/etc/ganglia/hdp/gmetad.conf --pid-file=/var/run/ganglia/hdp/gmetad.pid

我试过重启 Ganglia 服务,但没有成功,重启了所有服务,但还是一样。有谁知道如何让仪表板正常工作?谢谢。

【问题讨论】:

  • 它看起来也没有从名称节点听到。您可能已经涵盖了这一点,但是,您的 /etc/hosts 中的所有节点是否相互连接,iptables 关闭,selinux 关闭,并且都在 DNS 中注册?当节点之间存在 DNS 问题时,我们对 Hue 感到有些奇怪。另外,您是否考虑过为 Ambari 进行日志记录?某处可能有一些 RPC 连接失败,可能会说明问题......
  • 您好,感谢您的回复,我已经检查并仔细检查了您的所有建议,一切似乎都井然有序,主机文件正常,iptables 关闭,selinux 关闭,但仍然没有统计信息。我翻遍了日志,没有什么明显的。看起来 HDFS 正在按预期工作,所有不工作的只是 Ambari 仪表板 grrrr 上的统计信息,我会继续挖掘,再次感谢。
  • 我想通了,它与代理有关(我在原始帖子中从未提到我在代理背后,所以有点不公平!)。我将在下面记录,我在 ambari 日志中注意到了这一点:java.io.FileNotFoundException: node1.dms/ganglia/graph.php?g=mem_report&json=1 再次感谢
  • 好东西!是的,集群的网络至关重要。我们的集群被放置在我们的 DMZ 中(不是技术人员认可的想法,顺便说一句),这导致了各种问题。我们不得不绕过 Sqoop 以它想要的方式与 MSSQL 交谈,而 Oozie 从未在 Hue 中工作过,因为在堆栈中的某个地方它无法将工作流元数据写入正确的位置……简而言之,不要那样做。 :-)

标签: hadoop hortonworks-data-platform ganglia


【解决方案1】:

原来是代理问题,要访问互联网,我必须将代理详细信息添加到文件 /var/lib/ambari-server/ambari-env.sh

export AMBARI_JVM_ARGS=$AMBARI_JVM_ARGS' -Xms512m -Xmx2048m -Dhttp.proxyHost=theproxy -Dhttp.proxyPort=80 -Djava.security.auth.login.config=/etc/ambari-server/conf/krb5JAASLogin.conf -Djava.security.krb5.conf=/etc/krb5.conf -Djavax.security.auth.useSubjectCredsOnly=false'

当 ganglia 尝试访问集群中的每个节点时,请求通过代理进行并且从未解决,为了克服我将节点添加到排除列表(添加标志 -Dhttp.nonProxyHosts)的问题,如下所示:

export AMBARI_JVM_ARGS=$AMBARI_JVM_ARGS' -Xms512m -Xmx2048m -Dhttp.proxyHost=theproxy -Dhttp.proxyPort=80 -Dhttp.nonProxyHosts="localhost|node1.dms|node2.dms|node3.dms|etc" -Djava.security.auth.login.config=/etc/ambari-server/conf/krb5JAASLogin.conf -Djava.security.krb5.conf=/etc/krb5.conf -Djavax.security.auth.useSubjectCredsOnly=false'

添加排除列表后,按预期检索统计信息!

【讨论】:

    猜你喜欢
    • 2017-06-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-01-14
    • 2017-05-27
    • 2020-01-05
    • 2013-07-14
    • 2018-09-26
    相关资源
    最近更新 更多