一 ,架构图 :

1 ,Cloudera Manager 是啥?主要是干啥的?

  1. 官 : 简单来说,Cloudera Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具(软件),使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。
  2. 孙 : 安装集群,监控集群

2 ,cloudera manager 有四大功能:

  1. 管理:对集群进行管理,如添加、删除节点等操作。
  2. 监控:监控集群的健康情况,对设置的各种指标和系统运行情况进行全面监控。
  3. 诊断:对集群出现的问题进行诊断,对出现的问题给出建议解决方案。
  4. 集成:对 hadoop 的多组件进行整合。

3 ,体系架构 :

1,clouderaManager 介绍 : 免费版介绍

4 ,主节点 : 核心 ( Cloudera Manager Server )

  1. 托管 Admin Console Web Server 和应用程序逻辑。
  2. 负责安装软件、配置、启动和停止服务
  3. 管理运行服务的群集。

5 ,从节点 : ( Agent )

  1. 安装在每台主机上。
  2. 负责启动和停止进程,解压缩配置,触发安装和监控主机

6 ,管理服务 : ( Management Service )

  1. 监控
  2. 报警
  3. 报告

7 ,数据库 : ( Database )

存储配置和监控信息

8 ,资源库 : ( Cloudera Repository )

可供 Cloudera Manager 分配的软件的存储库( repo 库 )

9 ,客户端 :用于与服务器进行交互的接口

  1. web 控制台 : Admin Console ,管理员控制台。
  2. 代码接口 : API ,开发人员使用 API 可以创建自定义的 Cloudera Manager 应用程序。

二 ,功能介绍 :

1 ,Cloudera Management Service : 可作为一组角色实施各种管理功能

  1. Activity Monitor:收集有关服务运行的活动的信息
  2. Host Monitor:收集有关主机的运行状况和指标信息
  3. Service Monitor:收集有关服务的运行状况和指标信息
  4. Event Server:聚合组件的事件并将其用于警报和搜索
  5. Alert Publisher :为特定类型的事件生成和提供警报
  6. Reports Manager:生成图表报告,它提供用户、用户组的目录的磁盘使用率、磁盘、io等历史视图

2 ,信号检测

默认情况下,Agent 每隔 15 秒向 Cloudera Manager Server 发送一次检测信号。但是,为了减少用户延迟,在状态变化时会提高频率。

3 ,状态管理

  1. 模型状态捕获什么进程应在何处运行以及具有什么配置
  2. 运行时状态是哪些进程正在何处运行以及正在执行哪些命令(例如,重新平衡 HDFS 或执行备份/灾难恢复计划或滚动升级或停止)
  3. 当您更新配置(例如Hue Server Web 端口)时,您即更新了模型状态。但是,如果 Hue 在更新时正在运行,则它仍将使用旧端口。当出现这种不匹配情况时,角色会标记为具有”过时的配置”。要重新同步,您需重启角色(这会触发重新生成配置和重启进程)
  4. 特殊情况如果要加入一些clouder manager控制台没有的属性时候都在高级里面嵌入

4 ,服务器和客户端配置

如使用HDFS,文件 /etc/hadoop/conf/hdfs-site.xml 仅包含与 HDFS 客户端相关的配置
而 HDFS 角色实例(例如,NameNode 和 DataNode)会从/var/run/cloudera-scm-agent/process/unique-process-name下的每个进程专用目录获取它们的配置

5 ,进程管理

  1. 在 Cloudera Manager 管理的群集中,只能通过 Cloudera Manager 启动或停止服务。ClouderaManager 使用一种名为 supervisord的开源进程管理工具,它会重定向日志文件,通知进程失败,为合适用户设置调用进程的有效用户 ID 等等
  2. Cloudera Manager 支持自动重启崩溃进程。如果一个角色实例在启动后反复失败,Cloudera Manager还会用不良状态标记该实例
  3. 特别需要注意的是,停止 Cloudera Manager 和 Cloudera Manager Agent 不会停止群集;所有正在运行的实例都将保持运行
  4. Agent 的一项主要职责是启动和停止进程。当 Agent 从检测信号检测到新进程时,Agent 会在/var/run/cloudera-scm-agent 中为它创建一个目录,并解压缩配置
  5. Agent 受到监控,属于 Cloudera Manager 的主机监控的一部分:如果 Agent 停止检测信号,主机将被标记为运行状况不良

6 ,主机管理

  1. Cloudera Manager 自动将作为群集中的托管主机身份:JDK、Cloudera Manager Agent、CDH、Impala、Solr 等参与所需的所有软件部署到主机
  2. Cloudera Manager 提供用于管理参与主机生命周期的操作以及添加和删除主机的操作
  3. Cloudera Management Service Host Monitor 角色执行运行状况检查并收集主机度量,以使您可以监控主机的运行状况和性能

7 ,安全

  1. 身份验证
    1 ,Hadoop中身份验证的目的仅仅是证明用户或服务确实是他或她所声称的用户或服务,通常,企业中的身份验证通过单个分布式系统(例如,轻型目录访问协议 (LDAP) 目录)进行管理。LDAP身份验证包含由各种存储系统提供支持的简单用户名/密码服务
    2 ,Hadoop 生态系统的许多组件会汇总到一起来使用 Kerberos 身份验证并提供用于在 LDAP 或 AD 中管理和存储凭据的选项
  2. 授权
    1 ,CDH 当前提供以下形式的访问控制:
    适用于目录和文件的传统 POSIX 样式的权限
    适用于 HDFS 的扩展的访问控制列表 (ACL)
    2 ,Apache HBase 使用 ACL 来按列、列族和列族限定符授权各种操作 (READ, WRITE, CREATE, ADMIN)
    3 ,使用 Apache Sentry 基于角色进行访问控制
  3. 加密
    需要获得企业版的 Cloudera(Cloudera Navigator 许可)

8 ,收费版和免费版的区别 :

  1. 收费版的最好。
  2. 老版本 : 50 台以下的集群,免费版,完全罩得住。
  3. 最新版本 : 多少台服务器就可以,解除限制了

相关文章: