shijianan

大数据运维工程师

    作者:史建安

声明:本文章是个人现阶段水平的理解与阐述,不作任何保证,欢迎大家评论,探讨学习。

 

一,大数据运维工作职责:

 

 

(1)部署大数据集群,其中有不同的平台,其中最为主流的有cdh(cloudera manager),ambari。

(2)维护集群,也就是我们所搭建的环境,其中又分为三种:测试环境,开发环境,生产环境。

(3)大数据环境下所包含的组件有:hdfs(分布式文件系统),zookeeper(分布式应用程序协调服务),hbase(分布式且面向列的开源数据库),kafka(开源流处理平台),flume(高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统),spark(为大规模数据处理而设计的快速通用的计算引擎),yarn(资源调度平台)......

(4)解决集群以及集群下所产生的故障。

(5)根据系统配合大数据环境进行调优,是集群达到一个最优化,使用效率更高。

 

二,大数据运维所需的技术

(1)linux:常用命令

(2)java:基础开发,以及日常bug分析以及定位

(3)shell:有一定基础的shell脚本编写能力

(4)硬件,网络,安全等基础知识

(5)开源软件的使用:监控软件(ganglia,zabbix),调度(azkaban)......

(6)以及大数据组件的原理以及使用(hdfs,hbase,hive,kafka,flume,yarn,zookeeper......),方便我们工作中解决故障

 

三,大数据运维工程师的脑袋

(1)学会如何通过日志,报错信息,经验来判断故障,并进行精准定位

(2)参考论坛,官网,书籍,来进行故障解决

(3)要求掌握全方位知识,从java到linux系统,从数据库到大数据生态内组件,以及一定的英语水平

(4)尝试学习新的技术,敢于探索,积极尝试

 

四,博主的一段话

  人无完人,每个人都有自己的缺点,当我们不喜欢一件事情,但又不得不做的时候,我们要转变思维,转换角度来看待当下的我们,只要我们做就会越来越好,只要我们不做我们就是在退步就是在被别人超越。

  我不喜欢互联网,我不喜欢坐在电脑前,我不喜欢做程序员,我不喜欢不喜欢...

  那每个人都想喜欢做有趣的,轻松地,欢快的,

  但是,我们在做的是主要推动社会进步的行业,小到手机中的app,大到军事,在这个信息的时代我们是有价值的,

  既然选择了,就从容面对,培养兴趣,保证了我们的生活,我们就有时间,经历,金钱去做我们想做的事情。

  加油,我们共同成长。

 

分类:

技术点:

相关文章:

  • 2021-06-17
  • 2021-04-07
  • 2021-09-14
  • 2021-11-07
  • 2022-01-05
  • 2022-01-20
  • 2021-11-20
  • 2021-05-19
猜你喜欢
  • 2021-12-05
  • 2021-06-19
  • 2021-11-23
  • 2021-09-24
  • 2021-05-09
  • 2021-11-11
  • 2021-04-27
相关资源
相似解决方案