大数据运维工程师
作者:史建安
声明:本文章是个人现阶段水平的理解与阐述,不作任何保证,欢迎大家评论,探讨学习。
一,大数据运维工作职责:
(1)部署大数据集群,其中有不同的平台,其中最为主流的有cdh(cloudera manager),ambari。
(2)维护集群,也就是我们所搭建的环境,其中又分为三种:测试环境,开发环境,生产环境。
(3)大数据环境下所包含的组件有:hdfs(分布式文件系统),zookeeper(分布式应用程序协调服务),hbase(分布式且面向列的开源数据库),kafka(开源流处理平台),flume(高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统),spark(为大规模数据处理而设计的快速通用的计算引擎),yarn(资源调度平台)......
(4)解决集群以及集群下所产生的故障。
(5)根据系统配合大数据环境进行调优,是集群达到一个最优化,使用效率更高。
二,大数据运维所需的技术
(1)linux:常用命令
(2)java:基础开发,以及日常bug分析以及定位
(3)shell:有一定基础的shell脚本编写能力
(4)硬件,网络,安全等基础知识
(5)开源软件的使用:监控软件(ganglia,zabbix),调度(azkaban)......
(6)以及大数据组件的原理以及使用(hdfs,hbase,hive,kafka,flume,yarn,zookeeper......),方便我们工作中解决故障
三,大数据运维工程师的脑袋
(1)学会如何通过日志,报错信息,经验来判断故障,并进行精准定位
(2)参考论坛,官网,书籍,来进行故障解决
(3)要求掌握全方位知识,从java到linux系统,从数据库到大数据生态内组件,以及一定的英语水平
(4)尝试学习新的技术,敢于探索,积极尝试
四,博主的一段话
人无完人,每个人都有自己的缺点,当我们不喜欢一件事情,但又不得不做的时候,我们要转变思维,转换角度来看待当下的我们,只要我们做就会越来越好,只要我们不做我们就是在退步就是在被别人超越。
我不喜欢互联网,我不喜欢坐在电脑前,我不喜欢做程序员,我不喜欢不喜欢...
那每个人都想喜欢做有趣的,轻松地,欢快的,
但是,我们在做的是主要推动社会进步的行业,小到手机中的app,大到军事,在这个信息的时代我们是有价值的,
既然选择了,就从容面对,培养兴趣,保证了我们的生活,我们就有时间,经历,金钱去做我们想做的事情。
加油,我们共同成长。