为什么职场人要具备数据分析能力
大家常说人在江湖,身不由己。
随着行业逐渐成熟、竞争不断加大、人口红利和资源红利的优势逐渐消失,很多行业的发展都逐渐缓慢下来。过去的粗犷化运营造成很大的资源浪费,企业无法承受,大家逐渐发现了数据驱动的价值。现下的大环境,数据已经渗透到当今每一个行业和业务职能领域,成为了重要的生产因素。
在这样的大环境下,要想更好地处理自己的工作、顺应数据化浪潮,都有必要掌握一定的数据分析技能。
哪些是职场通用的数据分析能力?
需要数据分析能力的职场人,基本可以分为两大类:
(1)经常和数据打交道的人,比如市场营销、产品运营、经济金融、成本管控等,可以说各行各业各个岗位,基本都需要和数据打交道。
(2)数据分析师,通常比较大型的企业、比较重视信息化建设的企业,都会有自己的数据库,那对应的就会有专门的数据分析部门,部门下一般有三种角色:数据工程师、数据分析师、数据科学家。
| 科普一下:
数据工程师相对好区分,主要是负责数据库的搭建、维护,数据的抽取、调度等,和“数据驱动业务”的直接关联度不高。数据分析师和数据科学家,相对要难区分一些,通常我们认为数据分析师有项目、有KPI,做的一般是中短期项目,解决现有需求,主要对历史数据进行回顾。而数据科学家,则侧重研究,需要不断创造、优化算法和模型,往往进行的是中长期项目,解决的是现在解决不了或者解决起来特别麻烦,未来才需要系统解决的问题,要求具有一定的前瞻性,可以用数据对未来进行预测。
不管你是属于哪一类,想要获取通用的数据分析能力,大致可以分为3步:
1、核心:培养数据分析思维
结构化思维、公式化思维、业务化思维,这三种思维方法常常被用于指导数据分析。
• 结构化思维:
即著名的金字塔原理。人的大脑很难处理大量的、无规律的信息,所以需要想办法把碎片化的信息找一个结构立起来。所以结构化思维,往往有一个框架,然后只需要把所有信息整理好、对应放到框架中。但很多时候,这个框架并不是现成的,需要我们进行搭建。
最常用的是自上而下构建结构的方法。举例来说,出现头疼,我们进行自我诊断:
第一步,就是先提出问题,为什么头疼,想要找出产生问题的原因。
第二步呢,用现有知识回答这个问题,比如分为生理上或者心理上的问题。对于生理上的问题,再分为内在的和外在的。外在的比如天气影响、办公环境等;内在的比如病毒性感冒等。同样的,对于心理上的问题,也可以分为比如最近工作太忙,压力过大,或者面临考核紧张等等。这样可以形成一个自我诊断的框架。
• 公式化思维:
公式化思维本着一切皆可量化的原则,以数学公式为依据来分析问题,又或者说,在定性之后,我们更强调定量。
• 业务化思维:
需要对所从事的业务本身有比较深刻的理解,业务与业务之间,会有一定的隔离,比如对电影进行票房收入分析,和对卖场销量进行分析,关注点并不一致,这就是业务之间的隔离。
结构化思维、公式化思维、业务化思维,本质上这三者是密不可分的。要想做好数据分析,这三种思维缺一不可。
2、落脚点:掌握数据分析工具和方法
思维是指导策略、是武功心法,当遇到实际问题的时候,还是要落到具体的操作上。
通常拿到数据,我们需要做两件事。
首先是数据清洗,对一些不合规的数据进行处理,主要包括删除无关数据、重复数据,处理缺失值、异常值等。接下来需要进行数据变换,把数据转换成适当的形式,以方便后续进一步分析。
进行数据处理和分析操作,可以使用多种工具。
-
Excel:是最常用和最普及的工具,可以制作二维表,进行筛选、排序、计算、分类汇总等等操作,还可以绘制一些简单的信息图表。但Excel也有不少局限,比如说处理复杂数据的速度和系统负荷、再比如绘制图表的难易度和美观性等。
-
SQL:操作难度不高,可以同时处理数据和管理数据库,并且,它还可以嵌入到其他语言里使用,如C++等。SQL相比Excel的比较明显的优势是,对于数据量较大的情况很友好,并且可以直接在数据库里面操作,而不需要进行数据的导入导出。
-
Python:近年大热,风头盖过了几乎所有传统语言。Python在做数据挖掘和人工智能方面,有着得天独厚的优势。同时,它又是一门很综合的语言,既可以用来开发,也可以用来做数据分析,处理复杂数据、绘制可视化图表都是非常有优势的。更关键的是,Python代码简单,相当于是为所有非IT背景的人打开了一扇通往coding世界的大门。
-
Tableau:是当今最受欢迎的商业智能可视化工具,操作简单,只需要拖放就能得到比较美观的图表,和前面的数据分析工具不同,tableau更侧重于结果的展示,在数据清洗规整上较难发挥。
3、提高自己的数据报告撰写能力
所有工作都是结果导向的。因此,如何写出一份合格的报告,也是要非常重视的。
PPT是我们在报告时的常用工具,想要提高PPT能力,总离不开多看、多练、多思考。国内最知名的锐普PPT论坛,里面有各种小白大神、各种优秀作品;锐普PPT、秋叶PPT也都可以参考;另外,我们也可以看一些设计排版相关的内容,比如花瓣网、比如优秀杂志期刊,也可以多看看品牌发布会。
如何更进一步为自己升级赋能
很多时候,通用的数据分析还不足以使我们发掘出更深层次的规律和价值,如果还想走得更远,可以朝数据科学的方向迈进,挑战传统BI无法支持的领域。
那数据挖掘到底能干什么呢?
-
帮助奥巴马连任总统
-
帮助NBA勇士队四年三冠
-
帮助建立电商推荐系统
-
帮助预测市场、定量分析用户满意度
…
举个具体场景来说,公司经常有很多用户反馈信息,一方面数据量非常大,另一方面数据并不是我们常见的比如“满意”“不满意”,而是一段描述性的文字,我们没有办法直接准确地判断出用户的满意度,也没有办法快速准确地分析出用户的关注点。这时候就可以使用数据挖掘的方法,比如聚类分析、情感分析、文本主题分析等等,来提炼出用户的情感倾向、关注点、产品卖点和不足。
如果要掌握数据挖掘技能,我们需要做这样两件事,首先,熟悉至少一门编程语言,因为很多算法都需要代码实现。其次,理解主流机器学习算法原理和应用。推荐两本可以说是数据挖掘领域的必读经典:一本是美国科学家编写的《数据挖掘导论》,另一本是南京大学周志华教授编写的《机器学习》,也就是业界非常有名的西瓜书,或许可以帮我们用最科学的方法,挑选出夏天最好吃的西瓜。