本节重点内容:
- Excel 函数
- Excel 透视表
- Excel 可视化
- Power BI 仪表盘
Excel 是数据分析师的好帮手, 可用来制作数据看板 / 连接数据库 / 统计分析- 简单的机器学习模型;可以说,在大数据时代,Excel 依然是数据分析师的重要工作之一。
数据分析师为甚么要学习Excel?
- Excel 是被广泛使用的数据分析工具之一,比较便于跨部门间的沟通
- 容易上手,不需要学习编程即可操作
- 功能强大,覆盖数据分析的全流程
Excel可以覆盖数据分析流程全部的六个环节:
- 数据获取
- 数据清理
- 数据转化
- 数据探索
- 统计分析与建模
- 分析呈现
数据探索:全面理解数据传达的信息,探索发现进一步深入分析切入点,常见手段有作图可视化,统计量计算等。
Excel 与R 比较:两者都可以覆盖数据分析流程全部六个环节,但通常 EXCEL用于部分步骤或者简单的工作,适合数据小而干净,分析方法不复杂等比较简单的分析,而编程语言R / Python 则是作为实际工作上的主要工具,适应于数据/分析流程更复杂,分析需求更多更深的分析;在处理数据量大小方面:Excel适合于处理1万行以下的数据,R用于处理< 4GB的数据,其他则需要使用大数据工具;
适用于Excel 完成的工作场景:
- 简单调取:Excel 函数(例如使用Excel快速查找某一特征值)
- 直观分布:可视化(例如使用饼图显示各部分比例情况)
- 动态呈现:数据透视表 —— 生成统计性总结和归纳的表格:
小试牛刀:
- test1:快速查找出市场为中国、销售渠道为在线聊天、产品类型为CRM&ERP组合这个业务单元所对应的销售目标状况;—— 多条件筛选
- test2:提取ID一列中的地理信息;—— LEFT
- test3:计算最大的销售额目标值;—— MAX
- test4:计算公司2019年1-6月份总销售目标(只考虑大于 ¥10,000的销售额目标预测单元(行))—— SUMIF(区域,">100000")
Excel 函数操作的基本知识:
- 简单函数示例 —— = 1+ 1;(选定一个单元格,在函数框输入函数(以等号开始),计算单元格的值 )
- 选取其他单元格作为函数变量
- 通过拖拉复制其他函数到其他单元格‘;
- " $ " 表示单元格的绝对位置(F4);
- " : "表示多个单元格作为函数变量输入;
数据处理类函数:
数据分析流程的6个步骤:数据获取- 数据清理 -数据转换 - 数据探索 - 统计分析和建模 - 数据呈现,其中,数据清理 和 数据转换这两个阶段常用的函数,在这里统称为 “数据处理类”函数。