数据图表展示

一、数据预处理

1. 数据审核:原始数据(完整性和准确性);二手数据(适用性和时效)

2. 数据筛选:高级筛选

姓名 统计学成绩 数学成绩 英语成绩 经济学成绩
张松 69 68 84 86
王翔 91 75 95 94
田雨 54 88 67 78
李华 81 60 86 64
赵颖 75 96 81 83
宋媛 83 72 66 71
袁方 75 58 76 90
陈风 87 76 92 77
例1:英语成绩最高的前三名的学生
【数据】-【筛选】-【数字筛选】-【等于】- 【前10项】
W1-数据图表展示
例2:四门课程成绩都大于70分的学生
【数据】-【高级】
W1-数据图表展示

3. 数据排序:数据透视表

【插入】-【数据透视表】
例3.数据透视表应用
W1-数据图表展示
W1-数据图表展示
各个变量可以拖动,值也可以有求和公差以及百分比的形式
W1-数据图表展示
行标志字段可分段显示,自行设置
W1-数据图表展示

二、品质数据的整理与展示

1. 品质数据与数值数据的概念

品质数据 分类数据(人口性别/行业属性)、顺序数据(产品等级/教育程度/事物态度)
数值数据 定量数据或是数量数据

2. 分类数据的整理与图示

频数:落在某一特定类别或组中的数据个数
频数分布:把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来
比例:构成比,一个样本(或总体)中各个部分的数据与全部数据之比,反映样本(或总体)的构成结构,乘以100就是百分比
比率:样本(或总体)中不同类别数据之间的比值,比值可能大于1

  • 条形图
  • 帕累托图(频数排降序,累积百分比)
  • 饼图
  • 环形图(多个样本各部分占比)

3. 顺序数据的整理与图示

累积频数:将各有序类别或组的频数逐渐累加起来得到的频数;向上累积(变量值逐渐变大)

三、数值数据的整理与展示

1. 数据分组

单变量分组 每一个变量值作为一组,适合离散变量,变量值较少情况使用
组距分组 连续变量或变量值较多的情况,划分若干个区间

注:FREQUENCY 函数可创建频数分布表
W1-数据图表展示

2. 数值型数据的图示

分组数据 直方图 (面积表示各组频数/各矩形连续排列/展示数值型数据)
未分组数据 茎叶图(离散状况/分布形状)、箱线图(最大小值/中位数/上下四分位数)
时间序列数据 线图(反映现象随时间变化的特征)
多变量数据 散点图(两变量关系)、气泡图(三变量关系)、雷达图(蜘蛛图多变量多样本相似程度)

3. 箱线图的绘制

excel 没有箱线图,可用SPSS软件
【图形】-【箱图】-【简单】-【变量摘要】-【定义】-【框的表征】
W1-数据图表展示
W1-数据图表展示
W1-数据图表展示
W1-数据图表展示

四、合理使用图表

1. 数据类型与主要图示方法

W1-数据图表展示

2. 鉴别图形优劣的准则

  • 一张好图应当精心设计,有助于洞察问题实质
  • 一张好图应当使复杂观点得到简明,确切,高效的阐述
  • 一张好图应当在最短时间以最少的笔墨给读者大量信息
  • 一张好图是多维的
  • 一张好图应当表述数据的真实情况

3. 统计表的设计

统计表一般由四个主要部分组成,表头,行标题,列标题,数据资料,下方也可加表外附加

#########################################################################
@ 2019.11.02 木居居士的统计学习小组 第一周 打卡
安利自主学习监督组织 - 【公众号】数据科学家联盟
https://mp.weixin.qq.com/s/1WWmbLZucz9vIp-4tKKQ5Q

相关文章: