三个描述性统计量
-
均值(mean)
- 唯一(序列的所有值的和除以序列的数值总个数)
- 用于连续数据
- 易受极端值的影响
-
中位数(median)
- 唯一(序列从小到大排序后中间的一个数据)
- 不易受极端数据的影响
-
众数(mode)
- 不唯一
- 一般用于分类数据
- 不易受极端数据的影响
偏态分布
-
用均值、中位数、众数三者的位置关系判定和查看
- 用中位数查看
将数据一分为二(中位数的位置),哪边数据少,就是往哪边偏。 - 用众数描述
众数位置哪边尾巴长,就是往哪边偏。
- 用中位数查看
- 数据分布往哪边偏,均值被拉往哪边