- Author
- Yin Haibo
-----------------------------------------------------------------------------------------------------------------------------------------------
描述定量数据的数值法:
-
帮助确定相对频率分布中心位置的度量:中心趋势度量
- 均值
- 中位数
- 众数
-
围绕中心波动的度量: 变异性的度量
- 极差
- 方差
- 标准差
-
描述数据集中的一个观测值相对位置的度量:相对位置的度量
- 百分位数(上四分位数->75%分位数、中位数>50%分位数、下四分位数)
- z_score(减均值除以方差)
检测异常值的方法:
- z_score
- 四分位数间距(IQR)
- 局部离群因子(LOF)
- 独立森林(IForest)
- DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)