数据预处理(Data Preprocessing)

数据预处理——数据清洗、异常值与重复数据的检测


Where are data from?

数据预处理——数据清洗、异常值与重复数据的检测


Why Data Preprocessing?

数据预处理——数据清洗、异常值与重复数据的检测

数据预处理——数据清洗、异常值与重复数据的检测


How to handle missing data?

数据预处理——数据清洗、异常值与重复数据的检测


Outliers

数据预处理——数据清洗、异常值与重复数据的检测              数据预处理——数据清洗、异常值与重复数据的检测


注:异常点(Anomaly) vs. 离群点(Outlier)是不一样的


怎么分析离群点(Local Outlier Factor)—— 用相对的关系

数据预处理——数据清洗、异常值与重复数据的检测

数据预处理——数据清洗、异常值与重复数据的检测


处理重复的数据(Duplicate Data)

数据预处理——数据清洗、异常值与重复数据的检测

方法一:用滑动窗口去做

数据预处理——数据清洗、异常值与重复数据的检测

方法二:找两者关键的相同点

数据预处理——数据清洗、异常值与重复数据的检测


数据预处理——数据清洗、异常值与重复数据的检测


数据预处理——数据清洗、异常值与重复数据的检测


数据预处理——数据清洗、异常值与重复数据的检测


数据预处理——数据清洗、异常值与重复数据的检测

相关文章: