task1: second_hand_car_sale_price_predict
1)通过这次学习总体过了一遍EDA的流程
EDA的目的是为了初步探索熟悉数据,包括数据总览,了解变量间的相关性及变量与预测值之间的存在关系。
预测值的分布:这点我没有太熟悉,之前不了解。下次需要着重总结下。
EDA与特征工程处理之间的关系,还需要再进一步学习,感觉EDA主要是初略统计预览,特征工程是细调。
2)学习了一些python常用函数的用法
如append,selesct_dtypes,value_counts
3)学习了如何可视化,除了线性图,柱状图,热图,点图,小提琴图,箱状图等。还有多变量关系的可视化,
https://www.jianshu.com/p/6e18d21a4cad
4)对于变量,数值变量和类别变量的分析方法不一样,需要分别处理。
初步粗略的学习,还需要多次学习深入