Kaggle项目:房价预测(1)

http://ddrv.cn/a/288668

2.2 数据探索分析

2.2.1 分析目标变量(SalePrice)

2.2.2 分析特征变量

2.2.2.2 定量变量分析

数据处理2数据处理2

2.2.2.3 定性变量分析(方差分析)

2.2.2.4 相关性(spearman相关系数)

数据处理2

3. 数据清洗

3.1 离群点处理

3.2 缺失值处理

Kaggle平台Titanic生存率预测项目(TOP3%)

https://zhuanlan.zhihu.com/p/50194676

Kaggle经典案例——泰坦尼克号

https://zhuanlan.zhihu.com/p/71840687

数据处理2

[kaggle数据] 泰坦尼克号生存预测分析

https://blog.csdn.net/regina67/article/details/77940640

特征工程

因为是对生存预测进行分析,所以主要是对Survived和其他变量进行可视化分析,可以在一定程度上观察他们间是否相关。

1、Pclass(乘客分集)

2、Name(字符变量)

3、Sex(二分类数据)

4、age(多分类)

5、SibSp和Parch(这个两个变量都表示家人的数量,所以把他们合并成一个变量Family)

6、Fare(费用数据)

7、Cabin(舱号二分类处理)

8、Embarked(上船的位置)

9、变量相关性

kaggle 旧金山犯罪案件分类预测

https://blog.csdn.net/iam_emily/article/details/80876042

数据分析

1、PdDistrict

2、Category

3、year/month/day

4、Day of week

数据处理2

5、地图坐标展示

数据处理2

数据处理

类别特征:Dates,Descript,DayOfWeek,PdDistrict,Resolution,Address 
数值型特征:X,Y,year,month,day,hour 
时间特征:date

相关文章:

  • 2021-12-10
  • 2021-11-13
  • 2021-10-16
  • 2021-03-07
  • 2021-11-20
  • 2021-12-15
猜你喜欢
  • 2021-10-20
  • 2021-12-03
  • 2021-12-12
  • 2021-09-29
  • 2021-12-22
  • 2021-09-20
相关资源
相似解决方案