【发布时间】:2019-10-23 11:21:38
【问题描述】:
我记得在 R 中我使用了.factor(我相信它们是带有级别的因子)但在 python 中我不知道该怎么做。
它使用了 get_dummies,但是当训练数据集包含测试没有的值时会出现问题,因此生成的列比 ML 算法不接受的多。
我需要转换以下列:
train.head(5)
Id MSSubClass MSZoning
1 60 RL
2 53 RR
3 49 RL
4 60 RL
5 95 RR
6 16 RR
6 16 R1
我需要离开 train.MSZoning 如下:
MSZoning
1
2
1
1
2
2
3
谢谢。
【问题讨论】:
标签: python r machine-learning