【发布时间】:2021-08-04 20:39:19
【问题描述】:
我正在使用二进制分类数据集。我想将名义数据转换为数字。但我有缺失值,我不想删除它们,因为我的目标是用 KNN 方法填充主题。我应该怎么做才能将它们转换为数字数据?
age | class
------------
1 | NAN
2 | yes
3 | no
4 | NAN
5 | no
6 | NAN
7 | no
8 | yes
9 | no
10 | NAN
如果数据集有缺失值,此代码将不起作用
mapping = {label:idx for idx,label in enumerate(np.unique(df['class']))}
df['class'] = df['class'].map(mapping)
【问题讨论】:
-
您的意思是要将“是”/“否”值替换为数值,即 0 和 1?
-
@sandertjuh 是的,但我不知道如何处理丢失的数据,因为我的目标是使用 KNN 找到它们。
标签: python python-3.x pandas data-mining missing-data