【发布时间】:2020-07-31 08:45:40
【问题描述】:
我有一个缺少很多分类值的数据集,我想制作一个自定义估算器,它将用等于 "no-variable_name" 的值填充空值。
例如,如果列 "Workclass" 具有 Nan 值,请将其替换为 "No Workclass"。
我是这样做的
X_train['workclass'].fillna("No workclass", inplace = True)
但我想创建一个Imputer,所以我可以在管道中传递它。
【问题讨论】:
-
看起来 sklearn 已经有一个 SimpleImputer class 可以满足您的需求。如果它缺少某些东西,那么你总是可以继承它。
-
答案对@vasilis 有帮助吗?不要忘记您可以投票并接受答案。见What should I do when someone answers my question?,谢谢:)
-
是的,他们帮了很多忙!我只是检查了它们,因为我有点忙。谢谢大家!
标签: python pandas machine-learning scikit-learn sklearn-pandas