【发布时间】:2021-03-11 09:43:42
【问题描述】:
我一直在上 Kaggle 的中级机器学习课程。在解释中,为了标记分类数据,他们使用了来自 sklearn.preprocessing 的LabelEncoder 库。
这里,对于训练数据集,他们使用了 fit_transform,而对于验证数据集,他们只使用了变换,为什么会这样?
此外,在处理空值时,他们在训练数据集中使用了 fit_transform,而对于验证数据集,他们使用了 transform。 那么fit_transform和transform有什么区别,可以在什么情况下使用呢?
【问题讨论】:
标签: machine-learning scikit-learn cluster-analysis preprocessor kaggle