【发布时间】:2020-07-19 04:43:51
【问题描述】:
我正在使用泰坦尼克号数据集。我已经对幸存的 3 个类别进行了一次HotEncoding,sex,cabin。
encoder = OneHotEncoder(categories='auto',
drop='first',
sparse=False,
handle_unknown='error')
encoder.fit(X_train.fillna('Missing'))
tmp = encoder.transform(X_train.fillna('Missing'))
onepd = pd.DataFrame(tmp, columns= encoder.categories_)
ecoder.categories_ 数组大小与 tmp 不同。有什么办法吗?
【问题讨论】:
标签: pandas machine-learning scikit-learn one-hot-encoding feature-engineering