【发布时间】:2022-01-23 09:03:03
【问题描述】:
我有一个实验室处理预处理数据。我尝试将 ColumnTransformer 与管道语法一起使用。我在下面有一些代码。
preprocess = ColumnTransformer(
[('imp_mean', SimpleImputer(strategy='mean'), numerics_cols),
('imp_mode', SimpleImputer(strategy='most_frequent'), categorical_cols),
('onehot', OneHotEncoder(handle_unknown='ignore'), categorical_cols),
#('stander', StandardScaler(), fewer_cols_train_X_df.columns)
])
在我运行这段代码并调用管道后,结果是。
['female', 1.0, 0.0, 0.0],
['male', 0.0, 1.0, 0.0],
['female', 1.0, 0.0, 0.0],
['male', 0.0, 1.0, 0.0],
['male', 0.0, 1.0, 0.0],
['male', 0.0, 1.0, 0.0],
['male', 0.0, 1.0, 0.0],
['female', 1.0, 0.0, 0.0],
['male', 0.0, 1.0, 0.0],
['male', 0.0, 1.0, 0.0],
['male', 0.0, 1.0, 0.0],
['male', 0.0, 1.0, 0.0],
['male', 0.0, 1.0, 0.0],
['female', 1.0, 0.0, 0.0],
['female', 1.0, 0.0, 0.0],
['male', 0.0, 1.0, 0.0],
您可以在结果中看到分类。我试着放下它,但它还在这里。 所以我只想在这个结果中删除分类来运行 StandardScaler。我不明白为什么它不起作用。 感谢您的阅读。
【问题讨论】:
标签: machine-learning scikit-learn one-hot-encoding