【发布时间】:2021-11-02 05:11:08
【问题描述】:
我有一个如下所示的数据集。我想为“项目”列的逻辑回归做一个热编码。 “项目”列中有 313 个不同的项目,我遇到了错误。你能帮忙解决一下吗?
enter image description here 代码如下:
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [0])],
remainder='passthrough')
X = np.array(ct.fit_transform(X))**
array(' 类型的稀疏矩阵 以压缩稀疏行格式存储 4493 个元素>, dtype=object)
【问题讨论】:
标签: python-3.x machine-learning scikit-learn logistic-regression