一个热编码器，用于多个单词的分类变量答案

【问题标题】：one hot encoder for the categorical variables of more one word一个热编码器，用于多个单词的分类变量
【发布时间】：2021-11-02 05:11:08
【问题描述】：

我有一个如下所示的数据集。我想为“项目”列的逻辑回归做一个热编码。 “项目”列中有 313 个不同的项目，我遇到了错误。你能帮忙解决一下吗？

enter image description here 代码如下：

 from sklearn.compose import ColumnTransformer
    from sklearn.preprocessing import OneHotEncoder
    ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [0])], 
    remainder='passthrough')
    X = np.array(ct.fit_transform(X))**

array(' 类型的稀疏矩阵以压缩稀疏行格式存储 4493 个元素>, dtype=object)

【问题讨论】：

可以参考这个链接：stackoverflow.com/questions/59339820/…

标签： python-3.x machine-learning scikit-learn logistic-regression

【解决方案1】：

使用此代码，其中df 是您的数据框的名称

import pandas as pd
df = pd.get_dummies(data = df, columns = ['Item'])

【讨论】：

显示这个错误：TypeError: unhashable type: 'numpy.ndarray'
@Aru 不要使用 NumPy 数组。在熊猫数据框上使用它。我的意思是，使用 pandas 加载数据集并立即应用此代码。