【问题标题】:one hot encoder for the categorical variables of more one word一个热编码器,用于多个单词的分类变量
【发布时间】:2021-11-02 05:11:08
【问题描述】:

我有一个如下所示的数据集。我想为“项目”列的逻辑回归做一个热编码。 “项目”列中有 313 个不同的项目,我遇到了错误。你能帮忙解决一下吗?

enter image description here 代码如下:

 from sklearn.compose import ColumnTransformer
    from sklearn.preprocessing import OneHotEncoder
    ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [0])], 
    remainder='passthrough')
    X = np.array(ct.fit_transform(X))**

array(' 类型的稀疏矩阵 以压缩稀疏行格式存储 4493 个元素>, dtype=object)

【问题讨论】:

标签: python-3.x machine-learning scikit-learn logistic-regression


【解决方案1】:

使用此代码,其中df 是您的数据框的名称

import pandas as pd
df = pd.get_dummies(data = df, columns = ['Item'])

【讨论】:

  • 显示这个错误:TypeError: unhashable type: 'numpy.ndarray'
  • @Aru 不要使用 NumPy 数组。在熊猫数据框上使用它。我的意思是,使用 pandas 加载数据集并立即应用此代码。
猜你喜欢
  • 1970-01-01
  • 2020-09-12
  • 2018-07-16
  • 1970-01-01
  • 2019-03-31
  • 2019-08-09
  • 1970-01-01
  • 1970-01-01
  • 2019-07-18
相关资源
最近更新 更多