【发布时间】:2020-09-06 21:39:38
【问题描述】:
我想在 sklearn 中使用套索回归来运行我的数据。
我的数据框中的所有属性都是数字类型(数字,我的意思是它们都是整数)。
但其中一些显然应该是分类的(例如,我的数据框中的“种族”属性是一个具有三个值 1、2、3 的属性,其中每个值代表一个种族)。
我所做的是首先使用astype('str') 将这些列设置为字符串类型,然后使用代码astype('categorical') 将这些列的数据类型转换为分类。
最后,我在这些转换后的特征上使用了sklearn.linear_model.Lasso。
我的问题是sklearn.linear_model.Lasso 可以识别这些变量是分类的吗?或者处理这些类型的分类数据的唯一方法是热编码?
【问题讨论】:
标签: python pandas scikit-learn