【发布时间】:2020-02-29 03:10:00
【问题描述】:
具有列的数据集- 目标列——水果名称(数据——芒果、橙、苹果), 特征列 -- size(numeric),color(red,green,yellow),weight(numeric)
我对颜色列进行了一次热编码并准备了特征,每一列都有数值。
我想使用分类模型进行预测。
如果我有一个我必须进行预测的目标列,它由分类数据(例如苹果、橙色、芒果)组成,所以如果我想使用逻辑回归模型,它是一个基于分类的模型,我是否也需要对目标列进行热编码或标签编码,就像我们对特征列(名称颜色)所做的那样。
谢谢你
【问题讨论】:
标签: machine-learning pyspark data-science one-hot-encoding