【发布时间】:2020-07-16 16:55:35
【问题描述】:
我最近发现了一个模型,可以根据叶子的大小对爱尔兰花进行分类。有 3 种类型的花作为目标(因变量)。据我所知,分类数据应该被编码,以便它可以用于机器学习。然而,在模型中,数据直接使用,无需编码过程。 谁能帮助解释何时使用编码?提前谢谢!
【问题讨论】:
-
您使用哪种编程语言?它是什么型号?请显示数据示例和一些可以澄清您的问题的代码。如果模型是在 R 中构建的,则分类变量可能被视为因素。这意味着它们是数字编码的。如果模型是用 python 构建的,那很可能不好。
标签: machine-learning