【发布时间】:2020-11-04 18:07:32
【问题描述】:
我正在尝试理解经典虹膜分类问题的指导教程中的代码块。
最终模型的代码块如下
chosen_model = SVC(gamma='auto')
chosen_model.fit(X_train,Y_train)
predictions = chosen_model.predict(X_valid)
在this image 中,您可以看到 X_train 和 Y_train 中存在的数据类型。这些是 Numpy 数组。 Y_train 包含 Iris 物种作为字符串。
我的问题很简单:即使我没有将 Y_train One-Hot Encoded 编码到不同的二进制列中,该模型是如何工作的?我从其他教程的理解是,对于多类分类,我需要先进行一次热编码。
代码运行良好,我想掌握何时需要 One-Hot Encode 以及何时不需要。谢谢!
【问题讨论】:
标签: python machine-learning classification one-hot-encoding multilabel-classification