【发布时间】:2016-11-29 19:17:16
【问题描述】:
我使用scikit-learn 来实现一个简单的监督学习算法。本质上,我遵循教程here(但使用我自己的数据)。
我尝试拟合模型:
clf = svm.SVC(gamma=0.001, C=100.)
clf.fit(features_training,labels_training)
但是在第二行,我得到一个错误:ValueError: could not convert string to float: 'A'
该错误是意料之中的,因为label_training 包含代表三个不同类别的字符串值,例如A、B、C。
所以问题是:如果标记的数据以字符串形式表示类别,我该如何使用 SVC(支持向量分类)。对我来说,一个直观的解决方案似乎只是将每个字符串转换为一个数字。比如A = 0、B = 1等。但这真的是最好的解决方案吗?
【问题讨论】:
标签: python machine-learning scikit-learn svm