【发布时间】:2020-07-05 21:08:58
【问题描述】:
我正在尝试使用 SKlearn SVM 预测我的数据集中的值。 在Sklearn website,我有更多的模型:
我的数据集是完整的数字数据集(如 Iris 数据集),没有标签。
我尝试以这种方式应用模型:
svclassifier = SVC(kernel='linear')
而且计算时间很长(大约19小时)
我试图改变模型
svclassifier = SVR()
而且计算很轻(大约2分钟)
我也用我的原始值和预测值检查了 RMSE,差异非常接近,在 SVC 中约为 6,而 SVR 为 5.9(在这个中似乎更好)。
如何找到适合该套装的型号? 我使用的两个模型有什么区别?
编辑:这是我的数据集类型
valueHR values WkHR WkCal WkSteps sec sugar cal carbs fat fiber protein sodium
823 77 0 0 0 0 0 90 0 0 0 0 0 0
824 75 49 0 0 0 0 90 0 0 0 0 0 0
我以这种方式拆分df
X = data.drop('sugar', axis=1)
y = data['sugar']
我对 X 和 y 进行了测试和训练
之后,我应用 SVM 来预测糖值。
编辑 2:data.unique()
data['sugar'].unique()
array([ 90, 86, 82, 79, 78, 76, 84, 88, 92, 81, 93, 96, 95,
94, 87, 99, 97, 89, 104, 109, 113, 116, 108, 98, 80, 72,
73, 74, 83, 112, 107, 103, 91, 100, 102, 101, 105, 117, 110,
106, 125, 133, 115, 111, 114, 85, 121, 119, 126, 122, 127, 132,
136, 131, 123, 120, 118, 124, 130, 128, 129, 140, 138, 139, 145,
154, 148, 134], dtype=int64)
说清楚,我不想分类,我只想预测。在数据集中有同一个人的数据,所以我没有更多的人(就像 Iris 数据集的情况一样,有不同的物种)。
【问题讨论】:
-
SVC 是分类器,SVR 是回归器。
-
请提供至少您的数据集的摘录和您想要获得的结果。如果没有,您的问题将被关闭,因为它需要更多关注。谢谢。
-
@sentence 我编辑了,谢谢。
-
请提供
len(data['sugar'].unique())的输出。谢谢。
标签: python scikit-learn svm prediction svc