【发布时间】:2015-05-23 17:48:17
【问题描述】:
为了找到与 libsvm 一起使用的最佳参数,我使用了以下代码。而不是 './heart_scale' 我有一个包含正面和负面示例的文件,每个示例都有一个 libsvm 格式的 hog 向量。我有 1000 个正例和 4000 个负例。但是这些是按顺序排列的,即第 1000 个示例是正示例,其他示例是负示例。
问题:现在,我怀疑这段代码返回的准确性是否是实际准确性。这是因为当我阅读 5 折交叉验证时,它将前 4/5 的数据作为训练,剩下的 1/5 用于测试。这是否意味着测试集可能都是负面的?还是随机抽取示例?
%# read some training data
[labels,data] = libsvmread('./heart_scale');
%# grid of parameters
folds = 5;
[C,gamma] = meshgrid(-5:2:15, -15:2:3);
%# grid search, and cross-validation
cv_acc = zeros(numel(C),1);
for i=1:numel(C)
cv_acc(i) = svmtrain(labels, data, ...
sprintf('-c %f -g %f -v %d', 2^C(i), 2^gamma(i), folds));
end
%# pair (C,gamma) with best accuracy
[~,idx] = max(cv_acc);
%# contour plot of paramter selection
contour(C, gamma, reshape(cv_acc,size(C))), colorbar
hold on
plot(C(idx), gamma(idx), 'rx')
text(C(idx), gamma(idx), sprintf('Acc = %.2f %%',cv_acc(idx)), ...
'HorizontalAlign','left', 'VerticalAlign','top')
hold off
xlabel('log_2(C)'), ylabel('log_2(\gamma)'), title('Cross-Validation Accuracy')
%# now you can train you model using best_C and best_gamma
best_C = 2^C(idx);
best_gamma = 2^gamma(idx);
%# ...
【问题讨论】:
标签: matlab libsvm cross-validation