【发布时间】:2015-01-17 19:44:19
【问题描述】:
我正在尝试构建一个线性 svm 分类器来分类未知的测试数据。
但是,由于文本文档没有固定长度,如何确保新文档具有相同的特征长度?
Src 和 Dest 的属性数不同:2 != 1484
LibSVM classifier = new LibSVM();
classifier.setKernelType(new SelectedTag(LibSVM.KERNELTYPE_LINEAR, LibSVM.TAGS_KERNELTYPE));
classifier.buildClassifier(data1);
System.out.println("done");
data2.setClassIndex(data2.numAttributes() - 1);
double res = classifier.classifyInstance(data2.instance(0));
数据2 arff
@data
'This is a string!','?'
无论如何我可以构建一个与当前模型具有相同数量属性的特征向量吗?或者除此之外还有什么解决办法。
【问题讨论】: