【发布时间】:2014-04-28 15:59:02
【问题描述】:
我有一个 ArrayList 测试集。此列表包含我在 WEKA 中进行 SMO 评估的数据。我想使用评估 weka 类来对我的测试集进行分类。在最简单的情况下,我只有一个 ArrayList 中的一个图像提取了一个特征。为了在下面使用我的列表,必须进行什么转换:
Evaluation eval = new Evaluation(testset); // how can I cast testset2 Instances object?
eval.evaluateModelOnce(c, data);
此代码来自here:我正在使用它来训练 SMO 模型。训练数据集包含特征提取的训练图像,存储在 .arff 文件中。在测试过程中,我正在读取我的代码中计算特征的图像,将它们存储在 arrayList 中,而不将它们存储在 .arff 文件中。我想将列表直接转换为 Instances 对象并继续分类。
编辑:我尝试做其他事情,首先将 arrayList 转换为数组双精度数据,然后继续进行我的 trainSet:
int numAtts = data[0].length;
FastVector atts = new FastVector(numAtts);
for (int att = 0; att < numAtts; att++) {
atts.addElement(new Attribute("Attribute" + att, att));
}
int numInstances = data.length;
Instances dataset = new Instances("Dataset", atts, numInstances);
for (int inst = 0; inst < numInstances; inst++) {
dataset.add(new Instance(1.0, data[inst]));
}
但是我收到了:
Exception in thread "main" java.lang.ClassCastException: javax.management.Attribute cannot be cast to weka.core.Attribute
编辑:
我修改了一些代码
double data[][] = new double[1][];
data[0] = dt;
System.out.println(args[1]);
System.out.println(args[2]);
ClothesAnalysis asdf = new ClothesAnalysis();
weka.classifiers.Classifier c = asdf.loadModel(new File(args[1]), args[2]);
String opt = ("-C 100 -K weka.classifiers.functions.supportVector.NormalizedPolyKernel");
String[] options = opt.split(" ");
int numAtts = data[0].length;
FastVector atts = new FastVector(numAtts);
for (int att = 0; att < numAtts; att++) {
atts.addElement(new weka.core.Attribute("Attribute" + att, att));
}
int numInstances = data.length;
Instances dataset = new Instances("Dataset", atts, numInstances);
for (int inst = 0; inst < numInstances; inst++) {
dataset.add(new Instance(1.0, data[inst]));
}
dataset.setClassIndex(dataset.numAttributes() - 1);
Evaluation eval = new Evaluation(dataset);
eval.evaluateModel(c, dataset);
System.out.println(eval.toSummaryString("\nResults\n======\n", false));
我收到错误:
Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 84
at weka.filters.unsupervised.attribute.ReplaceMissingValues.convertInstance(ReplaceMissingValues.java:274)
at weka.filters.unsupervised.attribute.ReplaceMissingValues.input(ReplaceMissingValues.java:140
)
at weka.classifiers.functions.SMO.distributionForInstance(SMO.java:1368)
at weka.classifiers.Classifier.classifyInstance(Classifier.java:84)
at
weka.classifiers.Evaluation.evaluateModelOnceAndRecordPrediction(Evaluation.java:1448)
at weka.classifiers.Evaluation.evaluateModel(Evaluation.java:1407)
at LBP.LBPDemo.main(LBPDemo.java:466)
EDIT2:我的问题是我必须在最后一个属性中添加类标签,所以我正在尝试添加:
atts.addElement(new weka.core.Attribute(" class {1, 2, 3, 4, 5, 6, 7}" , numAtts-1));
这是我的问题的索引。但是,这不是向数据集添加索引的正确方法。当我在最后一个属性中打印数据集时,我得到:
@attribute ' class {1, 2, 3, 4, 5, 6, 7}' numeric
我想删除撇号和数字以便正确阅读。
【问题讨论】:
-
如果您可以指定测试集和 crossValidateModel(可能还有分类器)的签名,那将非常有帮助。
-
在我的情况下不需要交叉验证模型,因为我只使用一个样本。我的分类器 c 属于 weka 类分类器。
-
"线程 "main" java.lang.ClassCastException 中的异常:javax.management.Attribute 不能转换为 weka.core.Attribute" - 导入错误。
-
小代码更改:不确定是什么问题; EDIT2:我认为 Attribute 构造函数不解析其内容,所以我不希望它按您的预期工作,这只是列的名称,而不是列的内容。