【问题标题】:How to print out the predicted class after cross-validation in WEKA如何在 WEKA 中打印出交叉验证后的预测类
【发布时间】:2011-11-10 23:54:56
【问题描述】:

使用分类器完成 10 倍交叉验证后,如何打印出每个实例的预测类以及这些实例的分布?

J48 j48 = new J48();
Evaluation eval = new Evaluation(newData);
eval.crossValidateModel(j48, newData, 10, new Random(1));

当我尝试类似下面的操作时,它说分类器没有构建

for (int i=0; i<data.numInstances(); i++){
   System.out.println(j48.distributionForInstance(newData.instance(i)));
 }

我正在尝试做的是与 WEKA GUI 中相同的功能,其中一旦训练了分类器,我可以点击 Visualize classifier error" &gt; Save,我会在文件中找到预测的类。但现在我需要它来使用我自己的 Java 代码。


我尝试过类似以下的方法:

J48 j48 = new J48();
Evaluation eval = new Evaluation(newData);
StringBuffer forPredictionsPrinting = new StringBuffer();
weka.core.Range attsToOutput = null;
Boolean outputDistribution = new Boolean(true);
eval.crossValidateModel(j48, newData, 10, new Random(1), forPredictionsPrinting, attsToOutput, outputDistribution);

但它提示我错误:

Exception in thread "main" java.lang.ClassCastException: java.lang.StringBuffer cannot be cast to weka.classifiers.evaluation.output.prediction.AbstractOutput

【问题讨论】:

    标签: java validation machine-learning weka decision-tree


    【解决方案1】:

    crossValidateModel() 方法可以采用 forPredictionsPrinting varargs 参数,该参数是 weka.classifiers.evaluation.output.prediction.AbstractOutput 实例。

    其中重要的部分是StringBuffer,用于保存所有预测的字符串表示。以下代码在未经测试的JRuby 中,但您应该能够根据需要对其进行转换。

    j48 = j48.new
    eval = Evalution.new(newData)
    predictions = java.lange.StringBuffer.new
    eval.crossValidateModel(j48, newData, 10, Random.new(1), predictions, Range.new('1'), true)
    # variable predictions now hold a string of all the individual predictions
    

    【讨论】:

    • 但是在 weka.sourceforge.net/doc 我没有看到任何 crossValidateModel 选项作为您的描述,您介意指出正确的文档或我可以看到此类信息的地方吗?欣赏!!
    • weka.sourceforge.net/doc.dev/weka/classifiers/…。 SO 似乎没有正确解析片段标识符,因此向下滚动到第一个 crossValidateModel 方法签名。
    • 请查看我对这个问题的编辑。我尝试了一些你的建议......但它提示我错误,不确定我做错了什么。请帮忙!!谢谢!!
    • 我并没有真正将 weka 与 Java 一起使用,仅在 JRuby 中使用上述代码。尝试创建一个 PlainText 对象,该对象扩展 AbstractOutput(例如称为输出)实例并调用 output.setBuffer(forPredictionsPrinting) 并将其传入而不是缓冲区。
    • 它有效!!!!非常感谢!!但是对于 PlainText 实例或 StringBuffer 实例,有没有办法获得第 i 个实例的结果?我还注意到返回的预测包括“inst# 实际预测误差预测”,但 GUI 包含“inst#, actual, predicted, error, probability distribution”(包括所有类的分布)。我可以知道为什么它们不同吗?我怎样才能得到像 GUI 一样的呢?
    【解决方案2】:

    几天前我被困住了。我想使用矩阵而不是从 arff 文件加载来评估 matlab 中的 Weka 分类器。我使用http://www.mathworks.com/matlabcentral/fileexchange/21204-matlab-weka-interface 和以下源代码。我希望这对其他人有帮助。

    import weka.classifiers.*;
    
    import java.util.*
    
    wekaClassifier = javaObject('weka.classifiers.trees.J48');
    
    wekaClassifier.buildClassifier(processed);%Loaded from loadARFF
    
    e = javaObject('weka.classifiers.Evaluation',processed);%Loaded from loadARFF
    myrand = Random(1);
    plainText = javaObject('weka.classifiers.evaluation.output.prediction.PlainText');
    buffer = javaObject('java.lang.StringBuffer');
    plainText.setBuffer(buffer)
    bool = javaObject('java.lang.Boolean',true);
    range = javaObject('weka.core.Range','1');
    array = javaArray('java.lang.Object',3);
    array(1) = plainText;
    array(2) = range;
    array(3) = bool;
    e.crossValidateModel(wekaClassifier,testing,10,myrand,array)
    e.toClassDetailsString
    

    Asdrúbal López-Chau

    【讨论】:

      【解决方案3】:
      clc
      clear
      %Load from disk
      fileDataset = 'cm1.arff';
      myPath = 'C:\Users\Asdrubal\Google Drive\Respaldo\DoctoradoALCPC\Doctorado ALC PC\AlcMobile\AvTh\MyPapers\Papers2014\UnderOverSampling\data\Skewed\datasetsKeel\';
      javaaddpath('C:\Users\Asdrubal\Google Drive\Respaldo\DoctoradoALCPC\Doctorado ALC PC\AlcMobile\JarsForExperiments\weka.jar');
      wekaOBJ = loadARFF([myPath fileDataset]);
      %Transform from data into Matlab
      [data, featureNames, targetNDX, stringVals, relationName] = ... 
      weka2matlab(wekaOBJ,'[]');
      %Create testing and training sets in matlab format (this can be improved)
      [tam, dim] = size(data);
      idx = randperm(tam);
      testIdx = idx(1 : tam*0.3);
      trainIdx = idx(tam*0.3 + 1:end);
      trainSet = data(trainIdx,:);
      testSet = data(testIdx,:);
      %Trasnform the training and the testing sets into the Weka format
      testingWeka = matlab2weka('testing', featureNames, testSet);
      trainingWeka = matlab2weka('training', featureNames, trainSet);
      %Now evaluate classifier
      import weka.classifiers.*;
      import java.util.*
      wekaClassifier = javaObject('weka.classifiers.trees.J48');
      wekaClassifier.buildClassifier(trainingWeka);
      e = javaObject('weka.classifiers.Evaluation',trainingWeka);
      myrand = Random(1);
      plainText = javaObject('weka.classifiers.evaluation.output.prediction.PlainText');
      buffer = javaObject('java.lang.StringBuffer');
      plainText.setBuffer(buffer)
      bool = javaObject('java.lang.Boolean',true);
      range = javaObject('weka.core.Range','1');
      array = javaArray('java.lang.Object',3);
      array(1) = plainText;
      array(2) = range;
      array(3) = bool;
      e.crossValidateModel(wekaClassifier,testingWeka,10,myrand,array)%U
      e.toClassDetailsString
      

      【讨论】:

        猜你喜欢
        • 2023-03-10
        • 2013-10-10
        • 1970-01-01
        • 1970-01-01
        • 2015-03-23
        • 2023-04-05
        • 2013-08-16
        • 2019-07-27
        • 2018-07-04
        相关资源
        最近更新 更多