【发布时间】:2018-09-08 22:47:47
【问题描述】:
我正在尝试使用weka优化随机森林参数,java类如下:
package pkg10foldcrossvalidation;
import weka.core.*;
import weka.classifiers.meta.*;
import weka.classifiers.trees.RandomForest;
import java.io.*;
public class RF_Optimizer {
public static void main(String[] args) throws Exception {
// load data
BufferedReader reader = new BufferedReader(new FileReader("C:\\Prediction Results on the testing set\\Dataset.arff"));
Instances data = new Instances(reader);
reader.close();
data.setClassIndex(data.numAttributes() - 1);
// setup classifier
CVParameterSelection ps = new CVParameterSelection();
ps.setClassifier(new RandomForest());
ps.setNumFolds(10); // using 10-fold CV
ps.addCVParameter("C 0.1 0.5 5");
// build and output best options
ps.buildClassifier(data);
System.out.println(Utils.joinOptions(ps.getBestClassifierOptions()));
}
}
但是我很难理解哪些参数应该替换“C”以及如何确定每个参数的范围?多个参数同时使用.addCVParameter多次是否可行?
我试图搜索一些解释如何在 java 中更改随机森林参数的 youtube 或网站教程,但没有找到。
谢谢
【问题讨论】:
标签: java machine-learning parameters weka random-forest