前一阵子写过一个arff的随笔,但是写完后发现有些啰嗦。其实如果使用weka自带的api,生成arff文件将变成一件很简单的事儿。

首先,可以先把特征文件生成csv格式的。csv格式就是每列数据都用逗号分隔的一种格式。(还有不清楚的googling一下就知道了)

一、首先看下特征文件怎么保存成csv格式。

1、首行为特征名,以逗号分隔。

2、除首行外的行都为数据行,每列数据都是首行对应的值。(可以是字符串,数字)

例:weka数据挖掘拾遗(三)----再谈如果何生成arff

二、通过weka的api把上面的csv转化成arff格式文件

  1、weka代码

 1     public static void genArffFile(String input , String output){
 2         try{
 3             File file = new File(input);
 4             CSVLoader csvLoader = new CSVLoader();
 5             csvLoader.setSource(file);
 6             Instances data = csvLoader.getDataSet();
 7             savaInstances(data, output);
 8         }catch(Exception e){
 9             e.printStackTrace();
10         }
11     }
View Code

相关文章: