【发布时间】:2017-03-05 01:00:43
【问题描述】:
我通过使用 java + weka lib 使用开源代码开始对我的数据进行聚类 它在数据集 .arff 的格式时正确运行,但我想使用 movielens 的数据集(使用他们的人口统计信息对用户进行聚类) 文件名为“u.user” 您可以在此处找到文件说明 http://files.grouplens.org/datasets/movielens/ml-100k-README.txt
这是我的代码
import weka.clusterers.SimpleKMeans;
import weka.core.Instances;
import weka.core.converters.ConverterUtils.DataSource;
import java.io.IOException;
public class Clustering {
public static void main(String args[]) throws Exception{
//load dataset
String dataset = "C:/Users/DELL/Desktop/work/u.user";
DataSource source = new DataSource(dataset);
//get instances object
Instances data = source.getDataSet();
// new instance of clusterer
SimpleKMeans model = new SimpleKMeans();//Simple EM (expectation maximisation)
//number of clusters
model.setNumClusters(4);
//set distance function
//model.setDistanceFunction(new weka.core.ManhattanDistance());
// build the clusterer
model.buildClusterer(data);
System.out.println(model);
}
}
运行后显示此错误
Exception in thread "main" java.io.IOException: File not found : C:\Users\DELL\Desktop\work\u.names
weka.core.converters.C45Loader.setSource(C45Loader.java:190)
weka.core.converters.AbstractFileLoader.setFile(AbstractFileLoader.java:90)
weka.core.converters.ConverterUtils$DataSource.reset(ConverterUtils.java:306)
weka.core.converters.ConverterUtils$DataSource.<init>(ConverterUtils.java:141)
Clustering.main(Clustering.java:24)
sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
java.lang.reflect.Method.invoke(Method.java:498)
com.intellij.rt.execution.application.AppMain.main(AppMain.java:147)
at weka.core.converters.C45Loader.setSource(C45Loader.java:190)
at weka.core.converters.AbstractFileLoader.setFile(AbstractFileLoader.java:90)
at weka.core.converters.ConverterUtils$DataSource.reset(ConverterUtils.java:306)
at weka.core.converters.ConverterUtils$DataSource.<init>(ConverterUtils.java:141)
at Clustering.main(Clustering.java:24)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:498)
at com.intellij.rt.execution.application.AppMain.main(AppMain.java:147)
Process finished with exit code 1
我确定它是因为文件的扩展,因为当我使用带有extension.arff 的其他文件时它可以工作 你能帮我如何对我的数据进行聚类吗
【问题讨论】: