【问题标题】:DistanceMeasure type of data in Java Mahout libraryJava Mahout 库中的 DistanceMeasure 数据类型
【发布时间】:2012-10-26 06:09:33
【问题描述】:

我已经编写了一个代码来对 Java 中的一组数据进行聚类。我正在使用 Apache Mahout 来构建集群。这是我的一段代码:

        Configuration conf = new Configuration();
        Path input = new Path("C:\\DATA\\input.txt");
        Path clusters = new Path("C:\\DATA\\clusters.txt");
        Path output = new Path("C:\\DATA\\output.txt");
        org.apache.mahout.common.distance.DistanceMeasure measure;
        String delta = new InterruptedException().toString();
        org.apache.mahout.clustering.kmeans.KMeansDriver myK = new KMeansDriver();
        myK.buildClusters(conf, input, clusters, output, measure, 100, delta, true);

但在创建“测量”参数时出现错误:“变量测量可能尚未初始化”。

这里是函数 buildClusters 的文档:https://builds.apache.org/job/Mahout-Quality/javadoc/org/apache/mahout/clustering/kmeans/KMeansDriver.html

那么,如何定义“度量”的真正价值呢?

【问题讨论】:

    标签: apache distance mahout k-means units-of-measurement


    【解决方案1】:

    DistanceMeasure (link) 只是一个接口。您需要使用接口的实现之一,例如CosineDistanceMeasureEuclideanDistanceMeasure

    顺便问一下,我想知道为什么你的 delta 是这样定义的:String delta = new InterruptedException().toString();

    delta定义为收敛delta值,内部解析为double。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2011-11-30
      • 1970-01-01
      • 1970-01-01
      • 2012-10-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多