【发布时间】:2017-09-14 22:22:44
【问题描述】:
我正在使用 Spark ML 运行 Kmeans。我有一堆数据和三个现有中心,例如三个中心是:[1.0,1.0,1.0],[5.0,5.0,5.0],[9.0,9.0,9.0].
那么我怎样才能表明 Kmeans 中心是上述三个向量。
我看到 Kmean 对象有种子参数,但种子参数是长类型而不是数组。那么如何告诉 Spark Kmeans 只使用现有的中心进行聚类。
或者说,我不明白Spark Kmeans中的种子是什么意思,我想种子应该是一个向量数组,在运行聚类之前代表指定的中心。
【问题讨论】:
标签: apache-spark machine-learning cluster-analysis k-means apache-spark-mllib