【发布时间】:2018-06-13 16:37:07
【问题描述】:
我在 Scala 中使用 Kmeans Spark 函数,我需要将获得的集群中心保存到 CSV 中。这个 val 的类型是:Array[DenseVector]。
val clusters = KMeans.train(parsedData, numClusters, numIterations)
val centers = clusters.clusterCenters
我试图将centers 转换为 RDD 文件,然后从 RDD 转换为 DF,但我遇到了很多问题(例如 import spark.implicits._ / SQLContext.implicits._ 不起作用,我无法使用.toDF)。我想知道是否有另一种方法可以使 CSV 更容易。
有什么建议吗?
【问题讨论】:
标签: scala csv cluster-computing k-means apache-spark-mllib