【发布时间】:2015-12-30 19:19:29
【问题描述】:
我是 Spark 的新手。我正在尝试阅读代码并了解 K-means in Spark Streaming 的工作原理。我不知道如何获得算法在同一数据组中执行的迭代次数。我找不到包含此信息的 Java 文件。
你能帮帮我吗?
谢谢
解决方案:在这个文件 /spark-1.5.0/mllib/src/main/scala/org/apache/spark/mllib/clustering/KMeans.scala 中有一个while 语句在run 方法中,它使用一个名为iteration 的变量,Spark 将它写入每次运行的日志中。
【问题讨论】:
标签: java apache-spark k-means