【发布时间】:2015-06-09 13:59:09
【问题描述】:
我必须在 Scala 中编写一个程序,使用 spark 计算一个单词在文本中出现的次数,但使用 RDD,我的变量计数总是在末尾显示 0。你能帮我吗? 这是我的代码
import scala.io.Source
import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf
object wordcount {
def main(args: Array[String]) {
// set spark context
val conf = new SparkConf().setAppName("wordcount").setMaster("local[*]")
val sc = new SparkContext(conf)
val distFile = sc.textFile("bible.txt")
print("Enter word to loook for in the HOLY BILE: ")
val word = Console.readLine
var count = 0;
println("You entered " + word)
for (bib <- distFile.flatMap(_.split(" "))) {
if (word==bib) {
count += 1
}
}
println(word + " occours " + count + " times in the HOLY BIBLE!")
}
}
【问题讨论】:
标签: scala apache-spark