【发布时间】:2021-03-09 12:24:53
【问题描述】:
我正在尝试从 map-reduce 作业中获取值,即来自 hinein 的 11。
(mutuelle,1)
(hinein.,11)
(Pfennig,1)
我可以打印出所有的值,但如何只找到特定的值?
val counts = books.flatMap(line => line.split(" "))
val MappedRDD = counts.map(word => (word, 1))
val myReducedRDD = MappedRDD.reduceByKey(_ + _)
//myReducedRDD.collect().foreach(println)
val rdd2 = myReducedRDD.map(f => (f))
rdd2.foreach(println)
【问题讨论】:
-
您可能应该使用
reduceByKeyLocally来生成可以查询的本地 ScalaMap。 -
我该如何查询?
-
使用
Map提供的任何操作,如map("key")或map.get("key")或map.getOrElse("key", default = 0)检查scaladoc - 帮自己一个忙,至少学习一下基础Scala 在使用像 Spark 这样大而复杂的东西之前。
标签: scala apache-spark mapreduce rdd