【发布时间】:2016-09-24 11:39:40
【问题描述】:
我想创建一个对象而不是 println。
文本文件会像
“长野,苹果”
“长野,梨”
“德克萨斯州,葡萄柚”
“里约,番石榴”
“里约,番石榴”
结果像
“(长野,苹果,1)”
“(长野,梨,1)”
“(德克萨斯州,葡萄柚,1)”
“(里约,番石榴,2)”
def main(args: Array[String]) = {
val conf = new SparkConf()
.setAppName("WordCount")
.setMaster("local")
val sc = new SparkContext(conf)
// read text info
val textfile = sc.textFile("C:\\fruitbox.csv")
twitter.filter(_.nonEmpty)
val map = twitter.map { word => (word, 1) }
.reduceByKey(_ + _)
.foreach(println) // ← want to do something about this row
}
但我想让 println 结果变成这样
.foreach(
fruitbox.setCity(_.split(",")[0])
fruitbox.setApple(_.split(",")[1])
...
)
这似乎是简单的语法知识 但我想不通。
【问题讨论】:
标签: scala apache-spark foreach