【发布时间】:2018-07-09 10:48:09
【问题描述】:
我正在使用 Apache Spark 中的 csv 文件。我创建了RDD,我想获得每个月单独的RDD,所以我按日期过滤,表示为201601、201602等...
case class Item(date: String, id: String, classification: String, description: String, algoIndex: String, stratumIndex: String, itemIndex: String, allGmIndex: String, gmRaIndex: String, coicopWeight: String, itemWeight: String, cpihCoicopWeight: String)
val quarter1 = sc.textFile ("examples/Q1.csv")
val q1 = quarter1 map {i => {
val x = i.split(",")
Item(x(0), x(1), x(2), x(3), x(4), x(5), x(6), x(7), x(8), x(9), x(10), x(11))
}
}
val Jan = q1.filter {x=> x(0) == "201601"}
val Feb = q1.filter {x=> x(0) == "201602"}
val Mar = q1.filter {x=> x(0) == "201603"}
最后三行导致错误“Item does not take parameters”,与以下位有关:
{x=> x(0) == ..}
我该如何解决这个问题?我在课堂上做错了什么? 非常感谢您! :)
【问题讨论】:
标签: scala apache-spark filter parameters rdd