【发布时间】:2015-02-05 17:11:07
【问题描述】:
同样的问题也适用于将一个 RDD 拆分成几个新的 RDD。
一个 DStream 或 RDD 包含几个不同的案例类,我需要根据案例类类型将它们变成单独的 RDD。
我知道
val newRDD = rdd.filter { a => a.getClass.getSimpleName == "CaseClass1" }
或
val newRDD = rdd.filter {
a => a match {
case _: CC1 => true
case _ => false
}
}
但这需要对原始 RDD 进行多次运行,每个案例类类型运行一次。
- 上面的匹配过滤器一定有更简洁的方法吗?
- 有没有办法通过一个并行通道将一个 rdd 按元素类型拆分为多个?
【问题讨论】:
标签: apache-spark spark-streaming