【发布时间】:2017-06-09 00:08:21
【问题描述】:
我有一个输入 rdd (JavaRDD<List<String>>),我想将其转换为 JavaRDD<String> 作为输出。
输入 RDD 列表的每个元素都应该成为输出 rdd 中的一个单独元素。
如何在java中实现?
JavaRDD<List<String>> input; //suppose rdd length is 2
input.saveAsTextFile(...)
输出:
[a,b]
[c,d]
我想要什么:
a
b
c
d
【问题讨论】:
-
不,flatmap 不起作用,因为它将再次包含元素列表,并且当我存储它时,它不会将每个元素存储在单独的行中。我的输入 RDD 同样是平面图的输出。
-
你不应该这么粗鲁,我是来帮忙的。顺便说一句,如果这是您的想法,我没有拒绝您。然而,这就是你想要的,但在可爱的
Scala中。 A published notebook -
我是 spark 新手,如果我的评论听起来粗鲁,我深表歉意。
-
我想在rdd之上调用parallelize函数。该怎么做?
-
RDD 已经并行化了!!!
标签: java apache-spark