【发布时间】:2016-04-08 10:55:54
【问题描述】:
我正在努力完成以下工作:
For iterator i from 0 to n
Create data frames using i as one of the filter criteria in the select statement of sparksql
Create Rdd from dataframe
Perform multiple operations on rdd
如何确保 for 循环正常工作?我正在尝试在集群上运行 Scala 代码。
【问题讨论】:
-
你能添加一些代码吗?从您的伪代码中不清楚
rdd的性质。它是在循环中创建的多个rdds 的串联。还是别的什么? -
也许我会问你为什么这样做? a 也适用于一段代码?还有 n 代表什么?
标签: scala apache-spark