【发布时间】:2018-02-02 22:57:48
【问题描述】:
我是 Spark 的新手。我尝试使用 scala 实现以下用例。
-DataFrame 1
| col A | col B |
-----------------
| 1 | a |
| 2 | a |
| 3 | a |
-DataFrame 2
| col A | col B |
-----------------
| 1 | b |
| 3 | b |
-DataFrame 3
| col A | col B |
-----------------
| 2 | c |
| 3 | c |
最终输出帧应该是
| col A | col B |
-----------------
| 1 | a,b |
| 2 | a,c |
| 3 | a,b,c |
帧数不限于 3,它可以是小于 100 的任何数字。所以我正在使用每个我正在打印的每个数据帧。
有人可以帮我如何创建最终的数据框,在其中我可以用 N 个数据框以上述格式输出。
感谢您的帮助。
【问题讨论】:
标签: scala apache-spark spark-dataframe