【发布时间】:2022-01-02 00:15:16
【问题描述】:
我有一个Map[String, Dataframe]。我想将该 Map 中的所有数据合并到一个 Dataframe 中。数据框可以有 Map 数据类型的列吗?
def sample(dfs : Map[String,Dataframe]): Dataframe =
{
.........
}
例子:
DF1
id name age
1 aaa 23
2 bbb 34
DF2
game time score
ludo 10 20
rummy 30 40
我将上述两个 DF 作为 Map 传递给函数。 然后将每个数据帧的数据以json格式放入输出数据帧的单列中。
外向型
+---------------------------------------------------------------------------------------+
| column1 |
+---------------------------------------------------------------------------------------+
| [{"id":"1","name":"aaa","age":"23"},{"id":21","name":"bbb","age":"24"}] |
| [{"game":"ludo","time":"10","score":"20"},{"game":"rummy","time":"30","score":"40"}] |
+---------------------------------------------------------------------------------------+
【问题讨论】:
-
你能提供你想要的例子吗? \n 数据帧支持结构和数组类型而不是映射
-
我想将多个数据帧的数据放到一个数据帧中。如果它不支持映射,那么我如何获取每个输入数据帧的值作为结构列输出数据帧
-
数据帧应该如何组合?能举个例子吗?
-
我已经用一个例子编辑了这个问题,请检查
标签: dataframe scala apache-spark dictionary