【发布时间】:2021-12-24 21:48:46
【问题描述】:
我有如下数据。
| A | B | C | D |
|---|---|---|---|
| 1 | A | Day | D1 |
| 1 | A | Tim | 1am |
| 1 | A | Tim | 3am |
需要这样创作
| A | B | Day | Tim1 | Tim2 |
|---|---|---|---|---|
| 1 | A | D1 | 1am | 3am |
你能帮助如何进入 spark scala
【问题讨论】:
-
这是一个基本的
pivot用例:df.groupBy("A", "B").pivot("C").agg(first("D")) -
是的,pivot 在这里有效,但如果我同时有不同的值,我必须将它们分成两个
-
然后先检查重复项。
标签: scala apache-spark-sql azure-synapse