【发布时间】:2020-09-21 17:19:44
【问题描述】:
我不确定问题本身的正确性。我为 SQL 找到的解决方案不适用于 Hive SQL 或禁止递归。 因此,我想在 Pyspark 中解决这个问题,并且需要一个解决方案,或者至少是想法,如何解决这个问题。
我有一个如下所示的原始表格:
+--------+----------+
|customer|nr_tickets|
+--------+----------+
| A| 3|
| B| 1|
| C| 2|
+--------+----------+
这就是我想要的表格:
+--------+
|customer|
+--------+
| A|
| A|
| A|
| B|
| C|
| C|
+--------+
你有什么建议吗?
非常感谢您!
【问题讨论】:
标签: python apache-spark pyspark pivot unpivot