【发布时间】:2021-01-11 16:57:51
【问题描述】:
我想为 pysaprk DF 中的每一行创建 3 行。我想添加一个名为 loopVar=(val1,val2,val3) 的新列。必须在每个循环中添加三个不同的值作为值。知道我该怎么做吗?
原文:
a b c
1 2 3
1 2 3
Condition 1: loop = 1 and b is not null then loopvar =va1
Condition 2: loop = 2 and b is not null then loopvar =va2
Condition 3: loop = 3 and c is not null then loopvar =va3
输出:
a b c loopvar
1 2 3 val1
1 2 3 vall
1 2 3 val2
1 2 3 val2
1 2 3 val3
1 2 3 val3
【问题讨论】:
-
您要创建行还是添加列,还是两者兼而有之?请提供输入和预期输出。
-
已经说明了现有的和需要的输出状态。
标签: apache-spark pyspark