【发布时间】:2021-10-29 14:57:53
【问题描述】:
我有以下 spark 数据框。
Name age subject parts
xxxx 21 Maths,Physics I
yyyy 22 English,French I,II
我正在尝试在主题和以下部分中分解上述数据框。
预期输出:
Name age subject parts
xxxx 21 Maths I
xxxx 21 Physics I
yyyy 22 English I
yyyy 22 English II
yyyy 22 French I
yyyy 22 French II
我尝试对主题和部分使用 array.zip,然后尝试使用 temp 列进行分解,但我在只有一个部分的地方得到了空值。
有没有办法在 Pyspark 中实现这一点。
【问题讨论】: