【发布时间】:2019-08-02 22:40:53
【问题描述】:
我有一个包含 3 列的 spark dataFrame,我想根据第三个主题合并两个主题,这是一个示例:
+---+---+---+
|AAA|bbb|ccc|
+---+---+---+
|AAA|BBB| E|
|AAA|BBB| R|
|AAA|BBB| E|
|AAA|BBB| R|
|AAA|BBB| R|
|AAA|BBB| E|
+-----------+
我想在 CCC 列的值为 E 时使用 AAA 列的值,当 CCC 为 R 时使用 BBB 这是输出:
+---+---+
|NEW|ccc|
+---+---+
|AAA| E|
|BBB| R|
|AAA| E|
|BBB| R|
|BBB| R|
|AAA| E|
+-------+
【问题讨论】:
标签: apache-spark apache-spark-sql