【发布时间】:2017-06-29 18:17:20
【问题描述】:
如何使用 where 子句更新 Pyspark 数据框中的列?
这类似于这个 SQL 操作:
UPDATE table1 SET alpha1= x WHERE alpha2< 6;
其中 alpha1 和 alpha2 是 table1 的列。
例如: 我有一个数据框 table1,其值如下:
表格1 阿尔法1阿尔法2 3 7 4 5 5 4 6 8 更新后的数据框Table1: 阿尔法1阿尔法2 3 7 × 5 × 4 6 8如何在 pyspark 数据框中执行此操作?
【问题讨论】:
标签: apache-spark dataframe pyspark pyspark-sql