【发布时间】:2022-01-24 11:50:19
【问题描述】:
我有一个小的 PySpark DataFrame df:
index col1
0 1
1 3
2 4
还有一本字典:
LOOKUP = {0: 2, 1: 5, 2: 5, 3: 4, 4: 6}
我现在想在df 中添加一个额外的列col2,等于col1 的LOOKUP 值。
我的输出应该是这样的:
index col1 col2
0 1 5
1 3 4
2 4 6
我尝试使用:
df = df.withColumn(col("col2"), LOOKUP[col("col1")])
但这给了我错误,以及使用expr。
如何在 PySpark 中实现这一点?
【问题讨论】:
标签: python dataframe apache-spark pyspark apache-spark-sql