【发布时间】:2020-08-13 13:28:15
【问题描述】:
我有一个带有 Array 列 (StringType) 的 Spark DataFrame
示例数据帧:
df = spark.createDataFrame([
[None],
[[]],
[['foo']]
]).toDF("a")
电流输出:
+-----+
| a|
+-----+
| null|
| []|
|[foo]|
+-----+
所需的输出:
+-----+
| a|
+-----+
| []|
| []|
|[foo]|
+-----+
我需要将 Null 值转换为空数组以与另一个数组列连接。
已经试过了,但是不行
df.withColumn("a",F.coalesce(F.col("a"),F.from_json(F.lit("[]"), T.ArrayType(T.StringType()))))
【问题讨论】:
-
好问题!