【发布时间】:2020-07-31 14:47:07
【问题描述】:
如何使用 withColumn 向我的 UDF 传递一个额外的参数
df = spark.createDataFrame([
["aaa","1"],
["bbb","2"],
["ccc","5"]
]).toDF("text","id")
def title(x,y):
if y:
x = x.title()
return x
title_udf = udf(lambda x: title(x,y), StringType())
spark.udf.register('title_udf', title_udf)
df = df.withColumn('text_title',title_udf('text',True)
当我尝试这个时,我得到一个错误:Invalid argument, not a string or column....
【问题讨论】:
标签: pyspark user-defined-functions