【发布时间】:2021-08-26 10:18:37
【问题描述】:
我是 PySpark 的新手,我正在尝试运行以下代码,用假名替换 name 列。
# !pip install Faker
from faker import Faker
from functools import partial
def synthetic_column(string, faker_function):
return faker_function()
partial_func = partial(synthetic_column, faker_function = Faker().first_name)
spark_df = spark_df.withColumn('name',partial_func(col('name')))
display(spark_df)
收益AssertionError: col should be Column
我在整数类型列上运行相同的代码,但我没有得到这个AssertionError,
为什么会这样?我已经尝试过here 提到的解决方案,但它们没有帮助。
请指教。
【问题讨论】:
标签: python apache-spark pyspark apache-spark-sql