【问题标题】:Convert column to lowercase with PySpark使用 PySpark 将列转换为小写
【发布时间】:2020-02-25 17:08:55
【问题描述】:

我想将“频道”列中的所有值转换为小写。我有 df 在 jupyter notebook 中使用 PySpark 创建的。我尝试了here 的代码,但出现错误。所以它不是重复的。

我的数据如下所示:

id     Channel     Brand
123    Hair        Fashion
124    Nails       Fashion 

我希望它是以下内容:

id     Channel     Brand
123    hair        Fashion
124    nails       Fashion 

我尝试了以下方法:

new_df = df.select(lower(df.Channel)).alias('Channel')

这会将值转换为小写,但我丢失了其他列。

【问题讨论】:

    标签: apache-spark pyspark lowercase


    【解决方案1】:

    你可以这样做:

    new_df = df.withColumn('Channel', lower(df.Channel))
    

    这也将保留其他列。

    【讨论】:

      猜你喜欢
      • 2018-04-21
      • 2022-11-03
      • 1970-01-01
      • 2011-07-21
      • 2022-01-03
      • 2020-12-07
      • 1970-01-01
      • 1970-01-01
      • 2014-11-07
      相关资源
      最近更新 更多