【问题标题】:How can I nullify spark dataframe column [duplicate]如何使火花数据框列无效[重复]
【发布时间】:2020-05-24 01:46:37
【问题描述】:

我正在使用 Scala 编程语言。我想取消整列数据框。

如果这不可能,那么我至少想放一个空字符串

以上两种方法的有效方法是什么?

注意:我不想添加新列,但我想对现有列进行操作

谢谢

【问题讨论】:

标签: scala dataframe apache-spark hadoop


【解决方案1】:

您可以直接使用.withColumn与相同的列名和spark replaces列。

import org.apache.spark.sql.functions._
val df=Seq(("1","a"),("2","b")).toDF("id","name")
df.show()
//+---+----+
//|id |name|
//+---+----+
//|1  |a   |
//+---+----+

val df1=df.withColumn("id",lit(null)) //to keep null value for id column
df1.show()
//+----+----+
//|id  |name|
//+----+----+
//|null|a   |
//+----+----+

val df2=df.withColumn("id",lit("")) //to keep empty string "" value for id column
df2.show()

//+---+----+
//|id |name|
//+---+----+
//|   |a   |
//+---+----+

【讨论】:

    猜你喜欢
    • 2019-01-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-03-19
    • 2019-07-13
    • 2020-04-21
    • 1970-01-01
    • 2019-08-16
    相关资源
    最近更新 更多