【问题标题】:How to add a row record in empty Dataframe in Spark如何在 Spark 的空 Dataframe 中添加行记录
【发布时间】:2021-03-12 19:39:57
【问题描述】:

我正在尝试在 Spark scala 中创建一个空的 dataFrame,并希望创建自己的架构并将记录加载到其中。

下面是例子

val emptyDf = spark.emptyDataFrame

val loadEmptyDf = emptyDf.withColumn("col1", lit("yes"), "col2", lit("no"))

但我无法获得我在创建架构时放置的默认值

电流输出:

|col1|col2|
|    |    |

预期输出:

|col1|col2|
|yes | no |

【问题讨论】:

    标签: scala dataframe apache-spark apache-spark-sql


    【解决方案1】:

    withColumn 添加一列,lit 为所有行添加默认值,但您的 DataFrame 为空..

    val data = Seq(Row("yes", "no"))
    
    val schema: StructType = new StructType()
      .add("col1", StringType)
      .add("col2", StringType)
    
    val df = spark.createDataFrame(spark.sparkContext.parallelize(data), schema)
    
    df.show()
    
    +----+----+
    |col1|col2|
    +----+----+
    | yes|  no|
    +----+----+
    

    【讨论】:

      猜你喜欢
      • 2021-06-11
      • 2016-01-07
      • 2015-12-23
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多