【问题标题】:Apache Spark Read Json Stream Returns Null OnlyApache Spark 读取 Json 流仅返回 Null
【发布时间】:2020-07-13 01:36:01
【问题描述】:

您好,我是 spark & scala 的新手。我已经开始编写应用程序,它将读取 json 文件并在控制台中打印 strema。但它总是将值打印为 Null。

这是我尝试过的程序。

val spark: SparkSession = SparkSession.builder()
      .master("local[3]")
      .appName("Demo")
      .getOrCreate()

    val userSchema = new StructType()
      .add("name", "string")
      .add("age", "integer")


    val df = spark.readStream
      .schema(userSchema)
      .json("/home/sajith/Desktop/temp_data/demo/cpy/")

    df.printSchema()

    df.writeStream
      .format("console")
      .start()
      .awaitTermination()

这是示例 Json 文件

{
 "name":"Sajith", 
 "age": 55
}

当我将 json 文件放入目录时,它给出了这个结果。

【问题讨论】:

    标签: json scala apache-spark inputstream


    【解决方案1】:

    原因是 json 数据需要单行。

    {"name":"Sajith","age":55}
    
    猜你喜欢
    • 2013-04-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-12-18
    • 1970-01-01
    • 2016-11-27
    • 2017-03-28
    • 2017-03-05
    相关资源
    最近更新 更多