【发布时间】:2018-02-02 13:23:52
【问题描述】:
我在一个文件夹中有很多 JSON 文件。它们都具有相同的结构。现在我要创建DataFrame,每个JSON文件都应该是这个DataFrame所在的行。
我知道如何基于单个 JSON 字符串创建 DataFrame,但我不知道如何处理多个:
import spark.implicits._
val jsonStr = """{ "key": 111, "value": 54, stamp: "aaa"}"""
val df = spark.read.json(Seq(jsonStr).toDS)
【问题讨论】:
标签: json scala apache-spark spark-dataframe