【发布时间】:2020-03-13 18:57:18
【问题描述】:
我的 Json 文件如下所示
val json=
"""{
"a":1,
"b":2
"c":3
}"""
val data = spark.read.json(Seq(json).toDS())
val data2=data.toDF()
data2.show(false)
当我运行此代码时,我得到一个名为“_corrupt_record”的表。我知道这是因为我在 json 字符串的第二行中缺少一个“,”。
但是有什么方法可以识别实际错误。我想要一个像
这样的打印语句",在您的 jsn 文件中的 "b":2 附近丢失了"
【问题讨论】:
-
您可以接受使用第 3 方 JSON 解析器吗?
-
不@Andriy..这是不可接受的。但是你可以给出解决方案。我可以试一试
标签: json scala dataframe apache-spark