【发布时间】:2016-05-26 08:57:37
【问题描述】:
我有这个 JSON 文件
{
"a": 1,
"b": 2
}
通过Python json.dump 方法获得。 现在,我想使用 pyspark 将此文件读入 Spark 中的 DataFrame。按照文档,我正在这样做
sc = SparkContext()
sqlc = SQLContext(sc)
df = sqlc.read.json('my_file.json')
打印 df.show()
虽然打印语句吐出了这个:
+---------------+
|_corrupt_record|
+---------------+
| {|
| "a": 1, |
| "b": 2|
| }|
+---------------+
任何人都知道发生了什么以及为什么它没有正确解释文件?
【问题讨论】:
标签: python json dataframe pyspark