【发布时间】:2019-02-01 10:46:36
【问题描述】:
我已成功将简单的 JSON 转换为 CSV。
当文件包含 JSON 对象数组时,我面临问题。
我使用csv 模块而不是pandas 进行转换。
请参考以下内容,哪些内容处理成功,哪些处理失败:
成功(当文件包含单个json对象列表/数组时):
[{"value":0.97,"key_1":"value1","key_2":"value2","key_3":"value3","key_11":"2019-01-01T00:05:00Z"}]
失败:
[{"value":0.97,"key_1":"value1","key_2":"value2","key_3":"value3","key_11":"2019-01-01T00:05:00Z"}]
[{"value":0.97,"key_1":"value1","key_2":"value2","key_3":"value3","key_11":"2019-01-01T00:05:00Z"}]
[{"value":0.97,"key_1":"value1","key_2":"value2","key_3":"value3","key_11":"2019-01-01T00:05:00Z"}]
json.loads 函数抛出异常如下:
Extra data ; line 1 column 6789 (char 1234)
如何处理这些文件?
编辑: 该文件使用 Kinesis Firehorse 刷新并推送到 S3。 我正在使用 lambda 下载文件并加载和转换。 所以它不是 .json 文件。
【问题讨论】: