【发布时间】:2016-03-26 18:08:49
【问题描述】:
我正在使用以下代码将 spark DataFrame 保存到 JSON 文件
unzipJSON.write.mode("append").json("/home/eranw/Workspace/JSON/output/unCompressedJson.json")
输出结果为:
part-r-00000-704b5725-15ea-4705-b347-285a4b0e7fd8
.part-r-00000-704b5725-15ea-4705-b347-285a4b0e7fd8.crc
part-r-00001-704b5725-15ea-4705-b347-285a4b0e7fd8
.part-r-00001-704b5725-15ea-4705-b347-285a4b0e7fd8.crc
_SUCCESS
._SUCCESS.crc
- 如何生成单个 JSON 文件而不是每行一个文件?
- 如何避免 *crc 文件?
- 如何避免 SUCCESS 文件?
【问题讨论】:
标签: json apache-spark spark-dataframe