【发布时间】:2020-03-08 18:57:43
【问题描述】:
我在 python 中使用了 spark,所以我需要保存包含 spark 结果的 parquet 文件
df
.coalesce(1)
.write
.save(save_path, format='parquet', mode='append'))
这是收集数据并以 parquet 格式代码保存到 HDFS
所以我很好奇,如果我运行 spark 大约 30 个镶木地板文件 火花结果将只保存一个拼花文件或不保存
如果有人知道校长请教我 这段代码对于只保存一个镶木地板文件是否正确。
谢谢
【问题讨论】:
标签: python-3.x apache-spark hdfs parquet