【发布时间】:2019-08-30 22:20:51
【问题描述】:
是否可以在写入之前更改 spark 保存其临时文件的_temporary 目录?
特别是,由于我正在编写表的单个分区,因此我希望临时文件夹位于分区文件夹中。
有可能吗?
【问题讨论】:
-
你找到方法了吗?
-
不行,好像没办法
-
最后,我不得不重写 FileOutputCommitter 以使其工作。
-
@ArkadiyVerman 你能详细说明你是怎么做到的吗?
标签: apache-spark hadoop pyspark partitioning