【问题标题】:Is there a way to set a name to a csv file in sparklyr using spark_write_csv?有没有办法使用 spark_write_csv 在 sparklyr 中为 csv 文件设置名称?
【发布时间】:2018-09-14 02:31:36
【问题描述】:

我需要将数据框写入单个csv文件,发现可以使用sdf_coalesce()将文件变成单个分区。我想知道是否有什么方法可以更改spark_write_csv()生成的csv文件的名称?

提前致谢。

【问题讨论】:

  • 你能不能像 readr::write_csv 那样在 path 参数中这样做?
  • 由于spark处理分布式计算,它倾向于生成与数据的每个分区对应的分区文件,合并意味着将所有数据分组到一个分区,这样你就可以耗尽内存。

标签: r sparklyr


【解决方案1】:

没有。文件名是自动生成的,在不同的任务中是唯一的,它是不可配置的。如果您想要特定名称,您可以使用特定于正在使用的文件系统/存储解决方案的实用程序重命名输出。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2020-11-29
    • 2020-01-04
    • 1970-01-01
    • 2021-06-16
    • 1970-01-01
    • 1970-01-01
    • 2010-11-09
    相关资源
    最近更新 更多