有没有办法使用 spark_write_csv 在 sparklyr 中为 csv 文件设置名称？

【问题标题】：Is there a way to set a name to a csv file in sparklyr using spark_write_csv?有没有办法使用 spark_write_csv 在 sparklyr 中为 csv 文件设置名称？
【发布时间】：2018-09-14 02:31:36
【问题描述】：

我需要将数据框写入单个csv文件，发现可以使用sdf_coalesce()将文件变成单个分区。我想知道是否有什么方法可以更改spark_write_csv()生成的csv文件的名称？

提前致谢。

【问题讨论】：

你能不能像 readr::write_csv 那样在 path 参数中这样做？
由于spark处理分布式计算，它倾向于生成与数据的每个分区对应的分区文件，合并意味着将所有数据分组到一个分区，这样你就可以耗尽内存。

标签： r sparklyr

【解决方案1】：

没有。文件名是自动生成的，在不同的任务中是唯一的，它是不可配置的。如果您想要特定名称，您可以使用特定于正在使用的文件系统/存储解决方案的实用程序重命名输出。

【讨论】：

猜你喜欢

1970-01-01
1970-01-01
2020-11-29
2020-01-04
1970-01-01
2021-06-16
1970-01-01
1970-01-01
2010-11-09

相关资源

下载 2021-06-05
下载 2023-02-25
下载 2022-12-17

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode