【发布时间】:2021-05-31 04:52:18
【问题描述】:
我有一个数据框,其数据如下。
+---------------+-------+
|category |marks |
+---------------+-------+
|cricket |1.0 |
|tennis |1.0 |
|football |2.0 |
+---------------+-------+
我想将上述数据帧写入一个 csv 文件,其中文件名将使用当前时间戳创建。
generatedDataFrame.write.mode ("append")
.format("com.databricks.spark.csv").option("delimiter", ";").save("./src/main/resources-"+LocalDateTime.now()+".csv")
但是这段代码不能正常工作。出现以下错误
java.io.IOException: Mkdirs failed to create file
有没有更好的方法来使用 scala 和 spark 实现这一点?此外,即使我尝试使用时间戳代码创建文件,也会创建一个带有时间戳的目录,并在该目录内创建一个带有随机名称的数据的 csv。我怎样才能获得这些 csv 文件的时间戳文件名而不是创建目录?
【问题讨论】:
标签: scala dataframe csv apache-spark