【发布时间】:2019-06-03 16:43:16
【问题描述】:
我尝试使用数据块中的 scala 合并 Datalake 中的两个文件,并使用以下代码将其保存回 Datalake:
val df =sqlContext.read.format("com.databricks.spark.csv").option("header", "true").option("inferSchema", "true").load("adl://xxxxxxxx/Test/CSV")
df.coalesce(1).write.
format("com.databricks.spark.csv").
mode("overwrite").
option("header", "true").
save("adl://xxxxxxxx/Test/CSV/final_data.csv")
但是文件 final_data.csv 被保存为一个目录而不是一个包含多个文件的文件,并且实际的 .csv 文件被保存为“part-00000-tid-dddddddddd-xxxxxxxxxx.csv”。
如何重命名此文件以便将其移动到另一个目录?
【问题讨论】:
标签: scala azure-data-lake azure-databricks