【发布时间】:2019-10-14 15:12:23
【问题描述】:
我的 Blob 存储中有一个 CSV 文件。我想下载文件。奇怪的是,我实际上看不到文件。文件 CSV 由 Python 作业创建并转换为 Scala 数据帧。
当我运行这两行代码时:
# convert python df to spark df and export the spark df
spark_df = spark.createDataFrame(df)
## Write Frame out as Table
spark_df.write.csv("dbfs:/rawdata/corp/AAA.csv")
我得到这个错误:
org.apache.spark.sql.AnalysisException: path dbfs:/rawdata/corp/AAA.csv already exists.;
奇怪的是,我在使用 Azure 存储资源管理器时看不到该文件。显然该文件存在,即使我看不到它。如何下载此 CSV 文件?如果这里有人可以提出更好的选择,我想最好使用 Databricks,或者可能是其他东西。
谢谢。
【问题讨论】:
标签: azure azure-blob-storage databricks