【发布时间】:2019-12-14 15:19:37
【问题描述】:
当 Spark 将日期帧数据写入 parquet 文件时,Spark 将创建一个目录,其中包含多个单独的 parquet 文件。保存代码:
term_freq_df.write
.mode("overwrite")
.option("header", "true")
.parquet("dir/to/save/to")
我需要用 pandas 从这个目录中读取数据:
term_freq_df = pd.read_parquet("dir/to/save/to")
错误:
IsADirectoryError: [Errno 21] Is a directory:
如何通过两个代码示例使用相同文件路径的简单方法解决此问题?
【问题讨论】:
-
你用的是什么版本的熊猫?你能显示完整的错误回溯吗?
标签: python pandas apache-spark parquet