【发布时间】:2021-07-01 13:09:40
【问题描述】:
这可能是一个愚蠢的问题,但我刚刚开始学习 spark,现在我面临着我的第一个问题,我无法通过书籍和谷歌解决......
我正在使用 Zeppelin 并尝试使用服务器日志进行一些分析。
我的 df 看起来像:
现在我想使用以下代码将其保存为 CSV:
df_reduced.write.format("csv").mode("overwrite").save("/home/hduser/tmp")
我总是得到一个新的 _SUCCESS 文件,但没有 CSV:
我做错了什么?
提前致谢。
【问题讨论】:
-
你的 spark 是否使用 yarn/hdfs 运行?
-
是的。但我想在本地保存这个文件。
标签: apache-spark pyspark apache-spark-sql apache-zeppelin