【发布时间】:2016-12-19 07:29:36
【问题描述】:
我正在尝试使用 df.write.csv 将数据附加到我的 csv 文件中。这是我在关注 spark 文档 http://spark.apache.org/docs/2.0.1/api/python/pyspark.sql.html#pyspark.sql.DataFrameWriter 后所做的:
from pyspark.sql import DataFrameWriter
.....
df1 = sqlContext.createDataFrame(query1)
df1.write.csv("/opt/Output/sqlcsvA.csv", append) #also tried 'mode=append'
执行上面的代码给我错误:
NameError: name 'append' not defined
没有附加,错误:
路径已经存在。
【问题讨论】:
-
有sqlcsvA.csv调用的文件吗?
-
是的,输出被复制到
sqlcsvA.csv文件。 -
你能从代码中删除并重新创建这个文件吗?
-
您是否要求在代码中添加删除选项,然后每次程序运行时都应创建一个新文件?
标签: apache-spark pyspark