【发布时间】:2016-12-01 21:11:03
【问题描述】:
我现在正在参加 EdX 的 Spark 简介课程。 是否有可能在我的计算机上保存来自 Databricks 的数据帧。
我在问这个问题,因为本课程提供的 Databricks 笔记本在课程结束后可能无法使用。
在 notebook 中使用命令导入数据:
log_file_path = 'dbfs:/' + os.path.join('databricks-datasets', 'cs100'、'lab2'、'data-001'、'apache.access.log.PROJECT')
我找到了这个解决方案,但它不起作用:
df.select('year','model').write.format('com.databricks.spark.csv').save('newcars.csv')
【问题讨论】:
标签: apache-spark pyspark databricks