【发布时间】:2019-02-21 18:00:57
【问题描述】:
我有 spark 2.4.0 和一个数据框
scala> dfExport.show(5)
+--------------+----+---+
|predictedLabel| AAB|AAC|
+--------------+----+---+
| 2|30.0| 1|
| 3|31.1| 2|
| 2|56.0| 1|
| 2|12.0| 3|
| 3|18.0| 2|
+--------------+----+---+
only showing top 5 rows
我尝试使用以下代码将其导出到 csv 文件。
scala>dfExport.write.format("com.databricks.spark.csv").option("header","true").save("E://...//Output.csv")
scala>dfExport.write.csv("E://...//Output.csv")
它只在路径下创建了一个名为“Output.csv”的文件夹,并出现以下错误。我错过了什么吗?
ERROR Executor:91 - Exception in task 0.0 in stage 42.0 (TID 45)
java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.createFileWithMode0(Ljava/lang/String;JJJI)Ljava/io/FileDescriptor;
【问题讨论】:
-
我从 hadoop-home 目录中删除了 hadoop.dll 并重新启动了 spark-shell。它没有帮助
-
使用 Linux。 Windows 用于其他用途。
-
你是说如果我使用Linux就不会出现这个问题?
标签: scala apache-spark export-to-csv