【发布时间】:2018-08-31 18:51:31
【问题描述】:
我已经能够像这样在单个 XML 文件上创建表
CREATE TABLE mytab
USING com.databricks.spark.xml
OPTIONS (
path "/mnt/srcdir/myxmlfile.xml",
rowTag "xmltag")
但我在一个目录中有多个 XML 文件,我想将它们全部加载到单个表“mytab”中。我尝试了以下并失败了
CREATE TABLE mytab
USING com.databricks.spark.xml
OPTIONS (
path "/mnt/srcdir/",
rowTag "xmltag")
下面是异常堆栈跟踪的sn-p
SQL 语句错误:SparkException:作业因阶段失败而中止:阶段 0.0 中的任务 9 失败 4 次,最近一次失败:阶段 0.0 中丢失任务 9.3(TID 17、10.139.64.4、执行程序 0):java. io.FileNotFoundException: / 是目录而不是文件。
在 shaded.databricks.org.apache.hadoop.fs.azure.NativeAzureFileSystem.open(NativeAzureFileSystem.java:2511)...
请帮忙
【问题讨论】:
标签: sql azure apache-spark databricks