【发布时间】:2019-12-29 10:17:18
【问题描述】:
我想使用数据块将 Azure Blob 存储文件读入 Spark。但我不想为每一层嵌套设置一个特定的文件或*。
标准:**/*/ 不起作用。
这些工作正常:
val df = spark.read.format("avro").load("dbfs:/mnt/foo/my_file/0/2019/08/24/07/54/10.avro")
val df = spark.read.format("avro").load("dbfs:/mnt/foo/my_file/*/*/*/*/*/*")
失败:
java.io.FileNotFoundException: No Avro files found. If files don't have .avro extension, set ignoreExtension to true
为
val df = spark.read.format("avro").load("dbfs:/foo/my_file/test/**/*")
【问题讨论】:
标签: apache-spark azure-blob-storage databricks azure-databricks