【发布时间】:2017-12-04 15:12:29
【问题描述】:
我正在使用AvroKeyInputFormat 来读取 avro 文件:
val records = sc.newAPIHadoopFile[AvroKey[T], NullWritable, AvroKeyInputFormat[T]](path)
.map(_._1.datum())
因为我需要在工作中反思架构,所以我得到了这样的 Avro 架构:
val schema = records.first.getSchema
很遗憾,如果 path 中的 avro 文件为空(它们包含 writer 架构,但没有记录),则会失败。
即使没有记录,是否有一种简单的方法可以仅使用 Spark 加载 avro 架构?
【问题讨论】:
标签: apache-spark avro spark-avro