【问题标题】:Spark 1.6 load specific partition in dataframe keeping partition fieldSpark 1.6 在数据帧保持分区字段中加载特定分区
【发布时间】:2017-03-16 19:28:11
【问题描述】:

我们有一个像这样分区的 avro:

table
--a=01
--a=02

我们希望从保留分区列 a 的单个分区加载数据。 我找到了this stackoverflow question,并应用了建议的 sn-p:

DataFrame df = hiveContext.read().format(format).
option("basePath", "path/to/table/").
load("path/to/table/a=01")

但当我尝试读取字段 a 时,它会显示:

org.apache.spark.sql.AnalysisException: cannot resolve 'a' given input columns: [b, c, d]

在 Spark Java API 1.6 中是否可行?

【问题讨论】:

    标签: java apache-spark spark-dataframe spark-avro


    【解决方案1】:

    简单地说,答案是……不,这是不可能的。

    【讨论】:

      猜你喜欢
      • 2016-04-12
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-02-21
      • 2016-11-07
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多