【发布时间】:2015-10-07 20:23:23
【问题描述】:
无论是开发人员还是 API 文档都没有包含任何关于可以在 DataFrame.saveAsTable 或 DataFrameWriter.options 中传递哪些选项的参考,它们会影响 Hive 表的保存。
我希望在这个问题的答案中,我们可以汇总信息,这些信息对希望更多控制 Spark 保存表的方式的 Spark 开发人员有所帮助,或许还可以为改进 Spark 的文档提供基础。
【问题讨论】:
-
不过,这对于 SO 来说有点模糊和开放。你在找什么?只是如何保存到蜂巢?
-
@JustinPihony 我知道有人会误读标题。我对其进行了更新以使其更加明确。谢谢你的评论。需要明确的是,问题不在于如何保存 Hive 表。这是关于在保存 Hive 表时可以传递的未记录选项。
-
DataFrameWriter 可用的所有选项,我们可以传递给选项,例如格式、模式、partitionBy 等。顺便说一句,您正在寻找哪个选项?
标签: scala hadoop apache-spark hive parquet