【发布时间】:2017-10-10 09:15:09
【问题描述】:
我们喜欢在 Hive 外部表之上创建数据框,并使用 hive 架构和数据进行 spark 级别的计算。
我们能否从 hive 外部表中获取架构并将其用作 Dataframe 架构。
【问题讨论】:
-
我不完全确定,但我认为你拥有什么样的 Hive 表对 Spark 没有任何影响。至于架构,您能否提供有关您在 Hive 表中使用的数据格式的更多详细信息?
-
我们有没有标头的 csv 数据文件,目前在这些文件上创建了外部文件,所以我们喜欢使用 hive 外部表模式来创建数据帧。
-
您考虑过接受答案吗?
-
你有没有想过接受答案?
标签: hadoop apache-spark dataframe hive apache-spark-sql