【发布时间】:2021-03-18 06:55:14
【问题描述】:
我正在运行 spark 2.4.0 的本地实例
我想对 Hive 执行 SQL 查询
在使用 Spark 1.x.x. 之前,我为此使用 HiveContext:
import org.apache.spark.sql.hive.HiveContext
val hc = new org.apache.spark.sql.hive.HiveContext(sc)
val hivequery = hc.sql(“show databases”)
但现在我看到 HiveContext 已被弃用:https://spark.apache.org/docs/2.4.0/api/java/org/apache/spark/sql/hive/HiveContext.html。在 HiveContext.sql() 代码中,我看到它现在只是 SparkSession.sql() 的包装器。建议在 SparkSession 构建器中使用 enableHiveSupport,但正如this 问题所澄清的那样,这只是关于元存储和表列表,这不会改变执行引擎。
所以问题是:
- 如何了解我的查询是在 Hive 引擎还是 Spark 引擎上运行?
- 我该如何控制?
【问题讨论】:
标签: apache-spark hive