【发布时间】:2017-12-23 12:59:28
【问题描述】:
我面临一个问题:我无法使用 spark-submit 从 Spark 访问 Hive 表,而使用 pyspark shell 可以。这是一段代码:
from pyspark.sql import SparkSession, HiveContext
spark = SparkSession \
.builder \
.appName("Python Spark SQL Hive integration example") \
.enableHiveSupport() \
.getOrCreate()
spark.sql("SHOW TABLES").show()
这是 pyspark (shell) 的结果:
+--------+-------------+-----------+
|database| tableName|isTemporary|
+--------+-------------+-----------+
| default| table1| false|
| default| table2| false|
+--------+-------------+-----------+
这是 spark-submit 的结果:
+--------+---------+-----------+
|database|tableName|isTemporary|
+--------+---------+-----------+
+--------+---------+-----------+
我尝试将 spark conf 目录添加到类路径中,使用 hive-site.xml 添加“--files”,我也尝试使用 Hivecontext,并得到了相同的结果。我尝试使用 scala:结果相同。
编辑:我没有连接到远程 Hive 服务器,而是在同一个服务器上
【问题讨论】:
标签: python apache-spark hive pyspark