【发布时间】:2018-03-30 16:31:32
【问题描述】:
在一些 Spark 代码中,我看到程序员使用这样的代码来创建 SparkContext
SparkSession session = SparkSession
.builder()
.appName("Spark Hive Example")
.config("spark.sql.warehouse.dir", warehouseLocation)
.enableHiveSupport()
.getOrCreate();
但我一直使用这种代码来创建 JavaSparkContext。
SparkConf sparkConf = new SparkConf().setAppName("Simple App").setMaster("local");
JavaSparkContext spark = new JavaSparkContext(sparkConf);
从代码的后半部分,有什么方法可以让我获得 Hive 上下文来对 Hive 表执行操作?
谢谢!
【问题讨论】:
-
同样使用 SparkSession,我不能使用 parallelize() 方法。有什么选择吗?我似乎不明白何时使用 SparkSession 和 JavaSparkContext。 Apache Spark 的 Java 编程指南根据需要使用两者。 spark.apache.org/docs/latest/rdd-programming-guide.html
标签: hadoop apache-spark hive hivecontext