【发布时间】:2018-12-20 22:47:57
【问题描述】:
我们可以通过将hive-site.xml 放在spark 的“conf”方向从hive 读取或写入表。但是现在我有两个可以相互连接的集群。假设集群上的hive 1 和hive 2 在另一个集群上
现在我需要从 hive 1 读取数据并进行一些转换然后写入 hive 2,问题是我只能将一个 hive-site.xml 文件放入 spark conf,意味着当我执行时
someDataFrame.write.saveAsTable("dbName.tableName")
,它会保存到hive 1而不是hive 2,因为spark只识别一个hive(hive 1)
我的问题是我可以使用 spark 读写不同集群上的不同配置单元吗?
【问题讨论】:
标签: apache-spark hadoop hive